问题 需要用于Linux的文本到语音和语音识别工具


我正计划编写一个使用文本到语音和语音识别的Linux程序。有什么最好的工具/库?我应该使用Windows代替能够使用更好的工具吗?这些工具需要可以从控制台或C程序轻松调用。


10248
2018-05-18 12:33


起源



答案:


对于语音识别,有各种各样的 狮身人面像。不同的变体有不同的优点和缺点,这里有一个比较 Sphinx版本的比较。我相信Sphinx 4是Java,但其他是C语言。


6
2018-05-18 13:53





这在很大程度上取决于你试图识别的是什么语音。

这是2005年的一篇文章,解释了创建听写程序的一些困难: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html 。如果你想要的话,那就是 朱利叶斯 语音识别引擎似乎很有前景,但您需要添加自己的声学和语言模型。你也许可以使用 voxforge 声学模型。

如果你不想写一个听写程序那么你就有了一个更容易的任务。指令程序的词汇量有限,例如“如果你想继续使用英语,请说”英语“。

使用pocketsphinx和gstreamer可以获得相当不错的效果 一个程序 自动编辑大多数单词“推特“走出困境 TWIT 播客。在我根据播客的成绩单使用我自己的语言模型之前,它根本不起作用;来自语音识别器的机器转录是无用的/搞笑的,但是他们可以找到关键字。


5
2018-05-18 14:01



你有任何使用pocketphinx和gstreamer与tcpserversrc /客户端的经验吗? - si28719e
不,但gstpocketsphinx + tcpserversrc / sink不应与任何其他gstreamer元素+ tcpserversrc / sink有任何不同。 - joeforker
您的“twitterkiller”程序的链接似乎已被破坏。 - Steven Oxley
@ steven-oxley修复了链接 - joeforker


答案:


对于语音识别,有各种各样的 狮身人面像。不同的变体有不同的优点和缺点,这里有一个比较 Sphinx版本的比较。我相信Sphinx 4是Java,但其他是C语言。


6
2018-05-18 13:53





这在很大程度上取决于你试图识别的是什么语音。

这是2005年的一篇文章,解释了创建听写程序的一些困难: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html 。如果你想要的话,那就是 朱利叶斯 语音识别引擎似乎很有前景,但您需要添加自己的声学和语言模型。你也许可以使用 voxforge 声学模型。

如果你不想写一个听写程序那么你就有了一个更容易的任务。指令程序的词汇量有限,例如“如果你想继续使用英语,请说”英语“。

使用pocketsphinx和gstreamer可以获得相当不错的效果 一个程序 自动编辑大多数单词“推特“走出困境 TWIT 播客。在我根据播客的成绩单使用我自己的语言模型之前,它根本不起作用;来自语音识别器的机器转录是无用的/搞笑的,但是他们可以找到关键字。


5
2018-05-18 14:01



你有任何使用pocketphinx和gstreamer与tcpserversrc /客户端的经验吗? - si28719e
不,但gstpocketsphinx + tcpserversrc / sink不应与任何其他gstreamer元素+ tcpserversrc / sink有任何不同。 - joeforker
您的“twitterkiller”程序的链接似乎已被破坏。 - Steven Oxley
@ steven-oxley修复了链接 - joeforker


对于语音识别,Linux的存在很少。我只知道一个显然不错的选择,IBM几年前发布的东西,但后来不再可用(任何人都知道这个ViaVoice SDK是否仍然可以从任何地方获取?)。有关于可能的选项的更多信息 维基百科


4
2018-05-18 13:46



ViaVoice SDK。它从未完全发布,并且文档要求2.4内核版本号的范围相当窄。当我的手腕间歇性静脉炎时,我玩弄了一些打字负荷,但没有运气...... - dmckee


我用过这两个 Loquendo 和  在linux下。我会考虑我用过非常糟糕的节日声音,非常机器人合成。另一方面,Loquendo的声音非常好 - 质量非常高。


4
2018-05-18 13:15



如果您要使用Festival,则应安装备用音色。说明(对于debian / ubuntu)在这里: ubuntuforums.org/showthread.php?t=677277 - Matt G
您对Loquendo的体验如何?如果您愿意,我想通过电子邮件向您询问几个问题吗? - philfreo


对于Debian / Ubuntu文本到语音,还有SVOX Pico:

sudo apt-get install libttspico-utils

0
2017-08-13 13:24





我知道 espeak的 是一个非常好的Linux文本到语音程序(它甚至可以做不同的口音!),但我不知道任何为UNIX设计的语音识别系统。


-1
2018-05-18 12:35





at&t fsm工具包也很棒 - 虽然不允许商业用途,

http://www.research.att.com/~fsmtools/fsm/


-1
2017-08-26 14:55





这有点旧,但我在几天前看到了关于Hackaday语音识别的相当全面的指南: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/


-1
2017-07-11 22:24





http://simon-listens.org/ - 西蒙开源语音/语音识别程序


-1
2018-01-04 13:34





然后有mbrola用于文本到语音。


-1
2018-01-04 13:40





您是否检查过基于HMM的语音合成文本到语音转换。您可以在网站上找到免费的演示 http://hts.sp.nitech.ac.jp/。安装会有点繁琐。


-1
2018-03-31 12:22