问题 Google Speech API和Web Speech API之间存在差异


我正在进行网络语音识别。

我发现Google为开发人员提供了一个称为“Google speech API V2”的API。但我注意到每天都有限制使用它。

之后我发现有一个原生的WEB Speech API也可以实现语音识别。它只是在谷歌铬和歌剧:

http://caniuse.com/#feat=speech-recognition

所以  1.什么是不同的Google Speech API和Web Speech API?他们有关系吗?

  1. 语音识别结果json从谷歌返回。是谷歌语音api会比网络语音api更准确吗?

谢谢。


1060
2017-09-11 06:53


起源

speechless.surge.sh   您还可以使用我开发的工具来检测浏览器是否支持本机识别 - puemos


答案:


Web Speech API 是W3C支持的规范,允许浏览器供应商提供他们选择的语音识别引擎(无论是本地还是基于云),支持您可以直接从浏览器使用的API,而无需担心API限制等。你可以想象,苹果可能会用Siri来支持这一点,微软可能会用Cortana来支持这一点。同样,浏览器供应商可以选择在操作系统中使用内置的听写软件,但这似乎不是目前的趋势。如果您尝试在浏览器中执行简单的语音合成(例如语音命令),这可能是最佳途径,尤其是随着采用的增长。这个API,就像任何W3C api一样

Google Speech API 是一种基于云的解决方案,允许您在浏览器之外使用Google的语音软件。它还提供更广泛的语言支持,并可以转录更长的音频文件。如果您要录制20分钟的录音,这将是您的选择。截至撰写本文时,Google在此服务的第一个小时后每15秒收取0.006美元。


11
2017-10-07 20:56



您是否熟悉使用Web Speech API在实时网络服务器上的问题?本地Web Speech API可以工作,但在部署到AWS EC2后,我收到错误 speechSynthesis: error “not allowed”。我在这里详述了我的问题: stackoverflow.com/questions/45891229/... - Growler