问题 Google Speech API和Web Speech API之间存在差异

我正在进行网络语音识别。

我发现Google为开发人员提供了一个称为“Google speech API V2”的API。但我注意到每天都有限制使用它。

之后我发现有一个原生的WEB Speech API也可以实现语音识别。它只是在谷歌铬和歌剧：

http://caniuse.com/#feat=speech-recognition

所以 1.什么是不同的Google Speech API和Web Speech API？他们有关系吗？

语音识别结果json从谷歌返回。是谷歌语音api会比网络语音api更准确吗？

谢谢。

1060

2017-09-11 06:53

起源

speechless.surge.sh 您还可以使用我开发的工具来检测浏览器是否支持本机识别 - puemos

答案:

该 Web Speech API 是W3C支持的规范，允许浏览器供应商提供他们选择的语音识别引擎（无论是本地还是基于云），支持您可以直接从浏览器使用的API，而无需担心API限制等。你可以想象，苹果可能会用Siri来支持这一点，微软可能会用Cortana来支持这一点。同样，浏览器供应商可以选择在操作系统中使用内置的听写软件，但这似乎不是目前的趋势。如果您尝试在浏览器中执行简单的语音合成（例如语音命令），这可能是最佳途径，尤其是随着采用的增长。这个API，就像任何W3C api一样

该 Google Speech API 是一种基于云的解决方案，允许您在浏览器之外使用Google的语音软件。它还提供更广泛的语言支持，并可以转录更长的音频文件。如果您要录制20分钟的录音，这将是您的选择。截至撰写本文时，Google在此服务的第一个小时后每15秒收取0.006美元。

2017-10-07 20:56

您是否熟悉使用Web Speech API在实时网络服务器上的问题？本地Web Speech API可以工作，但在部署到AWS EC2后，我收到错误 speechSynthesis: error “not allowed”。我在这里详述了我的问题： stackoverflow.com/questions/45891229/... - Growler

热门问题

不使用eval / new函数的JavaScript模板库当涉及内部类时，Java继承如何工作 .NET Windows服务的奇怪问题在.ipa或.app下查找App ID 快速入门XSLT参考[关闭] 如何找出Android应用程序中未使用的资源 Ruby中并发的同步方法[重复] 将std :: chrono :: system_clock :: time_point转换为struct timeval并返回 Google Drive API V3（javascript）更新文件内容 Bootstrap 3.0 - 将元素推到底部受密码保护的.NET ClickOnce部署？如何用postgresql安装wordpress coq Set或Type如何成为命题硒滚动元素进入（中心）视图在Spring Transaction JUnit测试中自动装配Hibernate会话的正确方法 Git的Dockerfile策略如何在FOS_PICKFOLDER中使用IFileDialog，同时仍在对话框中显示文件名在Firefox扩展中复制Google Chrome浏览器操作弹出效果 CakePHP找到MAX 芹菜 - 完成任务的召唤功能从使用fmemopen创建的流中读取宽字符 .NET是否为每个程序集创建一个字符串实习池？ DefaultModelBinder不绑定嵌套模型 Navigator.MediaDevices.getUserMedia（）使用了哪些相机通信标准？选择命名空间名称时应该知道什么？ cout Swagger Codegen CLI Java客户端 - 如何正确使用它一个很好的哈希函数用于采访整数，字符串？ Maven 3 ciManagement配置的目的是什么？如何通过语言文化获取代码页？