- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 android 中“语音识别”领域的新手。
我的应用要求具备“语音识别”功能。所以我正在做作业。我找到1. android SDK 支持这个并且它使用了“谷歌语音识别”因此,据我了解天气我们通过 Intent 调用识别器或者我们使用类 SpeechRecogniser ,实际识别是在谷歌云服务器上完成的。我尝试使用这两种方法的示例应用程序,两种情况下的匹配率都非常低\(首先,我的发现是否正确?我尝试的大多数单词/句子都没有正确匹配)。
这两种方法(即按 Intent 启动/或使用 SpeechRecogniser 类)的输出是否有任何差异)
是否所有应用程序都依赖于这种谷歌技术,其中语音作为声音字节发送并在云服务器上识别。我看到 Shazam 使用不同的技术,但他们有自己的数据库。是否使用了其他此类技术
我看到很多“siri for android”。关于这些应用程序实际如何工作的任何说明?
非常感谢您的时间和帮助。
最佳答案
1) 使用 RecognizerIntent
或 SpeechRecognizer
时,您将获得相同的结果。主要区别在于用户交互。 RecognizerIntent
强制用户执行标准语音识别过程。使用 SpeechRecognizer
,您可以控制应用程序收集语音的方式以及处理语音的时间。 RecognizerIntent
的优点是编程容易,用户熟悉。使用 SpeechRecognizer
,您可以实现高级功能,例如在后台收听语音。您还可以获得更好的错误报告。
此外,有些词像“apple”一样容易被识别器理解,但由于各种原因,有些词像“cumin”很难理解。您必须巧妙地匹配 google 返回的内容才能实现可靠的功能。
2) 我不确定你所说的他们自己的数据库是什么意思。您的应用程序将有一个您尝试将其与用户所说内容相匹配的各种“数据库”
3) 可能混合了自然语言处理、用户建模和模拟人类对话的技术。或者它们只是一大堆手工编码的规则,让它们看起来很聪明。我想要让事情变得可信需要做很多工作。
在这里查看我的一些示例代码: https://github.com/gmilette/Say-the-Magic-Word-
关于机器人 : speech recognition what are the technologies available,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10223490/
我经常在命名空间和该命名空间中的类之间发生命名冲突,并且想知道处理这个问题的最佳实践,除了添加随机前缀之外,首先使用这些名称似乎是有意义的。 拥有一个 Models.Technology 命名空间似乎
我必须承担一个项目,制作一个视频聊天应用程序。 该视频必须从一个位置进行流式传输,并且可供全局各地的多人观看。性能确实是一个问题,超过 2-3 秒的延迟是 Not Acceptable 。 据我所知,
我的大部分工作都是在 .NET MVC、DNN、SQL 等 Microsoft 技术方面完成的。我无法继续使用 Microsoft 技术,因为它们不是开源的。我想知道前端和后端开源技术的最佳组合,可用
我是 android 中“语音识别”领域的新手。 我的应用要求具备“语音识别”功能。所以我正在做作业。我找到1. android SDK 支持这个并且它使用了“谷歌语音识别”因此,据我了解天气我们通过
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我们使用 Basecamp 进行项目管理,他们的新界面非常快。 这引起了我的兴趣:查看它的速度并根据一些界面线索我得出结论,它一定是基于 Ajax 的。然后我用 Chrome 检查了网站,我的怀疑得到
我有一个关于 .net 框架的理论问题。 在我看来,Microsoft 为我们提供了针对不同层的大量技术。 我们有 ADO.NET 和更改进的数据访问 Entity Framework 。 以及用于
我在安装 HAXM 时遇到问题。它坚持给我“VT 未打开错误”,即使我已经执行了以下所有步骤 - 在 BIOS 上启用了 VT Avast -> 设置 -> 故障排除 -> “启用硬件辅助虚拟化”
我已经建立了一个使用 PHP/MySQL 构建的公司内联网网站,并允许用户发表评论。加入这个网站后,我逐渐喜欢上了“评论”功能,并希望添加相同的功能,让用户可以直接对其他用户的评论进行“评论”。 目前
我有一个直截了当的(我希望如此)问题,我一整天都在努力解决这个问题。我正在尝试使用 Concert 技术在 C++ 中命名一个 2D 决策变量。我的模型是一个现实生活中的分配问题——所以我需要用实际的
其实我有几个问题,希望能得到客观的回答。 在 .NET 中可以使用哪些标准但未过时的数据库访问技术?我知道以下内容: ADO.NET 使用 DbDataReader 使用数据集、数据表等 在 ASP
我们希望在我们的 Web 应用程序(ASP.NET、C#)中提供打印功能,以便在客户端机器上打印标签。 目前我们正在使用“Dymo Label Printers”,它们提供了一个很好的 JavaScr
This is my controller $scope.subjects = ["Computer Security", "Graphics and Multimedia", "Networks"
我在一个类中定义一个约束,然后我调用该类。现在我想定义创建的约束的范围。如何设置约束的上限。下面我只给出了相关部分的代码。 import ilog.concert.IloConstraint; imp
我目前正在寻找 http Push Technology 的可用实现.至少它必须支持 channel 订阅和 channel 发布。 有哪些方便的 C++(或 C)实现可用? 最佳答案 唯一想到的(在
我们正在创建在我们的应用程序中使用的 active-x 控件。 自从 Microsoft 停止支持经典的 Visual Basic 以来,使用 Visual Basic 开发 Active X 控件是
我见过一家公司使用这种 URL http://www.foob.ar/cgi-perl/bar.mpl .他们似乎在后端使用 Perl,但我想知道 .mpl 应该涉及哪些技术(框架、模块等)延期 ?
我正在阅读 Google 的测试博客 entry about how Google partitions its tests into small, medium, and large tests ,
最近,用于服务器端渲染的 JavaScript 框架变得流行。例如 Next.js 和 Nuxt.js。 我想知道:与已建立的纯后端技术(Python Django、Ruby on Rails、PHP
是否可以用ATG技术做一个Android应用。我在谷歌上搜索了如何将 ATG 与 android 集成,但我没有得到任何适当的指导。我也搜索了示例源文件,但谷歌没有。谁能给我推荐一个使用 Androi
我是一名优秀的程序员,十分优秀!