gpt4 book ai didi

机器人 : speech recognition what are the technologies available

转载 作者:行者123 更新时间:2023-11-29 18:11:54 36 4
gpt4 key购买 nike

我是 android 中“语音识别”领域的新手。

我的应用要求具备“语音识别”功能。所以我正在做作业。我找到1. android SDK 支持这个并且它使用了“谷歌语音识别”因此,据我了解天气我们通过 Intent 调用识别器或者我们使用类 SpeechRecogniser ,实际识别是在谷歌云服务器上完成的。我尝试使用这两种方法的示例应用程序,两种情况下的匹配率都非常低\(首先,我的发现是否正确?我尝试的大多数单词/句子都没有正确匹配)。

  1. 这两种方法(即按 Intent 启动/或使用 SpeechRecogniser 类)的输出是否有任何差异)

  2. 是否所有应用程序都依赖于这种谷歌技术,其中语音作为声音字节发送并在云服务器上识别。我看到 Shazam 使用不同的技术,但他们有自己的数据库。是否使用了其他此类技术

  3. 我看到很多“siri for android”。关于这些应用程序实际如何工作的任何说明?

非常感谢您的时间和帮助。

最佳答案

1) 使用 RecognizerIntentSpeechRecognizer 时,您将获得相同的结果。主要区别在于用户交互。 RecognizerIntent 强制用户执行标准语音识别过程。使用 SpeechRecognizer,您可以控制应用程序收集语音的方式以及处理语音的时间。 RecognizerIntent 的优点是编程容易,用户熟悉。使用 SpeechRecognizer,您可以实现高级功能,例如在后台收听语音。您还可以获得更好的错误报告。

此外,有些词像“apple”一样容易被识别器理解,但由于各种原因,有些词像“cumin”很难理解。您必须巧妙地匹配 google 返回的内容才能实现可靠的功能。

2) 我不确定你所说的他们自己的数据库是什么意思。您的应用程序将有一个您尝试将其与用户所说内容相匹配的各种“数据库”

3) 可能混合了自然语言处理、用户建模和模拟人类对话的技术。或者它们只是一大堆手工编码的规则,让它们看起来很聪明。我想要让事情变得可信需要做很多工作。

在这里查看我的一些示例代码: https://github.com/gmilette/Say-the-Magic-Word-

关于机器人 : speech recognition what are the technologies available,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10223490/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com