gpt4 book ai didi

iphone - 如何在iPhone中进行中文语音识别

转载 作者:行者123 更新时间:2023-12-03 18:36:08 25 4
gpt4 key购买 nike

OpenEars可以识别中文语音吗?参见这里:http://www.politepix.com/openears

最佳答案

我是 OpenEars 开发人员。 OpenEars 仅提供开箱即用的英语语音识别功能。 OpenEars 使用的 Pocketsphinx 发行版中有一个普通话声学模型,因此可能可以用它来替代说明中的英语声学模型,如果您有自己的声学模型创建兼容的语言模型和语音词典的方法,并且您准备进行一些 self 指导的研究和测试。声学模型称为 tdt_sc_8k。您可以使用它来代替说明中名为 hub4wsj_sc_8k 的文件夹,但您还需要做更多工作才能使其正常工作。

如果您想尝试这个,您需要阅读 Sphinx project documentation在 CMU 演讲现场,以便清楚地了解声学模型、语言模型和语音词典之间的关系,并弄清楚如何创建您兼容的语言模型。您可以从 this page 上的拼音词典开始。作为主词典,您可以创建较小的 iPhone 大小的语音词典以及随后的语言模型,因为它可能与声学模型兼容。该页面上的语言模型对于 OpenEars 来说太大了。为了进行测试,我可能会创建一个大约 100 个单词的命令和控制模型。您应该能够使用Sphinx Knowledge Base Tool从您已经制作了语音词典的单词语料库创建语言模型。

下一步是验证您的声学模型、语言模型和语音词典是否可以在传统的 Pocketsphinx 安装(例如 Linux 上)中正常工作。如果您获得了良好的结果,您可以访问 OpenEars 论坛,我将尝试帮助您使其在 OpenEars 中运行(无法保证,因为该声学模型从未参与过测试,但我也可以'没有想到它不起作用的特殊原因)。 OpenEars 的 LanguageModelGenerator 类肯定只适用于英语。您有责任确保声学模型的许可方式不会阻止其在 App Store 应用程序中使用(如果您计划以这种方式分发项目)。

祝你好运!

编辑:我想更新此内容是为了让您知道普通话声学模型现在是 OpenEarsExtras 的一部分。 ,并且说 LanguageModelGenerator 现已更新,以便您可以为它提供您选择的任意主语音词典(如果您有一个格式正确的词典)(即,单词后跟制表符,后跟音素,后跟一行)如果您已经有了声学模型,那么将动态语言建模器与英语以外的语言一起使用会更容易。

它应该工作的方式是,你有一个你想要的语言的查找字典,类似于默认的英语查找字典 cmu07a.dic,而 LanguageModelGenerator 处理其余的事情,所以我关于它的声明需要多个如果你有一本可以查发音的语音词典,那么步骤和研究就不一定是这样了。非常感谢您在 OpenEars forum 上获得关于这在实践中如何发挥作用的反馈。 (请不要在 Stack Overflow 上提供反馈或错误报告)。

关于iphone - 如何在iPhone中进行中文语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6894728/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com