gpt4 book ai didi

iphone - 向 OpenEars 添加新语言

转载 作者:技术小花猫 更新时间:2023-10-29 10:17:06 24 4
gpt4 key购买 nike

我最近开始学习OpenEars语音识别,太棒了!但我还需要支持其他语言(如俄语、法语和德语)的语音识别和听写。我发现 here提供各种声学和语言模型。

但我真的无法理解 - 我需要在应用程序中集成额外的语言支持吗?

问题是 - 我应该采取什么步骤才能在 Open Ears 中成功集成,例如俄语?

据我所知 - Open Ears 演示中英语语言的所有声学和语言模型都位于文件夹 hub4wsj_sc_8k 中。可以在 voxforge language archives 中找到相同的文件.所以我只是在演示中替换了它们。有一点不同 - 在演示英语中,还有一个 sendump 2MB 的大文件,它不在 voxforge 语言文件中。Open Ears 演示中使用了另外两个文件:

  • OpenEars1.languagemodel
  • OpenEars1.dic

这些我替换为:

  • msu_ru_nsh.lm.dmp
  • msu_ru_nsh.dic

因为 .dmp 类似于 .languagemodel。但是应用程序崩溃了,没有任何错误。

我做错了什么?谢谢。

最佳答案

根据我的评论,转贴为答案:

[....] 此类问题的第 1 步是打开 OpenEarsLogging 和 verbosePocketsphinx,这将为您提供有关问题所在的非常细粒度的信息(在控制台输出中搜索错误和警告以保存时间)。可以在文档中找到有关执行此操作的说明。请随时向 OpenEars 论坛提出问题 [....]:http://politepix.com/forums/openears您可能还想查看此线程:http://politepix.com/forums/topic/other-languages

解决方法:

为了跟进后来的读者,在打开日志记录后,我们通过使用 mixture_weights 文件代替 sendump 并确保语音词典使用声学模型中存在的音素而不是英语来实现此工作- 语言音素。

可以在此处阅读我们完成此故障排除的完整讨论:http://www.politepix.com/forums/topic/using-russian-acoustic-model/


更新:自本周发布 OpenEars 1.5 以来,可以将任何声学模型的路径作为主要聆听方法的参数传递,并且有一种更加标准化的方法来打包和引用任何声学模型,因此您在同一个应用程序中可以有多个声学模型。此论坛帖子中的信息取代了我在此答案中链接到的讨论中的信息:http://www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5-and-up/由于历史原因,我留下了其余的答案,因为该讨论中的细节可能仍然有用,但可以跳过它以支持新链接。

关于iphone - 向 OpenEars 添加新语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14254266/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com