gpt4 book ai didi

c# - 在语音识别方面需要建议吗?

转载 作者:太空宇宙 更新时间:2023-11-03 16:44:07 24 4
gpt4 key购买 nike

我开发了一个应用程序,它使用 SAPI 5.1 将语音转换为文本。

由于准确性太差,我决定创建自己的语法,我创建了自己的语法,它只识别从一到十的数字。

我又一次在准确性上失败了。所以我深入研究了语法文件。我浏览了用于发音的 Lexion 文件。所以我的问题是

  1. 词典文件会改进准确性?这样我就可以使用数字一到十的发音在 Lexicon 文件中,然后使用它。

  2. 我需要一个关于如何操作的模板 创建词典文件。

最佳答案

如果您的语音识别准确率较差,可能是以下原因之一:

  1. 没有足够的训练数据 - 请注意,创建依赖于说话人的语音识别系统(仅与一个说话人相关联)需要每个单词的大量单元(在您的情况下为 1 到 10 个)。需要单独的单元来训练初始模型,然后可能需要嵌入训练数据来进一步改进模型。

  2. 独立于说话人的语音识别模型将需要更多数据。

  3. 测试数据和训练数据不匹配。如果模型是使用无噪声数据或带有重音的数据创建的,则在使用具有大量噪声或具有不同重音的数据进行测试时可能很难获得良好的结果。

但是关于您尝试构建的语音识别系统的更多详细信息会更好。

更新 1:由于您在评论中提到您正在使用 Microsoft Speech SDK,因此这里有一个指南 training the speech SDK on sounds/accents .只需按照说明进行操作,您就可以上路了。

关于c# - 在语音识别方面需要建议吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6567722/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com