gpt4 book ai didi

c# - 大名单语音识别

转载 作者:太空狗 更新时间:2023-10-29 23:30:04 26 4
gpt4 key购买 nike

我们在 C#.net 中使用一个解决方案,有人可以调用电话号码并先说出一个人的名字,然后再说出姓氏。然后在我们网站的访客登记处输入该名称。我们使用一个 XML 字典文件,其中包含我们从美国人口普查中获得的 5,000 个名字和 89,000 个姓氏。我们正在使用 Microsoft.Speech.Recognition 库(也许这就是问题所在)。

我们的问题是,即使使用像 Joshua McDaniels 这样相对简单的名字,我们的失败率也大约为 30%。性能(速度方面)很好,只是没有捕获大部分名称。

现在,我明白最终口语的质量将决定系统的性能,但我们希望在“实验室”条件下达到接近 99% 的完美发音,没有口音,然后称其为好。但即使在同一个人、同一姓名、同一电话、同一环境进行多次试验后,我们的失败率仍为 25%。

我的问题是:有没有人有更好的方法来解决这个问题?我们考虑过可能尝试使用 API,这样匹配会更相关和最新。

最佳答案

目前的技术状态是很难识别名称,而且名称列表很大。您可以从电话簿(500 个条目)中识别出高质量的姓名,但对于数以千计的姓名来说,这非常困难。语音识别引擎当然不是为此而设计的,尤其是像 System.Speech 这样的离线引擎。

使用像 https://www.projectoxford.ai 这样的在线系统,您可能会获得更好的结果。它使用先进的 DNN 声学模型和更大的词汇表。

许多大公司都围绕识别大型名单的能力而建立,例如 Novauris为此使用了专利技术。您可能会考虑使用开源引擎构建类似的东西,但无论如何这都是一项艰巨的任务。

关于c# - 大名单语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33248350/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com