- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我们在 C#.net 中使用一个解决方案,有人可以调用电话号码并先说出一个人的名字,然后再说出姓氏。然后在我们网站的访客登记处输入该名称。我们使用一个 XML 字典文件,其中包含我们从美国人口普查中获得的 5,000 个名字和 89,000 个姓氏。我们正在使用 Microsoft.Speech.Recognition 库(也许这就是问题所在)。
我们的问题是,即使使用像 Joshua McDaniels 这样相对简单的名字,我们的失败率也大约为 30%。性能(速度方面)很好,只是没有捕获大部分名称。
现在,我明白最终口语的质量将决定系统的性能,但我们希望在“实验室”条件下达到接近 99% 的完美发音,没有口音,然后称其为好。但即使在同一个人、同一姓名、同一电话、同一环境进行多次试验后,我们的失败率仍为 25%。
我的问题是:有没有人有更好的方法来解决这个问题?我们考虑过可能尝试使用 API,这样匹配会更相关和最新。
最佳答案
目前的技术状态是很难识别名称,而且名称列表很大。您可以从电话簿(500 个条目)中识别出高质量的姓名,但对于数以千计的姓名来说,这非常困难。语音识别引擎当然不是为此而设计的,尤其是像 System.Speech 这样的离线引擎。
使用像 https://www.projectoxford.ai 这样的在线系统,您可能会获得更好的结果。它使用先进的 DNN 声学模型和更大的词汇表。
许多大公司都围绕识别大型名单的能力而建立,例如 Novauris为此使用了专利技术。您可能会考虑使用开源引擎构建类似的东西,但无论如何这都是一项艰巨的任务。
关于c# - 大名单语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33248350/
我正在努力实现下一个目标: 家长: public class Animal { private List relatives; public List getRelatives() {
是否可以创建一个包含不同类型委托(delegate)的列表?例如考虑这两个委托(delegate): class MyEventArg1 : EventArgs {} class MyEventArg
我的问题几乎与 C equivalent to Fortran namelist 相同 关键区别在于我使用的是 C++/17,想知道是否有更符合 C++ 习惯的方式来解决这个问题。 最佳答案 没有相当
我正在使用具有固定线程池大小的全局执行程序服务。我们有一堆相关任务提交执行并等待 future 列表。 最近,我们遇到了 CPU 利用率高的问题,在调试时我发现对 future 列表中的一项调用 ge
我习惯了 Fortran,其中我使用名称列表顺序读入从文件中获取变量。这让我有一个看起来像这样的文件 &inputDataList n = 1000.0 ! This is the first var
为什么TimePicker在 knockout 名单之外工作得很好,但在他身上就不行了。如何在 knockout 中启动? @{ ViewBag.Title = "Index"; } Index
我正在阅读 https://www.nba.com/history/awards/mvp .我尝试按降序打印出名称和计数。 Kareem Abdul-Jabbar: 6 Bill Russell: 5
我想知道如何在 Python 中轻松地从 Fortran 名单文件读取和写入值。 最佳答案 有一个模块叫做f90nml读取/写入 Fortran 名称列表。使用此模块,您可以将名单读入嵌套的 Pyth
我是一名优秀的程序员,十分优秀!