gpt4 book ai didi

speech-recognition - 编写语音识别引擎

转载 作者:行者123 更新时间:2023-12-04 07:52:34 27 4
gpt4 key购买 nike

就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the help center寻求指导。




10年前关闭。




因此,像许多其他人一样,我决定创建自己的语音识别引擎。事实证明,这根本不是一件容易的事,相反,尤其是对于英语来说,要做到这一点相当困难,因为我想说,一个单词的书写方式和它的发音方式之间存在着巨大的差异。来自格鲁吉亚,我决定为格鲁吉亚语言编写语音识别。在格鲁吉亚语中,您可以完全按照您的书写方式发音。这就像一个转录。这个事实会大大减轻我的任务吗?或者还有更困难的......困难:D?

最佳答案

语音识别是一个复杂的领域,具有许多特定的算法、工具和方法。要创建自己的引擎,您可以从 CMUSphinx 开源语音识别工具包开始,它允许您:

  • 收集和处理支持格鲁吉亚语所需的数据
  • 创建格鲁吉亚模型
  • 用格鲁吉亚语实现语音识别引擎。
  • 使用引擎创建在桌面、服务器或 iPhone 上运行的语音识别应用程序(通过 OpenEars)

  • CMUSphinx 已经支持英语、德语、西类牙语、法语、荷兰语、俄语、普通话、冰岛语、意大利语和许多其他语言。添加一个新的非常简单。对于新人来说,通常需要一两个月的集中工作来实现所需的流程。

    要开始访问主页:

    http://cmusphinx.sourceforge.net

    并阅读教程

    http://cmusphinx.sourceforge.net/wiki/tutorial

    如果您有任何问题,请在论坛或此处向他们提问!

    而且,当您说格鲁吉亚语时,您只是拼写声音,这是一个非常普遍的误解。世界上大多数语言都不是这样。为了验证假设,请尝试在音频编辑器中录制一些音频,并检查哪些声音是实际发音的。你会感到惊讶。上面的教程详细介绍了这个问题。

    关于speech-recognition - 编写语音识别引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8202698/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com