gpt4 book ai didi

sapi - 使用 SAPI 将音频(wav 文件)转换为文本?

转载 作者:行者123 更新时间:2023-12-04 14:43:23 24 4
gpt4 key购买 nike

我的任务是将不是来自人类直接语音的音频文件转换为文本。

例如,如果我将“Hello there”存储在 wav 文件中,它将把它转录成文本并在屏幕上显示“Hello there”字符串。

首选任何语言代码,但优先考虑 C#。

最佳答案

SAPI当然可以为所欲为。从进程内识别器开始,将音频连接为文件流,设置听写模式,然后开始。

现在是令人失望的一点。你可能不会得到非常好的结果;事实上,我怀疑除非你非常幸运,否则你可能会得到完全的垃圾。

有几个问题:

  1. 只有训练 SR 引擎后,听写才能真正发挥作用。如果你很幸运(像我一样),你可以获得不错的结果,但如果说话者有口音,则必须进行培训。
  2. 训练仅适用于单个声音。如果您在单个音频文件中有多个扬声器,则效果不佳。
  3. 用于听写(和一般的语音识别)的音频模型假定您使用的是近距离麦克风(即麦克风紧挨着您的脸,以最大限度地减少噪音拾取)。如果您的 WAV 文件有额外的噪音,准确度会急剧下降。

Dragon Naturally Speaking Professional 支持转录,但仍需要训练和单一语音。 (我确实相信 DNS 具有适用于录音机的自定义音频模型。)我自己没有使用过它,所以我不知道它在您的情况下效果如何。

现在,如果您正在寻找特定关键字,其他人已经成功使用“音频挖掘”——运行识别器在音频流中寻找特定关键字

关于sapi - 使用 SAPI 将音频(wav 文件)转换为文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1738804/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com