gpt4 book ai didi

speech-recognition - 从视频和音频文件中提取语音的文本

转载 作者:行者123 更新时间:2023-12-04 07:55:55 25 4
gpt4 key购买 nike

执行此操作的最佳库是什么。并且是质量好足以依靠。不可能用说话者的声音训练系统或使用术语词典来改善结果。

最佳答案

在 Windows 上,您想使用 SAPI 接口(interface)(语音 API)。有多种实现。 Microsoft 在 Windows 中包含一个免费的。 Dragon NaturallySpeaking 是一种非免费的,我过去曾看到它用于类似的任务(努力)。如果演讲者说话清晰(而不是相互重叠和打断),那么缺乏培训就不会那么严重。

但是,您不会得到好的成绩单,准确性会很差,以至于您获得的内容仅对索引有用。大词和独特的短语会很好地弹出,特别是如果您创建自定义词典(我知道您说过您不想这样做)。例如,查找所有提及“Pelosi”和“public option”的新闻片段。

关于speech-recognition - 从视频和音频文件中提取语音的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1740644/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com