gpt4 book ai didi

audio - 用于从音频流中提取单词(语音)的库?

转载 作者:行者123 更新时间:2023-12-04 15:48:55 26 4
gpt4 key购买 nike

我有一个音频流,我会从中提取单词(语音)。因此,例如使用 audio.wav 我会得到 001.wav、002.wav、003.wav 等,其中每个 XXX.wav 是一个词。

我正在寻找一个库或程序来做这件事——平台无关紧要,但我更喜欢开源解决方案。

预先感谢您的帮助。

最佳答案

Nuance ,制造Dragon Naturally Speaking的公司, 有Software Development Kits号.

Audio Mining套件似乎符合您的要求:

Dragon NaturallySpeaking SDK AudioMining is a speaker-independent speech recognition toolkit that enables the indexing of 100% of the speech information within audio files. The technology uses highly accurate speech recognition to turn audio files into XML text with timestamp information. This can be integrated with standard text-search products to enable rapid access to specific audio content.



语音到语音+元数据无疑是最难正确处理的部分。获得语音 + 元数据后,将单词提取为单独的音频文件是 much more straightforward .

关于audio - 用于从音频流中提取单词(语音)的库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3178238/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com