gpt4 book ai didi

audio - 考虑有一个音频文件,人们可以在其中阅读句子。如何使用C,C++或Java程序知道语音的开始和结束时间

转载 作者:行者123 更新时间:2023-12-03 02:19:32 24 4
gpt4 key购买 nike

我正在从事自动字幕生成项目。
我的方法是
1.音频提取(使用ffmpeg完成)
2.语音转文字(可以使用狮身人面像4进行,尽管不准确)
3.字幕生成。 (在这里我需要帮助)

考虑有一个音频文件,人们可以在其中阅读句子。如何使用C,C++或Java程序知道语音的开始和结束时间

我们需要字幕文件中特定行的开始和结束时间。因此,在这里如何检索通话开始和结束的时间?

有任何想法吗?

是否可以用声学公式做到这一点。

最佳答案

我知道已经很晚了。但是我已经使用sphinx4做到了。您不需要音频的开始时间。 Sphinx4将为每个识别的单词提供时间。您可以使用它。 This研究论文很有帮助。

关于audio - 考虑有一个音频文件,人们可以在其中阅读句子。如何使用C,C++或Java程序知道语音的开始和结束时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15480172/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com