gpt4 book ai didi

audio - 查找音频中单词的时间戳

转载 作者:行者123 更新时间:2023-12-03 00:35:34 25 4
gpt4 key购买 nike

我有一个人类语音音频文件。音频长度约为1分钟。我想找到音频中说出的单词或短语的时间戳。

有没有现成的图书馆可以完成这项任务?

最佳答案

解决此问题的方法至少有两种:语音识别和机器学习。哪个更合适取决于您的情况。

使用语音识别,您可以通过已建立的语音到文本识别器运行音频,并根据单词与结果字符串开头之间的距离来评估单词的时间戳。通过机器学习,您将为训练数据中的单词或短语产生的音频建立模型,然后将测试音频切成合适的长度,并针对模型运行每个音频,以评估其是否为您要查找的单词。

机器学习方法相对于时间戳而言可能更准确,但是当然首先需要大量训练数据才能建立模型。

关于audio - 查找音频中单词的时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41753441/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com