gpt4 book ai didi

c# - 声音频率检测?

转载 作者:太空宇宙 更新时间:2023-11-03 11:22:40 28 4
gpt4 key购买 nike

从音频文件中检测特定单词的解决方案是什么?

我有很多音频文件(相同的编解码器),每个文件只有大约 15 秒长。 (注:所有音频文件都是同一个人/同一口音)

例如:

test1.mp3 播放 你好汤姆,你今天在做什么?

test2.mp3 播放 你好保罗,你今天在做什么?

test3.mp3 播放 早上好约翰 - 今天天气真好

我需要一种方法来检测每个音频文件中的lovely weatherwhat are you 词。

我可能有 100 个音频文件说“你今天在做什么”,而其他文件说“你今天在做什么?” - 我只需要知道每个文件的状态/类型是什么..

有什么解决方案可以检查频率位是否存在而不是使用语音识别工具。

最佳答案

您实际上是在问“我怎样才能进行通用语音识别”?

解决方案是:

如果您的平台提供开箱即用的语音识别,请使用它。例如,Microsoft Windows 就可以。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

如果您的平台没有,那么您需要集成第三方语音识别包,例如Lernaut & Hauspie(现为Nuance)、Dragon等,这可能需要付费。

编辑:我已将此标记为 Text-to-speech (voice generation) and speech-to-text (voice recognition) APIs? 的副本,其中对“我怎样才能进行语音识别”有一个全面的回答。

关于c# - 声音频率检测?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10434266/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com