gpt4 book ai didi

tensorflow - 语音识别(使用ML?),而不是语音识别

转载 作者:行者123 更新时间:2023-11-30 08:39:33 24 4
gpt4 key购买 nike

我正在寻找用于语音识别的示例代码(不要与语音识别相混淆),也就是说-我需要建立一个可以检测特定人的语音的模型。

我可能最终会尝试使用自己的数据调整Tensor Flow“简单音频识别” ...这是最好的做法吗?还有其他建议吗?

最佳答案

在很大程度上取决于具体情况。您将拥有多少训练样本?您打算认识多少人?信噪比是多少?系统必须识别多少时间?应该有多严格?

不过,我已经告诉您,从神经网络开始是一个糟糕的做法,因为您立即放弃对领域的理解。与大多数其他学习系统相比,对行为异常的神经网络进行故障排除要麻烦得多。

我建议您构建自己的功能,而不是一开始就依赖ANN。现在,我假设您对Python(作为大多数TF用户)没问题,并提出以下模块:


Yaafe
aubio
librosa


作为一种选择,您可以使用三个MFCC中的任何一个进行计算并在其上构建基准系统。通常,每个窗口计算40个或更多的系数,这些系数可以可视化为频谱图。后者可以解释为图像,并且,如果您愿意的话,可以对它们进行深度学习(这是一种流行的选择)。

请注意,“说话者识别”是生物识别的一个完整领域,并且有许多论文讨论了良好的方法。

关于tensorflow - 语音识别(使用ML?),而不是语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54171247/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com