gpt4 book ai didi

machine-learning - 使用 MFCC 的简单单词检测器

转载 作者:行者123 更新时间:2023-11-30 09:56:12 28 4
gpt4 key购买 nike

我正在使用梅尔频率倒谱系数实现语音识别软件。特别是系统必须识别单个指定的单词。由于音频文件,我得到了一个具有 12 行(MFCC)和与语音帧数量一样多的列的矩阵中的 MFCC。我计算行的平均值,因此得到一个仅包含 12 行的向量(第 i 行是所有帧的所有第 i-MFCC 的平均值)。我的问题是如何训练分类器来检测单词?我有一个仅包含正样本的训练集,即我从多个音频文件(同一单词的多个注册)中获得的 MFCC。

最佳答案

I make the average of the rows, so I get a vector with only the 12 rows (the ith-row is the average of all ith-MFCCs of all frames).

这是一个非常糟糕的主意,因为你会丢失有关该单词的所有信息,你需要分析整个 mfcc 序列,而不是其中的一部分

My question is how to train a classifier to detect the word?

简单的形式是 GMM 分类器,您可以在此处查看:

http://www.mathworks.com/company/newsletters/articles/developing-an-isolated-word-recognition-system-in-matlab.html

在更复杂的形式中,您需要学习更复杂的模型,例如 HMM。你可以从像这样的教科书中了解更多关于 HMM 的知识

http://www.amazon.com/Fundamentals-Speech-Recognition-Lawrence-Rabiner/dp/0130151572

关于machine-learning - 使用 MFCC 的简单单词检测器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28562023/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com