gpt4 book ai didi

svm - 如何使用 mfcc 功能训练 svm 分类器进行语音识别?

转载 作者:行者123 更新时间:2023-12-02 02:40:58 26 4
gpt4 key购买 nike

我目前正处于语音识别的讨论阶段项目,我使用MFCC特征提取,但是从函数返回的MFCC特征是一个矩阵,例如每个语音文件(wav)的(20,38)特征矩阵。但是我如何将此功能传递给 SVM 分类器。对于 SVM(和其他分类器),每个样本都由一个向量表示,对吗?但每个样本的 MFCC 特征是一个矩阵。假设 Xi 是样本 i 的 MFCC 特征,则样本 i 传递给 SVM 的特征为:1)一个20*38的向量,例如Xi(:) 的 matlab 形式。2)平均值(Xi)。3) Xi 中的一列或一行。哪种方式是正确的?有什么有用的代码、论文吗?

谢谢!闪耀

最佳答案

对于语音识别等序列标记任务,您需要结合使用 SVM 和 HMM,而不仅仅是 SVM

  1. 用GMM-HMM将特征矩阵与状态对齐,得到每个HMM状态对应的特征
  2. 根据属于每个状态的特征训练 SVM
  3. 实现 SVM-HMM 而不是 GMM-HMM

要了解更多信息,请阅读

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

为了加快速度,请使用现有的工具包,例如:

http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html

关于svm - 如何使用 mfcc 功能训练 svm 分类器进行语音识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15158942/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com