gpt4 book ai didi

python - 用python机器学习识别声音(单词)

转载 作者:行者123 更新时间:2023-12-03 01:51:16 27 4
gpt4 key购买 nike

我正在准备一个实验,我想使用python编写程序以识别参与者说出的某些单词。

我在python中搜索了很多有关语音识别的内容,但结果却很复杂(例如CMUSphinx)。

我要实现的是一个程序,该程序接收一个声音文件(仅包含一个单词,不包含英语),然后告诉程序声音的含义和想要看到的输出。

我看过有关识别手写数字的sklearn example。我想知道是否可以执行以下示例:

  • 训练程序根据来自不同人说同一单词的声音文件返回某些输出(例如数字);
  • 从别人说相同的单词时获取新的声音文件时,返回相同的值。

  • 我可以使用python和sklearn吗?
    如果是这样,我应该从哪里开始?

    谢谢!

    最佳答案

    我已经在文本识别中编写了这样的程序。我可以告诉您,如果您选择手动“教”您的程序,您将有很多工作要考虑由于重音等引起的语音变化。

    您可以启动looking for a sound analyzer here(音乐分析)。尝试识别一个简单单词(如"is")的波动,然后编写一个算法,将声音文件的变化百分比化。这样,您就可以保证自己免受假阳性的影响,反之亦然。

    另外,您可能需要先从声音文件中删除背景噪音,因为它们可能会干扰您的识别模式。

    关于python - 用python机器学习识别声音(单词),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39486341/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com