gpt4 book ai didi

java - 语音分割

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:07:39 29 4
gpt4 key购买 nike

我正在帮助一个农场根据公鸡的叫声将公鸡分组,这样叫声相似的公鸡就会生活在一起。农夫说他想知道鸡会不会从其他人身上学到什么行为,如果会的话,他每次抓到一只小鸡都会把它放到一个好的鸡群里,希望能给新来的小鸡带来一些好的影响。我的工作是记录每个组的相似度,并在几周后比较结果并查看组中是否有任何增加的相似度。

我的想法是编写一个程序,为两个输入的 wav 文件给出相似度分数,因此每只公鸡都可以找到最相似的室友并配对成组,然后将相似的组分组,最后分成多个组。

我有 3 只公鸡打鸣,并用频谱图分析(每只公鸡打鸣两次):

公鸡 A:

first crowing from cock A second crowing from cock A

公鸡乙:

first crowing from cock B second crowing from cock B

公鸡 C:

first crowing from cock C second crowing from cock C

在计算相似度之前,我想把乌鸦分成几段,让每一段都保留一定的频率(后面计算相似度时会用到)。我目前的解决方案是:

第一步:当强度线不连续时,声音会被缝隙分割;
第 2 步:当频率发生临界变化时,该时间将被视为段的边界

我在想上面的步骤是否足够。我希望其他人有更好的建议以及如何改进分割。有什么方法或算法适合我的情况吗?谢谢!

最佳答案

最好的方法是使用一些语音识别技术。我将其用于识别鸟鸣的项目。就我而言,我使用 HTK(隐马尔可夫工具包)构建可以识别鸟类歌唱的 HMM。您可以将 Mel 比例更改为与您的情况更相似。梅尔音阶(来自 MFCC)与人声有关。如果您在 Google 中搜索,就会发现一些与鸟类相关的论文会更改 Mel 或 Bark (PLP) 音阶以匹配动物声道。

您将需要大量样本来稳健地训练 HMM 参数并分析最佳状态数。我建议这三首歌曲中的每一首至少有 100 个样本,并使用 3 个发射 HMM 状态。我可以帮你建立一个 HMM 系统。请与我联系。

路易斯·尤贝尔ASR 实验室www.asrlabs.com.br

关于java - 语音分割,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8171947/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com