gpt4 book ai didi

java - LIUM Speaker Diaritization 如何工作?

转载 作者:行者123 更新时间:2023-11-30 09:13:25 27 4
gpt4 key购买 nike

在我的项目中,我使用名为 LIUM_SpkDiarization-4.7.jar 的库,但我不太确定它是如何工作的。任何人都可以解释一下吗?

此外,我将它与 python 一起使用。

图书馆的链接是:https://voiceid.googlecode.com/svn-history/r11/trunk/scripts/LIUM_SpkDiarization-4.7.jar

提前致谢。

最佳答案

我不知道这个工具。看起来真的很酷。你查过他们的wiki吗?他们有一些关于系统如何工作的论文:http://lium3.univ-lemans.fr/diarization/doku.php

基本上,他们计算 MFCC 梅尔频率倒谱系数(标准技术)。这是基本步骤。它生成一个可以使用的特征空间。它类似于及时在滑动窗口上计算 FFT。最终使用贝叶斯信息准则 (BIC) 方法对这些时间切片特征执行聚类。首先对基于时间的特征空间进行分割,然后进行聚类,并为每个说话人找到一致的特征。 HMM、维特比、EM,有时也可以使用 GMM。

我不太了解算法,无法详细解释,但这也应该有所帮助:http://lium3.univ-lemans.fr/diarization/doku.php/overview

关于java - LIUM Speaker Diaritization 如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21041819/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com