- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我的项目中,我使用名为 LIUM_SpkDiarization-4.7.jar 的库,但我不太确定它是如何工作的。任何人都可以解释一下吗?
此外,我将它与 python 一起使用。
图书馆的链接是:https://voiceid.googlecode.com/svn-history/r11/trunk/scripts/LIUM_SpkDiarization-4.7.jar
提前致谢。
最佳答案
我不知道这个工具。看起来真的很酷。你查过他们的wiki吗?他们有一些关于系统如何工作的论文:http://lium3.univ-lemans.fr/diarization/doku.php
基本上,他们计算 MFCC 梅尔频率倒谱系数(标准技术)。这是基本步骤。它生成一个可以使用的特征空间。它类似于及时在滑动窗口上计算 FFT。最终使用贝叶斯信息准则 (BIC) 方法对这些时间切片特征执行聚类。首先对基于时间的特征空间进行分割,然后进行聚类,并为每个说话人找到一致的特征。 HMM、维特比、EM,有时也可以使用 GMM。
我不太了解算法,无法详细解释,但这也应该有所帮助:http://lium3.univ-lemans.fr/diarization/doku.php/overview
关于java - LIUM Speaker Diaritization 如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21041819/
如何使用 LIUM Speaker Diarization 工具包知道哪个演讲者讲了多少时间? 例如,这是我的 .seg 文件。 ;; cluster S0 [ score:FS = -33.9316
在我的项目中,我使用名为 LIUM_SpkDiarization-4.7.jar 的库,但我不太确定它是如何工作的。任何人都可以解释一下吗? 此外,我将它与 python 一起使用。 图书馆的链接是:
我正在尝试配置 LIUM 工具以进行扬声器分类。这个问题是UnsupportedAudioFileException in LIUM Speaker Diarization的后续问题 我尝试使用 so
我编写了一个 shell 脚本来训练多个 GMM 进行某些类型的语音 Activity 和静音。因此我使用了 LIUM 说话人分类工具包。我想用它来进行语音 Activity 检测。以下脚本使用 Sp
我是一名优秀的程序员,十分优秀!