gpt4 book ai didi

machine-learning - HTK 扬声器适配

转载 作者:行者123 更新时间:2023-11-30 09:57:58 24 4
gpt4 key购买 nike

我正在尝试使基于单音素的识别器适应特定的扬声器。我正在使用 HTKBook 3.4.1 section 3.6.2 中给出的食谱。我陷入了HHEd我调用的部分如 sp:

HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng

我最终遇到的错误如下:
ERROR [+999] Components missing from Base Class list (2413 3375)<br/>
ERROR [+999] BaseClass check failed

文件夹classes包含文件global其中包含以下内容:
~b ‘‘global’’<br/>
<MMFIDMASK> *<br/>
<PARAMETERS> MIXBASE<br/>
<NUMCLASSES> 1<br/>
<CLASS> 1 {*.state[2-4].mix[1-25]}

hmmdefs hmm15内的文件缺少一些混合组件(我在每部手机的每个状态下使用 25 个混合组件)。我尝试通过给出具有随机均值和方差值但权重为零的混合成分来“填补空白”。这也没有效果。

hmms 是左右 hmms,具有 5 种状态(3 种发射状态),每种状态均由 25 种成分的混合物建模。每个组件依次由带有 EDA 组件的 MFCC 建模。共有 46 部手机。

我的问题是:
1.这是我调用HHEd的方式正确的?单音素可以按上述方式调用吗?
2.我知道基类列表( rtree.base 必须包含每个单独的混合组件,但是我在哪里可以找到这些缺失的混合组件?

注意:如果需要更多信息,请告诉我。

编辑 1:文件 regtree.hed 包含以下内容:

RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"

谢谢,
斯里拉姆

最佳答案

他们调用 HHEd 的方式看起来不错。这些组件因失效而丢失。要处理失效组件,请阅读 HTKBook-3.4.1 第 8.4 节第 137 页。

问题:- regtree.hed 包含什么?- 您使用了多少数据(以小时为单位)? 25 种混合物可能过多。

您可能希望使用更逐渐增加的混合物 - MU +1 或 MU +2 并限制混合物的数量(猜测:3-8,具体取决于训练数据量)。

关于machine-learning - HTK 扬声器适配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6396772/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com