- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使基于单音素的识别器适应特定的扬声器。我正在使用 HTKBook 3.4.1 section 3.6.2
中给出的食谱。我陷入了HHEd
我调用的部分如 sp:
HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng
我最终遇到的错误如下:
ERROR [+999] Components missing from Base Class list (2413 3375)<br/>
ERROR [+999] BaseClass check failed
文件夹classes
包含文件global
其中包含以下内容:
~b ‘‘global’’<br/>
<MMFIDMASK> *<br/>
<PARAMETERS> MIXBASE<br/>
<NUMCLASSES> 1<br/>
<CLASS> 1 {*.state[2-4].mix[1-25]}
hmmdefs
hmm15
内的文件缺少一些混合组件(我在每部手机的每个状态下使用 25 个混合组件)。我尝试通过给出具有随机均值和方差值但权重为零的混合成分来“填补空白”。这也没有效果。
hmms 是左右 hmms,具有 5 种状态(3 种发射状态),每种状态均由 25 种成分的混合物建模。每个组件依次由带有 EDA 组件的 MFCC 建模。共有 46 部手机。
我的问题是:
1.这是我调用HHEd
的方式正确的?单音素可以按上述方式调用吗?
2.我知道基类列表( rtree.base
必须包含每个单独的混合组件,但是我在哪里可以找到这些缺失的混合组件?
注意:如果需要更多信息,请告诉我。
编辑 1:文件 regtree.hed 包含以下内容:
RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"
谢谢,
斯里拉姆
最佳答案
他们调用 HHEd 的方式看起来不错。这些组件因失效而丢失。要处理失效组件,请阅读 HTKBook-3.4.1 第 8.4 节第 137 页。
问题:- regtree.hed 包含什么?- 您使用了多少数据(以小时为单位)? 25 种混合物可能过多。
您可能希望使用更逐渐增加的混合物 - MU +1 或 MU +2 并限制混合物的数量(猜测:3-8,具体取决于训练数据量)。
关于machine-learning - HTK 扬声器适配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6396772/
我正在尝试在 ubuntu 64 位中安装 HTK 工具包。在 make all 步骤中我收到以下错误。我无法找到解决方案。你能帮我解决这个问题吗。我在谷歌搜索并尝试解决方案。仍然无法正常工作。请帮忙
我正在使用 HTK (HMM ToolKit) 进行一些语音识别,但出现了这个奇怪的错误: ERROR [+7390] StepAlpha: Alpha prune failed sq(16) > q
我正在尝试使基于单音素的识别器适应特定的扬声器。我正在使用 HTKBook 3.4.1 section 3.6.2 中给出的食谱。我陷入了HHEd我调用的部分如 sp: HHEd -A -D -T 1
我将按照 HTK 书中的教程进行力对齐。 当我执行Hvite命令强制对齐时, HVite -a -b sil -m -o SWT -I config/monophn.mlf -H am/hmm5/ne
我想使用 HTK 构建一个语音识别系统,因此从 http://www.keithv.com/software/htk/us/ 下载了一个预训练的具有绑定(bind)状态的声学模型。 (训练数据:WSJ
您好,我是 HTK 的新手,并已遵循 http://htk.eng.cam.ac.uk/ 的 HTK 书中的“使用 HTK 的教程示例” 我已经到了必须使用“HCompV”的地步(3.2.1 第 6
我使用 HTK 已经有一段时间了,它曾经完美地工作过。关闭较晚(可能同时更改了一些环境变量,但不记得是哪些!),所有 HTK 命令都“找不到”。例如,执行 HCompV 给出了 bash: /usr/
类似于this题。由于我不想将语音数据传递到服务器,这样做可能会花费我更多的时间。我想知道我是否可以使用 HTK使用 Android 应用程序在本地识别语音数据,这样我就不需要将该音频传递到服务器。
我不想使用 ALIZE 进行说话人识别,安装后有以下步骤之一:使用 SPRO 或 HTK 提取特征 所以我下载了 HTK 的 zip 文件并使用终端我配置了所有内容,但是当输入 make all
我试图理解文件结果recout.mlf,因此该文件中有以下几行: 哪个“as”发音正确:带有 -524.427185 或 -1054.774536 的那个 最佳答案 解码过程中获得的声学分数通常非常小
我已经试过好几次编译安装HTK了,但是就是无法通过第5步!执行“make install”时(在“make all”正确执行之后)我得到以下输出: root@Humanoid:/bin/htk# ma
我正在使用 HMM 进行场景文本识别。与 HTK 相比,我怀疑用于训练和预测的 scikit-learn HMM 代码的速度,因为 sklearn HMM 是用 Python 编写的。 我的数据真的很
我正在尝试开始使用 HTK,我抓了一份,编译它,抓起这本书,一切都或多或少地顺利,偶尔会有一些小问题,但没什么大不了的。 现在,在阅读这本书并在谷歌上搜索了一段时间之后,我没有看到任何关于我的重要部分
我尝试了几乎所有在 google 上写的解决方案,但仍然无法正常工作。 输入 ./configure 之后: configure: creating ./config.status c
尝试在 HTK library 上运行 make 时出现以下问题: (cd HTKLib && make HTKLib.a) \ || case "" in *k*) fail=yes;; *)
我想安装 HTS 2.3,但是当我尝试全部安装时出现此错误 > (cd HTKLib && make HTKLib.a) \ || case "" in *k*) fail=yes;; *) ex
我是一名优秀的程序员,十分优秀!