machine-learning - HTK 扬声器适配-6ren

machine-learning - HTK 扬声器适配

转载作者：行者123 更新时间：2023-11-30 09:57:58

24

4

我正在尝试使基于单音素的识别器适应特定的扬声器。我正在使用 HTKBook 3.4.1 section 3.6.2 中给出的食谱。我陷入了HHEd我调用的部分如 sp:

HHEd -A -D -T 1 -H hmm15/hmmdefs -H hmm15/macros -M classes regtree.hed monophones1eng

我最终遇到的错误如下:
ERROR [+999] Components missing from Base Class list (2413 3375) ERROR [+999] BaseClass check failed

文件夹classes包含文件global其中包含以下内容:
~b ‘‘global’’ <MMFIDMASK> * <PARAMETERS> MIXBASE <NUMCLASSES> 1 <CLASS> 1 {*.state[2-4].mix[1-25]}

hmmdefs hmm15内的文件缺少一些混合组件(我在每部手机的每个状态下使用 25 个混合组件)。我尝试通过给出具有随机均值和方差值但权重为零的混合成分来“填补空白”。这也没有效果。

hmms 是左右 hmms，具有 5 种状态(3 种发射状态)，每种状态均由 25 种成分的混合物建模。每个组件依次由带有 EDA 组件的 MFCC 建模。共有 46 部手机。

我的问题是:
1.这是我调用HHEd的方式正确的？单音素可以按上述方式调用吗？
2.我知道基类列表( rtree.base 必须包含每个单独的混合组件，但是我在哪里可以找到这些缺失的混合组件？

注意:如果需要更多信息，请告诉我。

编辑 1:文件 regtree.hed 包含以下内容:

RN "models"
LS "stats_engOnly_3_4"
RC 32 "rtree"

谢谢，
斯里拉姆

最佳答案

他们调用 HHEd 的方式看起来不错。这些组件因失效而丢失。要处理失效组件，请阅读 HTKBook-3.4.1 第 8.4 节第 137 页。

问题:- regtree.hed 包含什么？- 您使用了多少数据(以小时为单位)？ 25 种混合物可能过多。

您可能希望使用更逐渐增加的混合物 - MU +1 或 MU +2 并限制混合物的数量(猜测:3-8，具体取决于训练数据量)。

关于machine-learning - HTK 扬声器适配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6396772/

24

4

0

文章推荐： javascript - jquery ajax 调用不在 firefox 中执行

文章推荐： java - JSplitPane 调整大小行为

ubuntu - 安装 htk 工具包时出错
我正在尝试在 ubuntu 64 位中安装 HTK 工具包。在 make all 步骤中我收到以下错误。我无法找到解决方案。你能帮我解决这个问题吗。我在谷歌搜索并尝试解决方案。仍然无法正常工作。请帮忙
cmd - HTK HEREST 问题
我正在使用 HTK (HMM ToolKit) 进行一些语音识别，但出现了这个奇怪的错误: ERROR [+7390] StepAlpha: Alpha prune failed sq(16) > q
machine-learning - HTK 扬声器适配
我正在尝试使基于单音素的识别器适应特定的扬声器。我正在使用 HTKBook 3.4.1 section 3.6.2 中给出的食谱。我陷入了HHEd我调用的部分如 sp: HHEd -A -D -T 1
ubuntu - 通过 HTK 进行力对齐时出错
我将按照 HTK 书中的教程进行力对齐。当我执行Hvite命令强制对齐时， HVite -a -b sil -m -o SWT -I config/monophn.mlf -H am/hmm5/ne
speech-recognition - HTK:HVite 找不到嗯
我想使用 HTK 构建一个语音识别系统，因此从 http://www.keithv.com/software/htk/us/ 下载了一个预训练的具有绑定(bind)状态的声学模型。 (训练数据:WSJ
linux - HTK:HCompV ReadString:字符串太长
您好，我是 HTK 的新手，并已遵循 http://htk.eng.cam.ac.uk/ 的 HTK 书中的“使用 HTK 的教程示例” 我已经到了必须使用“HCompV”的地步(3.2.1 第 6
linux - bash 找不到 HTK 命令
我使用 HTK 已经有一段时间了，它曾经完美地工作过。关闭较晚(可能同时更改了一些环境变量，但不记得是哪些!)，所有 HTK 命令都“找不到”。例如，执行 HCompV 给出了 bash: /usr/
android - 如何在 Android 上安装 HTK？
类似于this题。由于我不想将语音数据传递到服务器，这样做可能会花费我更多的时间。我想知道我是否可以使用 HTK使用 Android 应用程序在本地识别语音数据，这样我就不需要将该音频传递到服务器。
linux - 无法在 Linux 上安装 HTK
我不想使用 ALIZE 进行说话人识别，安装后有以下步骤之一:使用 SPRO 或 HTK 提取特征所以我下载了 HTK 的 zip 文件并使用终端我配置了所有内容，但是当输入 make all
machine-learning - HTK:了解生成的 .mlf 文件中的分数
我试图理解文件结果recout.mlf，因此该文件中有以下几行: 哪个“as”发音正确:带有 -524.427185 或 -1054.774536 的那个最佳答案解码过程中获得的声学分数通常非常小
linux - 在 Ubuntu 上安装 HTK 使一切无法正常工作
我已经试过好几次编译安装HTK了，但是就是无法通过第5步!执行“make install”时(在“make all”正确执行之后)我得到以下输出: root@Humanoid:/bin/htk# ma
python - scikit-learn HMM 与 HTK 相比速度如何？
我正在使用 HMM 进行场景文本识别。与 HTK 相比，我怀疑用于训练和预测的 scikit-learn HMM 代码的速度，因为 sklearn HMM 是用 Python 编写的。我的数据真的很
c++ - 使用 HTK(隐马尔可夫工具包)的 C/C++ 代码示例
我正在尝试开始使用 HTK，我抓了一份，编译它，抓起这本书，一切都或多或少地顺利，偶尔会有一些小问题，但没什么大不了的。现在，在阅读这本书并在谷歌上搜索了一段时间之后，我没有看到任何关于我的重要部分
ubuntu - HTK 3.4.1 在 Ubuntu 14.04 上安装错误
我尝试了几乎所有在 google 上写的解决方案，但仍然无法正常工作。输入 ./configure 之后: configure: creating ./config.status c
c - 编译 HTK 时出现 "fatal error: bits/libc-header-start.h: No such file or directory"
尝试在 HTK library 上运行 make 时出现以下问题: (cd HTKLib && make HTKLib.a) \ || case "" in *k*) fail=yes;; *)
linux - 在 Ubuntu 16.04 上为 HTK 3.4.1 安装 HTS 2.3 有错误
我想安装 HTS 2.3，但是当我尝试全部安装时出现此错误 > (cd HTKLib && make HTKLib.a) \ || case "" in *k*) fail=yes;; *) ex

首页

博学

6Ren·AI

商城

machine-learning - HTK 扬声器适配