gpt4 book ai didi

java - 使用我自己的字典创建 CMUSphinx 语言模型后的下一步是什么?

转载 作者:行者123 更新时间:2023-11-30 10:52:05 28 4
gpt4 key购买 nike

我已经为一个软件创建了我自己的阿拉伯语 CMUSphinx 语言模型,该软件将听取用户的意见并使用我自己的字典应用命令,我已经手动完成,将“arpa”语言模型类型转换为“dmp”语言模型使用命令 sphinx_lm_convert -i ar.lm -o ar.lm.dmp,所以这里是我目前拥有的文件:

  • .txt(命令文本文件)
  • .wfreq(词频文件)
  • .idngram(ngram 文件)
  • .dic(词典文件)
  • .phone(音素文件)
  • .lm(arpa语言模型文件)
  • .lm.dmp(Darpa Trigram 转储语言模型文件)

然后我记录了自己说的每个单词,每个单词都有自己的 .wav 文件,它们都在一个文件夹中,与 .dic、.txt、.lm 所在的文件夹不同。

我的问题是我在这里阅读的下一步是什么 http://cmusphinx.sourceforge.net/wiki/tutorial

上面写着Adapting existing acoustic model is the next step after building the language model,这不是训练语言模型吗?

如果是培训,我有所有需要的文件,除了:

  • .转录
  • .fileids

这两个文件里面应该有什么?

感谢

最佳答案

tutorial for Acoustic Model Training 中描述了训练声学模型的过程。 .

如果您想将任何自定义形式的现有转录转换为所需格式,则需要在文本编辑器中或使用脚本手动创建文件 ID 和转录文件。

Fileids 必须列出文件名,转录文件必须以特殊格式列出每个文件的转录。

例如声学模型训练数据库,你可以在an4数据库中查看。

关于java - 使用我自己的字典创建 CMUSphinx 语言模型后的下一步是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34502351/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com