gpt4 book ai didi

java - Sphinx4:如何提高对话框演示中识别WAV文件的准确性

转载 作者:行者123 更新时间:2023-11-30 08:16:38 25 4
gpt4 key购买 nike

我已经编辑了对话框代码以使其适用于我的项目。


我创建了一个文本文件,其中包含一些可能在我的工作中使用的句子。我在评论部分添加了链接。
我已按照http://cmusphinx.sourceforge.net/wiki/tutoriallm上的步骤使用Web服务构建语言模型。
然后,我将对话框代码编辑为:

package dialog;

import edu.cmu.sphinx.api.Configuration;
import edu.cmu.sphinx.api.SpeechResult;
import edu.cmu.sphinx.api.StreamSpeechRecognizer;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;

public class EmployeeCode {

private static final String ACOUSTIC_MODEL = "resource:/edu/cmu/sphinx/models/en-us/en-us";
private static final String DICTIONARY_PATH = "models/language/TAR0779/0779.dic";
private static final String LANGUAGE_MODEL = "models/language/TAR0779/0779.lm";


public static void main(String[] args) throws Exception {

System.out.println("Loading models...");

Configuration configuration = new Configuration();
configuration.setAcousticModelPath(ACOUSTIC_MODEL);
configuration.setDictionaryPath(DICTIONARY_PATH);
configuration.setLanguageModelPath(LANGUAGE_MODEL);

StreamSpeechRecognizer lmRecognizer = new StreamSpeechRecognizer(configuration);

InputStream stream = new FileInputStream(new File("/Users/ha/NetBeansProjects/Dialog/WAV/sample1.wav"));

lmRecognizer.startRecognition(stream);
SpeechResult result;

while ((result = lmRecognizer.getResult()) != null)
{
System.out.println("You said: " + result.getHypothesis() + '\n');
} /* else
{
System.out.println("There is no stream.");
} */

lmRecognizer.stopRecognition();

}


}
运行后的输出为:

跑:
正在载入模型...
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
INFO:CI单位:* + NSN +
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:* + SPN +
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AA
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AE
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AO
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AW
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:AY
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:B
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:CH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:D
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:DH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:EH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:ER
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:安
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:F
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:G
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:HH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:IH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:IY
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:JH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:K
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:L
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:M
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:N
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:NG
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:OW
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:OY
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:P
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:R
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:S
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:SH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:T
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:TH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:UH
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
INFO:CI单位:UW
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:V
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:W
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:Y
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:Z
2015年4月16日2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit
信息:CI单位:ZH
2015年4月16日2:04:11 PM edu.cmu.sphinx.frontend.AutoCepstrum initDataProcessors
信息:倒谱组件自动配置如下:autoCepstrum {MelFrequencyFilterBank,Denoise,DiscreteCosineTransform2,Lifter}
2015年4月16日2:04:11 PM edu.cmu.sphinx.linguist.dictionary.TextDictionary分配
INFO:从以下文件中加载字典:file:models / language / TAR0779 / 0779.dic
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.dictionary.TextDictionary分配
信息:从以下位置加载填充字典:jar:文件:/Users/ha/Downloads/sphinx4-data-1.0-20150223.210601-7-sources.jar!/ edu / cmu / sphinx / models / en-us / en-us / noisedict
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo
信息:从以下位置加载束缚态声学模型:jar:文件:/Users/ha/Downloads/sphinx4-data-1.0-20150223.210601-7-sources.jar!/ edu / cmu / sphinx / models / zh-cn / zh-我们
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo
信息:池意味着条目:16128
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo
INFO:池差异条目:16128
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo
信息:池transition_matrices条目:42
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo
信息:池senones条目:5126
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianWeights logInfo
信息:高斯权重:blend_weights。参赛作品:15378
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo
信息:池senones条目:5126
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo
INFO:上下文无关单元条目:42
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.HMMManager logInfo
信息:HMM经理:137095 hmms
2015年4月16日2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.TiedStateAcousticModel logInfo
INFO:CompositeSenone序列:0
2015年4月16日2:04:13 PM edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo
信息:最大CI单位43
2015年4月16日2:04:13 PM edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo
INFO:单位表大小79507
2015年4月16日2:04:13 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle
信息:#-----------------------------计时器----------------- -----------------------
2015年4月16日2:04:13 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle
INFO:#名称计数CurTime MinTime MaxTime AvgTime TotTime
2015年4月16日2:04:13 PM edu.cmu.sphinx.util.Timer showTimesShort
信息:加载AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
2015年4月16日2:04:13 PM edu.cmu.sphinx.util.Timer showTimesShort
INFO:负载字典1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
2015年4月16日2:04:13 PM edu.cmu.sphinx.util.Timer showTimesShort
信息:编译1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
2015年4月16日2:04:17 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage
信息:这次音频:0.95s进程:3.15s速度:3.32 X实时
2015年4月16日2:04:17 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary
信息:总时间音频:0.95秒记录:3.15秒3.32 X实时
2015年4月16日2:04:17 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:内存总计:212.50 Mb空闲:70.12 Mb
2015年4月16日2:04:17 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:使用:这:142.38 Mb平均:142.38 Mb最大:142.38 Mb
你说:什么

2015年4月16日2:04:20 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage
信息:这次音频:0.96s过程:2.45s速度:2.55 X实时
2015年4月16日2:04:20 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary
INFO:总时间音频:1.91s Proc:5.60s 2.93 X实时
2015年4月16日2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:内存总计:237.00 Mb可用:141.00 Mb
2015年4月16日2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:使用:这:96.00 Mb平均:119.19 Mb最大:142.38 Mb
你说:很多男人

2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage
信息:这次音频:1429182208.00s进程:1.19s速度:0.00 X实时
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary
信息:总时间音频:1429182208.00s进程:6.79s 0.00 X实时
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:内存总计:247.50 Mb空闲:144.35 Mb
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:使用:这:103.15 Mb平均:113.84 Mb最大:142.38 Mb
你说:很多

2015年4月16日2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle
信息:#-----------------------------计时器----------------- -----------------------
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle
INFO:#名称计数CurTime MinTime MaxTime AvgTime TotTime
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
信息:加载AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
INFO:负载字典1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
INFO:得分586 0.0000s 0.0000s 0.2270s 0.0031s 1.8140s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
信息:修剪2043 0.0000s 0.0000s 0.0020s 0.0000s 0.0280s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
INFO:增长2051 0.0000s 0.0000s 0.9200s 0.0025s 5.1330s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
INFO:前端298 0.0000s 0.0000s 0.2100s 0.0009s 0.2640s
2015年4月16日2:04:21 PM edu.cmu.sphinx.util.Timer showTimesShort
信息:编译1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary
信息:总时间音频:1429182208.00s进程:6.79s 0.00 X实时
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:内存总计:247.50 Mb空闲:141.87 Mb
2015年4月16日2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker运算法则
信息:使用:这:105.63 Mb平均:111.79 Mb最大:142.38 Mb
成功构建(总时间:28秒)


正确的结果应该是:最低工资是多少。

我的wav文件是: https://www.mediafire.com/?khgyc9bhltz0z3b

如何提高wav文件的准确性?

提前致谢

最佳答案

私有静态最终字符串ACOUSTIC_MODEL =“ models / acoustic / wsj”;


这是错误的,您需要使用默认的en-us模型


  我删除了很多缺少语料库中单词拼音的行


语料库必须是文本文件,而不是RTF文件。您需要尝试再次创建语言模型和字典。

关于java - Sphinx4:如何提高对话框演示中识别WAV文件的准确性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29571834/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com