- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我发现有很多参数可以调整语音识别(例如 pocketsphinx_continuous 应用程序中的输入参数)。许多参数是枚举,其他是 float 值。在哪里可以找到 pocketsphinx_continuous 应用程序每个参数的变化范围?
最佳答案
大多数 pocketsphinx 参数都是语音识别算法的内部参数,它们之间的联系并不简单,除非您了解正在发生的事情,否则更改它们并没有多大用处。
单个参数更改可能需要更改其他参数,或者在非常罕见但重要的情况下可能会破坏识别。
通常参数几乎是最佳的或接近最佳的。如果您有兴趣,可以在当前值内稍微改变每个参数(相对 +/- 10%),但重大改变很少是合理的事情。
如果你对一些解码调优感兴趣,最好描述一下你要归档的目标是什么。
关于cmusphinx - pocketsphinx_continuous 应用程序每个参数的变化范围,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29076875/
我对 Sphinx 很陌生。我想使用 Sphinx 进行语音到文本的转换。我试着用谷歌搜索它。 Sphinx 使用 gram 文件来匹配单词。但这样就限制了言语的可能性。我想处理或只是将所说的每个单词
我可以使用Sphinx4随附的使用中的东西,没问题: cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us") c
我想知道与假设相关的数字/分数是什么意思。在我的识别结果中,通常是数万级的负数。例如,解码后的假设可能看起来像“什么是苹果”,得分为-70021。所以我想知道这个分数是否表明了假设的准确性/置信度。我
我目前正在使用 Pocketsphix 演示(android 和 Visual Studio 2010)并且我已经配置了一个 jsgf 语法 像这样 #JSGF V1.0; grammar Nam
我开始研究口袋狮身人面像。我有一个用于配置解码器的可能参数列表。但没有说明哪个参数负责哪个配置。在 tutorial CMUSphinx这只是其中的一小部分。这对我来说还不够。有人有资料,解释了哪些参
我发现有很多参数可以调整语音识别(例如 pocketsphinx_continuous 应用程序中的输入参数)。许多参数是枚举,其他是 float 值。在哪里可以找到 pocketsphinx_con
Sphinx 似乎无法识别或处理音频文件,它接受音频流吐出一个空数组(SpeechResult 结果)。我觉得我正在使用的音频文件没有任何问题,因为我已经尝试了几个,但对其中任何一个都不起作用。有没有
目前我在 java 桌面应用程序中使用 Sphinx4 来将一些语音/单词与 xxx.gram 文件匹配。我没有在我的系统中安装 sphinx 而我只是在我的项目的类路径中使用 sphinx4.jar
CMU Sphinx 识别现场语音太慢了,不知道大家有没有什么办法可以提升一下? 这是我的配置: configuration.setAcousticModelPath("WSJ_8gau_13dCep
虽然最初我在使 sphinx 4 工作时遇到了一些问题,但现在它工作得很好。由于无论是 JSGF 还是 N-Gram 语法都是有限的,我无法让 sphinx 识别每个可能的单词或句子。我想建立类似基于
我正在寻找德语发音词典,以便用于 PocketSphinx/CMU Sphinx。 字典看起来像这样: BACK B AE K CALL K AO L NO N OW NUMBER N
为清楚起见进行编辑:我从 sphinx 获得的输出与我的声音文件中的实际单词并不接近。我需要做什么才能使其更准确? Here's the file我正在尝试从中获取成绩单。它应该以 8K 的采样率。
我正在考虑为我的应用程序使用 Pocketsphinx 离线语音识别,但它的文档不清楚。如果有人可以给出以下问题的答案,那么它真的会对我有很大帮助。 setKeywordThreshold(1e-5f
我已经为一个软件创建了我自己的阿拉伯语 CMUSphinx 语言模型,该软件将听取用户的意见并使用我自己的字典应用命令,我已经手动完成,将“arpa”语言模型类型转换为“dmp”语言模型使用命令 sp
我正在尝试使用 CMUSphinx 和 Java 实现德国命令和控制应用程序。到目前为止,应用程序应该只能识别几个单词(从 1 到 9 的数字,是/否)。 不幸的是,准确性非常差。看来,如果一个单词被
我导入了这个项目: https://github.com/cmusphinx/pocketsphinx-android-demo 而且它在 Android studio 上运行良好。 但是正如您在教程
E_INFO 正在打印一堆日志。我不知道如何才能将其关闭。我从 pocket/base sphinx 中的所有源文件中搜索了 E_INFO,但无法找到它设置标志的位置。 最佳答案 配置选项 -logf
例如,我使用 Sphinx 5 得到的结果很差,如果我说“main”,我会在 4 分钟“mate”后得到结果。那么有没有办法可以提高 CMUSphinx 5 的速度和准确性?这是我正在使用的代码:
我正在尝试在 Windows 10 上安装 Pocketsphinx。我已经下载了 Pocketsphinx 和 sphinxbase,构建了它们,并将 sphinxbase.dll 放入了 Pock
pocket sphinx 或 cmu sphinx 是否有一些命令行实用程序可以将 .wav 文件转换为文本? pocketsphinx_continuous -hmm -lm -dict 就可以了
我是一名优秀的程序员,十分优秀!