- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用Pocketsphinx(。进行简单的语音到文本映射。语法非常简单,例如:
public <grammar> = (Matt, Anna, Tom, Christine)+ (One | Two | Three | Four | Five | Six | Seven | Eight | Nine | Zero)+ ;
Tom Anna Three Three
Tom Anna 33
for i in `seq 1 20`; do
fn=`printf arctic_%04d $i`;
read sent; echo $sent;
rec -r 16000 -e signed-integer -b 16 -c 1 $fn.wav 2>/dev/null;
done < arctic20.txt
//ORIGNAL UNPROCESSED TESTING FILES
TOTAL Words: 111 Correct: 72 Errors: 43
TOTAL Percent correct = 64.86% Error = 38.74% Accuracy = 61.26%
TOTAL Insertions: 4 Deletions: 13 Substitutions: 26
//DENOISED + VOLUME UP
TOTAL Words: 111 Correct: 76 Errors: 42
TOTAL Percent correct = 68.47% Error = 37.84% Accuracy = 62.16%
TOTAL Insertions: 7 Deletions: 4 Substitutions: 31
//VOLUME UP
TOTAL Words: 111 Correct: 69 Errors: 47
TOTAL Percent correct = 62.16% Error = 42.34% Accuracy = 57.66%
TOTAL Insertions: 5 Deletions: 12 Substitutions: 30
//DENOISE, threshold 0.1
TOTAL Words: 111 Correct: 77 Errors: 41
TOTAL Percent correct = 69.37% Error = 36.94% Accuracy = 63.06%
TOTAL Insertions: 7 Deletions: 3 Substitutions: 31
//DENOISE, threshold 0.21
TOTAL Words: 111 Correct: 80 Errors: 38
TOTAL Percent correct = 72.07% Error = 34.23% Accuracy = 65.77%
TOTAL Insertions: 7 Deletions: 3 Substitutions: 28
最佳答案
关于耳语:这样做时,声波没有有意义的非周期性声部(由于声带正常共振而产生的振动,而耳语时则没有)。您可以通过大声说“ aaaaaa”的同时将手指放在喉咙上,然后轻声细语来尝试一下。
AFAIR声学建模在很大程度上取决于获取声音的频谱来检测峰值(共振峰)并将其与电话(如元音)相关联。
有根据的猜测:耳语时,频谱大多是白噪声,由口腔位置(舌头,嘴巴张开等)略微影响,这对人类来说足够了,但远不足以使计算机可以区分窥视。
关于voice-recognition - 耳语时简单的语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11723139/
我正在准备重构一些Graphite指标名称,并希望能够保留历史数据。 .wsp文件是否可以重命名(如果更高级别的组件发生更改,则可以将其移动到新目录中)吗? 示例:group.subgroup1.me
Telegram Bot 是否可以在群聊中向一个或多个人耳语消息? 例如,如果我在群聊中使用 bot 命令,那么我的命令和 bot 的响应只会对我可见,而对所有其他组成员不可见。 最佳答案 你不能让你
ChatGPT API 与 Speech-to-text Whisper api 一起发布,我很高兴尝试一下。 Here's the link 我试过他们的示例代码 # Note: you need
ChatGPT API 与 Speech-to-text Whisper api 一起发布,我很高兴尝试一下。 Here's the link 我试过他们的示例代码 # Note: you need
我想看看 OpenAI whisper,看看能不能为它找到一些个人应用程序。我继续 github 并按照说明进行设置。我的主系统在 Windows 11 上,但出现此错误;尝试在我的系统上运行测试脚本
我想看看 OpenAI whisper,看看能不能为它找到一些个人应用程序。我继续 github 并按照说明进行设置。我的主系统在 Windows 11 上,但出现此错误;尝试在我的系统上运行测试脚本
我是一名优秀的程序员,十分优秀!