python - Kaldi 是否返回任何识别置信度参数，类似于 Google Speech-To-Text API？-6ren

python - Kaldi 是否返回任何识别置信度参数，类似于 Google Speech-To-Text API？

转载作者：太空宇宙更新时间：2023-11-04 04:00:42

26

4

我正在处理语音识别任务。到目前为止，我一直在使用 Google Cloud Speech Recognition API(在 Python 中)并取得了不错的效果。 API 返回 confidence value以及转录文本的每一 block 。如文档中所述，置信度是一个介于 0 和 1 之间的数字，但我没有找到任何关于 Google 的 API 如何推导出这个数字的更深入的解释，所以我假设它以某种方式来自进行识别的神经网络。

下一步我想做的是制作我自己的(离线)自动语音识别程序，我发现 pyKaldi应该可以胜任这项任务。我还没有开始编程，但我想事先知道(出于研究目的)——Kaldi 能否像 Google Speech-to-Text API 一样返回一些类似的置信度值？这个“信心”到底是什么，它是如何计算出来的？

最佳答案

是的，pyKaldi 支持使用最小贝叶斯风险 (MBR) 计算的置信度值(单词置信度分数)。您将在文档中找到所有必要的信息。这是模块描述的链接:

https://pykaldi.github.io/api/kaldi.lat.html?highlight=mbr#module-kaldi.lat.sausages

顾名思义，它是一个置信度值，但它并没有表达从音频 block 序列派生(或在概率设置中给定)的单词的结果文本输出的“可能性”是正确的。在我看来，表现力或意义有点模糊，取决于模型的质量和训练数据(噪声、混响等)。它在比较备选方案时很有意义，告诉您具有更高值(value)的那个更有可能是正确的。这反过来又提出了一个问题，即哪个距离称为显着差异。单个置信度值不会告诉您任何信息，您也不能仅根据置信度值来比较两个不同的识别器模型。微软称其为“相反，置信度分数提供了一种机制，用于比较给定输入的多个识别备选方案的相对准确性。这有助于返回最准确的识别结果。”

关于python - Kaldi 是否返回任何识别置信度参数，类似于 Google Speech-To-Text API？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58397321/

26

4

0

文章推荐： python - pandas to_sql sqlalchemy 与 secure_transport 的连接

文章推荐： css - 将两个 div 放在容器 div 中

文章推荐： python - 如何为我的 tilemap 中的图 block 赋予 sprite？

python - 如何计算小数据集的SVM分类概率(置信度)？
用例: 我有一个小数据集，每个类大约有 3-10 个样本。我正在使用 sklearn SVC 对具有 rbf 内核的那些进行分类。我需要预测的置信度以及预测的类别。我使用了 SVC 的 predict
r - 生成漂亮的线性回归图(拟合线、置信度/预测带等)
我有这个 future 10 年回归样本。 date<-as.Date(c("2015-12-31", "2014-12-31", "2013-12-31", "2012-12-31")) value
python - 显示 NLTK 中的标签概率/置信度
我正在使用 Python NLTK 库中的 MaxEnt 分类器。对于我的数据集，我有许多可能的标签，并且正如预期的那样，MaxEnt 仅返回一个标签。我已经训练了我的数据集并获得了大约 80% 的准
python - 如何在 python 或命令窗口中获取 Tesseract 置信度？
我们如何在 Windows 中使用 tesseract 3.05 获得图像 OCR 后的置信度？我正在使用子进程命令从 python 调用 tesseract: retcode = subproces
pyspark - 如何确定 Spark 中 ALS.transImplicit 的偏好/置信度？
我正在使用 trainsimplicit来自 ALS在 Spark 。从文档页面:http://spark.apache.org/docs/latest/api/python/pyspark.mll
python - 使用 Python 在 GNU Radio 中计算 BER 置信度
正在为 GNU Radio OOT 开发基于 Python 的 BER 置信度计算器。根据引用文献 1，置信度由以下公式计算但是，引用文献2使用以下公式计算置信度: 第一个问题是关于两个公式的。他们

首页

博学

6Ren·AI

商城

python - Kaldi 是否返回任何识别置信度参数，类似于 Google Speech-To-Text API？