iphone - 构建 openears 兼容的语言模型-6ren

iphone - 构建 openears 兼容的语言模型

转载作者：行者123 更新时间：2023-12-03 18:21:48

25

4

我正在对语音转文本和文本转语音进行一些开发，我发现了 OpenEars API 非常有用。

这个的原理cmu-slm基于 API 的一点是它使用语言模型来映射 iPhone 设备收听的语音。因此，我决定寻找一个大型英语语言模型来为 API 语音识别器引擎提供支持。但我无法理解与 OpenEars 一起使用的 voxfourge 英语数据模型的格式。

有人知道如何获得英语语言的 .languagemodel 和 .dic 文件以便与 OpenEars 配合使用吗？

最佳答案

关于 LM 格式:

据我所知，大多数语言模型都使用 ARPA 语言模型标准。 Sphinx/CMU语言模型被编译成二进制格式。您需要源格式才能将 Sphinx LM 转换为另一种格式。大多数其他语言模型都是文本格式。

我建议使用 HTK 语音识别工具包；详细文档在这里:http://htk.eng.cam.ac.uk/ftp/software/htkbook_html.tar.gz

这里还有 CMU 的 SLM 工具包的说明:http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html

这是我在网上找到的 ARPA 格式的语言模型示例:http://www.arborius.net/~jphekman/sphinx/full/index.html

您可能想首先创建 ARPA LM，然后根据需要将其转换为任何二进制格式。

一般情况:

要构建语言模型，您需要大量训练数据 - 在观察到该时间点的当前输入后，确定词汇表中任何其他单词的概率。

您不能仅通过添加您想要识别的单词来“创建”语言模型 - 您还需要大量训练数据(= 在运行语音识别应用程序时观察到的典型输入)。

语言模型不仅仅是一个单词列表——它估计输入中下一个标记(单词)的概率。要估计这些概率，您需要运行一个训练过程，该过程会检查训练数据(例如历史数据)，并观察其中的词频以估计上述概率。

对于您的问题，也许作为一个快速解决方案，只需假设所有单词具有相同的频率/概率。

用您想要识别的单词创建一个字典(字典中有 N 个单词)
创建一个语言模型，每个单词的概率为 1/N(uni-gram 语言模型)

然后，您可以使用 HTK Toolkit 将一元语言模型 (LM) 与另一个 LM 进行插值，以获得更大的语料库

关于iphone - 构建 openears 兼容的语言模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5220661/

25

4

0

文章推荐：给开发者的 iPhone 图形设计建议

firefox - 升级插件以与 Firefox 4.0 兼容，但也尝试使其与 3.x 兼容。建议？
我有一个为 Firefox 3.6 编写的附加组件，现在我正在将其升级到 Firefox 4.0，同时尝试使其与 3.6 兼容。有没有人有尝试这样做的经验，或者关于如何在代码变得太意大利面条式的情况下
cassandra - 哪个版本的 Astyanax 与 Cassandra 2.0.1 兼容，或者哪些其他 Java 驱动程序与 Cassandra 2.0.1 兼容
我已经安装了 Cassandra 2.0.1 并想在我的应用程序中使用 Astyanax Java API。我在维基上看到了 Cassandra 兼容性表，上面写着 Astyanax 使用 Netfl
vbscript - 如何使我的自定义类与 For Each 兼容？
是否可以使纯粹在 VBScript(无 COM 对象)中实现的自定义容器类与 For Each 语句一起使用？如果是这样，我必须公开哪些方法？最佳答案简而言之，没有为什么？创建一个可枚举的集合类
java - 与哪些变量运算符 >> 兼容
我这里的代码很少 int b=3; b=b >> 1; System.out.println(b); 它工作得很好，但是当我将变量 b 更改为 byte、short、float、double 时它包含
兼容 Java 类名
我们有一个 Java 客户端，它使用 corba 调用多个第三方系统。这些是实现同一组接口(interface)的不同系统。我们获得了使用这些接口(interface)的库(jar 文件)。例如，这些
HTML5 兼容 - 类属性中的尾随空格
我知道从技术上讲 HTML5 是一个“实时规范”，但我想知道它是否符合在类名中添加尾随空格的规定。我没有在规范中看到任何对这种情况的引用，但我的一个队友说它是无效的。也许我错过了什么？修剪这些空间会
multithreading - 使克隆的线程 pthread 兼容
我在 Linux x86-64 上用 C 语言编程。我正在使用一个库，它通过原始 clone 创建多个线程系统调用而不是使用 pthread_create .这些线程运行库内部的低级代码。我想钩住这
assembly - 汇编程序中的低级网络(兼容 x86)
我希望用汇编程序编写一个可启动程序，能够发送和接收网络数据包。我不想使用任何库，我想自己创建它(并在这样做的同时学习)。不幸的是，我无法找到有关最低级别的网卡通信(发送原始套接字)的任何信息。我相信有
具有固定范围的 CoffeeScript 兼容 fork ？
是否有除 fixed scoping 之外没有任何更改的 CoffeeScript 分支，以便它在很大程度上与 CoffeeScript 兼容(如果代码没有外部变量赋值则完全兼容)？我会考虑使用可接受
java - 为什么方法引用与具有不同参数数量的功能接口(interface)兼容？
这个问题已经有答案了: Why is BiConsumer allowed to be assigned with a function that only accepts a single para
java - 兼容 JDBC 的主存独立数据库
我的 Java 应用程序需要一个高性能主内存数据库 1] 请建议数据库 -符合 JDBC -独立(即平面文件) -支持内存表 -高性能 -B-TREE索引 2] JAVA中是否有任何技术可以在程序运行
c++ - 如何使std::string与char *兼容？
我通常会找到一些以char*作为参数的函数，但是我听说在C++中更推荐std::string。如何将std::string对象与以char* s为参数的函数一起使用？到目前为止，我已经知道了c_str
javascript - 如何使这个模块与 requireJS 兼容
我正在移植我的一个旧 javascript 文件以与 requireJS 兼容。这是以前代码的样子。 // effect.js (function(exports){ // shorthand
android - 如何使我的项目与 getMapAsync 兼容？
在今天更新我的 SDK 之前，我有工作代码(为了将来引用，请查看问题询问日期)。 .getMap 曾经发出警告，表明它已被弃用，但现在它甚至不被识别为有效输入。我假设这是因为 API 24(Andro
POSIX 兼容 shell 中的数组
根据 this reference sheet on hyperpolyglot.org , 下面的语法可以用来设置一个数组。 i=(1 2 3) 但是我在 dash 上遇到错误，它是 Ubuntu
mysql - 无效模式--兼容 : mysql40
我的 MacBook 上安装了 MYSQL 8.0.12(下载版本)。当我尝试转储 mysql40 的兼容版本时，收到错误 Invalid mode to --known: mysql40。我 100
testing - 哪些版本控制软件与 remedy 兼容？
您好，我正在更改我的版本控制系统，我调查了 perforce 是否与 bcm 补救措施兼容。有谁知道其他版本的控制系统也与 bcm 补救措施兼容？？最佳答案 BMC Remedy 会更接近 Clea
python - 兼容 Numpy 的图像绘图库
我需要在 python 中的图像上绘制一般坐标网格。我可以计算网格线的像素坐标，因此我只需要一个能够将它们绘制为图像顶部的虚线的模块。图像以 numpy 数组的形式出现，因此我需要能够在这些格式和绘
python - 使文件处理代码与 asyncio 兼容
库接受文件输入的“传统”方式是做这样的事情: def foo(file_obj): data = file_obj.read() # Do other things here 客户端代
css - 我怎样才能使以下代码与 IE6 兼容？
代码 Untitled Document #topDropDownMenu { position: relative;

首页

博学

6Ren·AI

商城

iphone - 构建 openears 兼容的语言模型