- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在对语音转文本和文本转语音进行一些开发,我发现了 OpenEars API 非常有用。
这个的原理cmu-slm基于 API 的一点是它使用语言模型来映射 iPhone 设备收听的语音。因此,我决定寻找一个大型英语语言模型来为 API 语音识别器引擎提供支持。但我无法理解与 OpenEars 一起使用的 voxfourge 英语数据模型的格式。
有人知道如何获得英语语言的 .languagemodel 和 .dic 文件以便与 OpenEars 配合使用吗?
最佳答案
关于 LM 格式:
据我所知,大多数语言模型都使用 ARPA 语言模型标准。 Sphinx/CMU语言模型被编译成二进制格式。您需要源格式才能将 Sphinx LM 转换为另一种格式。大多数其他语言模型都是文本格式。
我建议使用 HTK 语音识别工具包;详细文档在这里:http://htk.eng.cam.ac.uk/ftp/software/htkbook_html.tar.gz
这里还有 CMU 的 SLM 工具包的说明:http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
这是我在网上找到的 ARPA 格式的语言模型示例:http://www.arborius.net/~jphekman/sphinx/full/index.html
您可能想首先创建 ARPA LM,然后根据需要将其转换为任何二进制格式。
一般情况:
要构建语言模型,您需要大量训练数据 - 在观察到该时间点的当前输入后,确定词汇表中任何其他单词的概率。
您不能仅通过添加您想要识别的单词来“创建”语言模型 - 您还需要大量训练数据(= 在运行语音识别应用程序时观察到的典型输入)。
语言模型不仅仅是一个单词列表——它估计输入中下一个标记(单词)的概率。要估计这些概率,您需要运行一个训练过程,该过程会检查训练数据(例如历史数据),并观察其中的词频以估计上述概率。
对于您的问题,也许作为一个快速解决方案,只需假设所有单词具有相同的频率/概率。
用您想要识别的单词创建一个字典(字典中有 N 个单词)
创建一个语言模型,每个单词的概率为 1/N(uni-gram 语言模型)
然后,您可以使用 HTK Toolkit 将一元语言模型 (LM) 与另一个 LM 进行插值,以获得更大的语料库
关于iphone - 构建 openears 兼容的语言模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5220661/
我有一个为 Firefox 3.6 编写的附加组件,现在我正在将其升级到 Firefox 4.0,同时尝试使其与 3.6 兼容。有没有人有尝试这样做的经验,或者关于如何在代码变得太意大利面条式的情况下
我已经安装了 Cassandra 2.0.1 并想在我的应用程序中使用 Astyanax Java API。我在维基上看到了 Cassandra 兼容性表,上面写着 Astyanax 使用 Netfl
是否可以使纯粹在 VBScript(无 COM 对象)中实现的自定义容器类与 For Each 语句一起使用?如果是这样,我必须公开哪些方法? 最佳答案 简而言之,没有 为什么?创建一个可枚举的集合类
我这里的代码很少 int b=3; b=b >> 1; System.out.println(b); 它工作得很好,但是当我将变量 b 更改为 byte、short、float、double 时它包含
我们有一个 Java 客户端,它使用 corba 调用多个第三方系统。这些是实现同一组接口(interface)的不同系统。我们获得了使用这些接口(interface)的库(jar 文件)。例如,这些
我知道从技术上讲 HTML5 是一个“实时规范”,但我想知道它是否符合在类名中添加尾随空格的规定。我没有在规范中看到任何对这种情况的引用,但我的一个队友说它是无效的。也许我错过了什么? 修剪这些空间会
我在 Linux x86-64 上用 C 语言编程。我正在使用一个库,它通过原始 clone 创建多个线程系统调用而不是使用 pthread_create .这些线程运行库内部的低级代码。 我想钩住这
我希望用汇编程序编写一个可启动程序,能够发送和接收网络数据包。我不想使用任何库,我想自己创建它(并在这样做的同时学习)。不幸的是,我无法找到有关最低级别的网卡通信(发送原始套接字)的任何信息。我相信有
是否有除 fixed scoping 之外没有任何更改的 CoffeeScript 分支,以便它在很大程度上与 CoffeeScript 兼容(如果代码没有外部变量赋值则完全兼容)?我会考虑使用可接受
这个问题已经有答案了: Why is BiConsumer allowed to be assigned with a function that only accepts a single para
我的 Java 应用程序需要一个高性能主内存数据库 1] 请建议数据库 -符合 JDBC -独立(即平面文件) -支持内存表 -高性能 -B-TREE索引 2] JAVA中是否有任何技术可以在程序运行
我通常会找到一些以char*作为参数的函数,但是我听说在C++中更推荐std::string。如何将std::string对象与以char* s为参数的函数一起使用?到目前为止,我已经知道了c_str
我正在移植我的一个旧 javascript 文件以与 requireJS 兼容。这是以前代码的样子。 // effect.js (function(exports){ // shorthand
在今天更新我的 SDK 之前,我有工作代码(为了将来引用,请查看问题询问日期)。 .getMap 曾经发出警告,表明它已被弃用,但现在它甚至不被识别为有效输入。我假设这是因为 API 24(Andro
根据 this reference sheet on hyperpolyglot.org , 下面的语法可以用来设置一个数组。 i=(1 2 3) 但是我在 dash 上遇到错误,它是 Ubuntu
我的 MacBook 上安装了 MYSQL 8.0.12(下载版本)。当我尝试转储 mysql40 的兼容版本时,收到错误 Invalid mode to --known: mysql40。我 100
您好,我正在更改我的版本控制系统,我调查了 perforce 是否与 bcm 补救措施兼容。有谁知道其他版本的控制系统也与 bcm 补救措施兼容?? 最佳答案 BMC Remedy 会更接近 Clea
我需要在 python 中的图像上绘制一般坐标网格。我可以计算网格线的像素坐标,因此我只需要一个能够将它们绘制为图像顶部的虚线 的模块。图像以 numpy 数组的形式出现,因此我需要能够在这些格式和绘
库接受文件输入的“传统”方式是做这样的事情: def foo(file_obj): data = file_obj.read() # Do other things here 客户端代
代码 Untitled Document #topDropDownMenu { position: relative;
我是一名优秀的程序员,十分优秀!