- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我刚刚开始语音识别,想知道从 Python 训练 SpeechRecognition 库的一般过程是什么:
https://pypi.python.org/pypi/SpeechRecognition/
我了解基本的机器学习技术和基本的文本分析,但我不确定如何应用它来训练声音数据。 (我的最终结果类似于手机中的典型语音输入,如果您经常更改语音分析器结果,它会“记住”用户首选项)。
谢谢!
最佳答案
该语音识别库使用的是 Google 的语音识别引擎,因此在用户端的训练方面没有特殊规定。您的声音数据会发送至 Google(以摘要形式)。如果您获得专用的 API(如该文档页面所示),Google 可能会在您的声音上构建特定于用户的配置文件,并基于此随着时间的推移获得统计质量,但这不会被存储或写入在你的最后。
如有任何其他问题或问题中 Unresolved 部分,请告诉我。
关于python - 如何训练 Python SpeechRecognition 2.1.1 库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31866109/
我在我的程序中使用 MSDN 的 SpeechRecognitionEngine。问题在于它将背景噪音识别为语音。 例如,如果我打响指、轻敲 table 或移动我的椅子,它就会将其识别为语音。 为什么
因此,我尝试将语法与 speech_recognition.recognize_sphinx() 一起使用,但是,我收到以下错误: RuntimeError: Decoder_set_fsg retu
我正在尝试开发能够倾听用户并向用户反馈的应用。我正在努力让它尽可能免提。 我的问题是,如果用户没有及时响应,SpeechRecognition 将超时,用户将需要按下按钮重新开始收听。 *我有没有办法
我正在尝试检测用户何时暂停并再次开始说话而不停止识别。这是我设置的用于检测用户何时说话并将其输出到页面的代码: //set up vars var final_transcript; var reco
我正在使用 SpeechRecognition包来尝试识别语音。当我调用 recognizer.listen(mic, timeout=5.0) 时,超时被完全忽略。有时即使我没有对着麦克风说话,它也
我的代码是 import SpeechRecognition as sr # obtain audio from the microphone r = sr.Recognizer() with sr.
我正在尝试测试 firefox 的 webspeech-api,但在控制台中遇到错误,提示 ReferenceError: SpeechRecognition is not defined。 我什至在
TL; DR: 它不起作用的原因是因为我在 Android 6.0 上运行该应用程序。在 6.0 中,您必须手动授予应用程序访问麦克风的权限。 原帖:我想创建一个使用 speechRecognitio
我有以下脚本可以在终端中运行: 所做的只是将麦克风语音转换为文本。 import speech_recognition as sr # obtain audio from microphone r =
我遇到了一个相当烦人的问题:对于客户项目,我需要使用 HTML5/JavaScript(客户规范)进行某种“语音结束”检测。所以我做了一些研究并认为“好吧,让我们试试 SpeechRecognitio
我想使用 SpeechRecognition api带有音频文件(mp3、wave 等)这可能吗? 最佳答案 简短的回答是否。 Web Speech Api Specification不禁止这一点(浏
我正在使用 Google Cloud Speech API。我想知道我是否使用python语音识别库并调用谷歌云语音API,这仍然是使用该API的有效方法吗?我只想转录文本。 我对它们之间的区别感到困
我正在编写语音识别助手以使其在我的网页中工作,但出现此错误:Uncaught TypeError: SpeechRecognition is not a constructor at app.js:5
我正在记录一个 numpy 数组 dt然后通过这样的代码将其写入 .wav: dt = np.int16(dt/np.max(np.abs(dt)) * 32767) scipy.io.wavfile
我想在 python 项目中同时使用 Snowboy 热词检测库和 SpeechRecognition 库。但是,我在尝试让两者和谐相处时遇到了很多不同的错误。 最初,我将其设置为 Snowboy 的
我正在尝试在 Windows 应用商店应用程序中使用 Cortana,但我一直收到错误消息: The type name or namespace 'SpeechRecognition' does n
我正在尝试几个小时来使这种 Electron 语音识别工作。以下代码适用于普通浏览器: if (window.SpeechRecognition === null ){ console.log
我正在创建一个语音到文本转换器,我需要一个可以离线工作的包/库。语音识别模块可以离线工作吗? 我已经尝试过,但就我而言,我没有收到模块的回复。所以我的假设是它无法离线工作。 最佳答案 我建议使用poc
我刚刚开始语音识别,想知道从 Python 训练 SpeechRecognition 库的一般过程是什么: https://pypi.python.org/pypi/SpeechRecognition
我将 React.js 与 Web Speech API 的 SpeechRecognition 一起使用,但是它不起作用,并且我收到错误“ReferenceError:SpeechRecogniti
我是一名优秀的程序员,十分优秀!