- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我目前正在编写一个 AI 程序,它接收来自 Dragon NaturallySpeaking(使用 Natlink)的输入,对其进行处理,然后返回语音输出。我能够想出一个 Receiver GrammarBase 来捕获来自 Dragon 的所有输入并将其发送到我的解析器。
class Receiver(GrammarBase):
gramSpec = """ <start> exported = {emptyList}; """
def initialize(self):
self.load(self.gramSpec, allResults = 1)
self.activateAll()
def gotResultsObject(self, recogType, resObj):
if recogType == 'reject':
inpt, self.best_guess = [], []
else:
inpt = extract_words(resObj)
inpt = process_input(inpt) # Forms a list of possible interpretations
self.best_guess = resObj.getWords(0)
self.send_input(inpt)
def send_input(self, inpt):
send = send_to_parser(inpt) # Sends first possible interpretation to parser
try:
while True:
send.next() # Sends the next possible interpretation if the first is rejected
except StopIteration: # If all interpretations are rejected, try sending the input to Dragon
try:
recognitionMimic(parse(self.best_guess))
except MimicFailed: # If that fails too, execute all_failed
all_failed()
此代码按预期工作,但存在几个问题:
Dragon 在将输入发送到我的程序之前对其进行处理。例如,如果我说“打开谷歌浏览器。”,它会打开谷歌浏览器,然后将输入发送到 Python。有没有办法在不先处理输入的情况下将输入发送到 Python?
当我调用 waitForSpeech() 时,会弹出一个消息框,说明 Python 解释器正在等待输入。是否可以(为了美观和方便)阻止显示消息框,而是在用户明显停顿后终止语音收集过程?
谢谢!
最佳答案
关于您的第一个问题,事实证明 DNS 使用“Open ...”语句作为其内部命令解析过程的一部分。这意味着 DNS 在 natlink 有机会之前解析语音并执行命令方式。解决此问题的唯一方法是在您的 natlink 语法中将话语从“Open ...”更改为“Trigger ...”(或者更改为 DNS 除了“Trigger”之外未使用的其他话语)。
一些 natlink 开发人员在 speechcomputing.com 闲逛。你可能会在那里得到更好的回应。
祝你好运!
关于python - 将 Dragon NaturallySpeaking 的所有输入重定向到 Python? (使用 Natlink),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8686607/
在 Dragon NaturallySpeaking 的高级脚本中,是否有任何方法可以定义可用于所有语音命令的常量? 例如,我有两个语音命令: Sub Main originalClipboa
有没有办法将 Dragon NaturallySpeaking 合并到事件驱动程序中?如果我使用 DNS 记录用户语音输入而不将其写入屏幕并直接保存为 XML,我的老板会非常喜欢它。我已经研究了好几天
我有一个在 ColdFusion MVC 框架“Mach-II”中构建的应用程序,并托管在蓝龙 ColdFusion 服务器上。 它会导致缓存问题。当我添加一个包含一些内容的新页面并加载该页面时,它工
我最近购买了一个带有 atmega1280 的 Arduino。我没有让它使用 Arduino IDE,而只是作为一个方便的板与 AVR Studio 和我的 Dragon 一起使用。 我大约在同一时
我正在玩欧拉计划的 Problem 220 ,我对维基百科关于该主题的文章有点困惑,Dragon Curve .关于无需绘制整条曲线即可计算第 n 圈方向的主题,它说: First, express
我正在使用来自 dragon dictation api 的演示应用程序。我没有对演示应用程序进行任何修改,因此我认为它没有任何问题。当我打开应用程序并在我的手机上运行它时,它会打开并运行。我单击录制
有什么方法可以更改 Dragon NaturallySpeaking 中的默认识别模式吗? 我找到了这篇文章 - How to set default recognition Mode in Drag
我正在寻找一种方法,将有限词汇量的语音识别功能集成到我的 Android 应用程序中(因为 Google 语音搜索依赖于用户并不总是可以访问的互联网访问)。 我找到了一个 Nuance page诱使程
我敢肯定,有很多人在编写代码,但出于某种原因,他们暂时或永久无法使用键盘进行编写。 我正在尝试了解是否值得让 Dragon Dictate(或任何其他语音识别软件)在我的 ARM 处于石膏状态时继续编
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 5年前关闭。 Improve t
如何从 Dragon NaturallySpeaking 中的高级脚本语音命令调用 python 函数? 我不想使用第三方应用程序,例如 dragonfly或NatLink (paper)。 最佳答案
有没有人在 Mighty Moose/ContinuousTests 中遇到过 Here Be Dragons 警告? 这被放置在一个私有(private)方法旁边,可能是因为它是私有(private
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 6 年前。
Nuance 的 DragonMobile 组件显然在初始调用 SKRecognizer 的 initWithType:detection:language:delegate 和组件调用 recogn
有没有办法用Dragon NaturallySpeaking的高级脚本弹出光驱? 最佳答案 您可以使用 Windows Multimedia API (also known as WinMM) : '
我目前正在编写一个 AI 程序,它接收来自 Dragon NaturallySpeaking(使用 Natlink)的输入,对其进行处理,然后返回语音输出。我能够想出一个 Receiver Gramm
我在我的应用程序中使用 Dragon 的软件将语音转换为文本。基于语音命令,我想从我的脚本中执行特定的功能,我搜索了很多,但没有找到如何将 Dragon 的 API 与应用程序集成。我还查看了包含开发
我正在 XCode 中开发一个 iOS 应用程序,并尝试集成 Nuance 移动 SDK。我已经让他们的示例应用程序正常运行,现在正尝试将其添加到我现有的应用程序中。当我这样做时,我遇到了以下错误。我
我在运行时将我的应用程序与 naunce dragon Mobile 的 speechkit 集成,出现以下错误: Undefined symbols for architecture armv7:
这可能是一个远景,但 Nuance 支持已重定向到 Microsoft,所以我想我也可以在这里试试运气。 一点背景:我正尝试在我的 WPF 应用程序中使用 Dragon Naturally Speak
我是一名优秀的程序员,十分优秀!