speech-recognition - 各种 Microsoft Speech 技术之间的差异-6ren

speech-recognition - 各种 Microsoft Speech 技术之间的差异

转载作者：行者123 更新时间：2023-12-04 07:59:38

28

4

我希望编写一个应用程序，将语音到文本转换为仓库应用程序，反之亦然。主要用例是运算符(operator)将在仓库中佩戴耳机并将指令发送回服务器并从仓库软件接收指令以拣选和打包订单。我们将使用由 Windows Mobile 驱动的耳机，因此它可以记录语音指令并将其发送到服务器以解析为文本。

在了解了 Microsoft 的 Speech 技术后，我仍然不清楚该项目要考虑什么产品套件。我调用他们的销售热线，除了向我出售许可证之外，他们无法提供任何帮助。

有人可以阐明这些技术提供的内容以及它们涵盖的推荐场景吗？我发现 Microsoft 网站上的描述是重叠的，并且它们没有突出每种技术的独特使用场景。
http://www.microsoft.com/speech/developers.aspx

1) 统一通信管理 API

2) 语音服务器 2007

3)Tellme Studio

4) .NET 3.X 系统.语音

4)语音API(SAPI？)

提前致谢。

苏林德

最佳答案

您所描述的是 Speech Server 2007 的核心方案 - 将其视为 BizTalk for Speech - 即核心引擎 + 语音 API。

UC 的设计更多地围绕协作 - 它直接与 Exchange 集成，并允许向您朗读语音邮件等内容。

Tellme 基本上是云中的语音引擎，因此，如果您想要云托管语音，它就是您要走的路。

4 & 5 用于客户端开发，这不是您所描述的。

关于speech-recognition - 各种 Microsoft Speech 技术之间的差异，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3135545/

28

4

0

文章推荐： asp.net-mvc - 让 Uploadify 与 asp.net-mvc 一起工作

文章推荐： data-visualization - 在 power bi 中可视化上次刷新日期

文章推荐： apache-flex - Flex 4 中的 Halo 和 Spark 有什么关系？

css - (OOP 技术)继承与接口(interface) --- 相同的概念？---(CSS 技术)样式标签与样式类？
原谅那个疯狂的标题... 我试图理解面向对象编程中继承与接口(interface)的概念。所以我试图将它与我已经知道的东西联系起来，这就是 CSS。在 CSS 中，您可以选择在允许元素“继承”样式的
包装无符号二进制数据的 SWIG 技术
我有一个 C 函数，它返回一个表示二进制数据的 unsigned char*。我在文档中注意到 SWIG 有一个很好的类型映射来处理二进制数据作为 C 函数的输入，但是当 C 函数返回二进制数据及其无
java - 序列处理或解析的首选语言/技术
过去遇到过几次类似的问题，想知道用什么语言(方法)来解决类似的问题(我是J2EE/java开发人员): 问题:在一组可能的单词中，根据给定的规则(假设单词可以是 A 和 X 的组合，并且始终以 X 开
支持事务处理的 Java 技术
这个问题不太可能帮助任何 future 的访客；它只与一个小地理区域、一个特定时刻或一个非常狭窄的情况相关，而这些情况通常不适用于互联网的全局受众。如需帮助使这个问题更广泛地适用，visit the
.net - 内部框架与新的C#技术
如果我们已经开发了自己的ORM框架并且该框架在过去的几年中运行良好，那么为什么我们要为即将到来的软件项目学习和使用全新的.net技术，例如LINQ或Entity Framework或NHibernat
Delphi - 用于跟踪传播的访问违规的工具/技术
即使听起来很奇怪，我相信每个人在处理具有大量自定义组件的大型应用程序时都遇到过此类问题。某个地方生成了 AV，但应用程序仍在继续执行，稍后会出现错误。我不是在谈论多线程应用程序。只是关于通用的单线程应
.NET "Push"技术？
我正在设计一个新项目，我正在尝试找出将数据/事件从服务器应用程序推送到客户端应用程序(即 WPF 应用程序)的方法。我知道的两个是: 发布/订阅(即 NServiceBus) Full Duplex
网络托管和 websocket 技术
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 5年前关闭。 Improve thi
用于确定计算机是否使用电池供电的 C# 技术？
这个问题在这里已经有了答案: C# .NET: How to check if we're running on battery? (6 个答案) 关闭 9 年前。我发现许多 API 可以帮助确定
javascript - 制定基本日期(技术)
没有 JQUERY!我有一个下拉列表，用户可以在其中选择日期、月份和年份。我创建以下代码并使用 setFullYear 将这些值传递到变量中。有时我还会向这个变量添加天数，这就是变量 ev_num 的
c# - GetDeviceCaps 技术
我有一个控件，我想在表单和打印时以不同的方式绘制它。这是我做的方式: private void printDocument1_PrintPage(object sender, System.Drawi
opencv - 用于从扫描文档中提取字段的图像配准算法/技术？
我正在尝试确定从扫描文档中提取手写数据的最佳方法。手写数据位于特定的方框区域。我生成了文档的数字版本，因此我知道方框区域的坐标，并且如果需要还可以生成文档的其他变体(即被屏蔽以使字段更容易提取的版本
algorithm - 模式识别算法/技术
背景对于基于音乐的问题，我深表歉意，但细节并没有那么重要。我正在按顺序浏览一个 midi 文件，我正在寻找一种有效的方法来查找数据中的模式以找到称为连音符的东西。见下图: 连音符上方有数字(3 或
对象生命周期结束的 Java 技术
经验丰富的 Java 新手，寻求您的智慧: 如果无法确保在对象超出范围时执行某些特定的 block 代码，那么还有哪些其他方法可以提供相同的功能？(看起来 finalize 显然不是那个意思) 一个典
algorithm - 画笔冲压算法/技术
我正在玩一个小的油漆应用程序。我想创建不同的画笔提示(不仅仅是简单的线条)。基本思想是沿着鼠标移动重复(冲压)画笔 Nib 。因为鼠标移动不会为鼠标移动的每个像素分派(dispatch)所需的事件。我
java - 从对象的属性中找到重叠值的好算法/技术？
我正在制作时间表应用程序。重要的类是: Period id: int clazz: Clazz SubjectTeacher subject: String teac
java - 什么是减少Java冗长的好模式/技术
关闭。这个问题需要更多 focused .它目前不接受答案。想要改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this q
video - 同步发送小视频的最佳视频格式/编解码器/技术
我有一个奇怪的任务要解决。我们有一个小型视频窗口(如 300x200 像素，256 色调色板)和 44kHz 2ch 声音在服务器上播放。我们需要将此流视频发送给一些客户端(1,2.. 最多 10 个
scala - 为什么类型级计算需要 Aux 技术？
我很确定我在这里遗漏了一些东西，因为我对 Shapeless 还很陌生并且我正在学习，但是 Aux 技术实际上什么时候开始需要 ?我看到它是用来暴露一个 type通过将其提升为另一个“同伴”的签名来声
.net - 为什么微软仍然坚持使用 COM 技术
微软有什么理由仍然坚持使用 COM 技术(Office 组件仍然是 COM)……当所有用 COM 完成的事情都可以用 .Net 以更好、更有效的方式完成时最佳答案因为它需要一个长完全重写Offi

首页

博学

6Ren·AI

商城

speech-recognition - 各种 Microsoft Speech 技术之间的差异