gpt4 book ai didi

speech-recognition - 各种 Microsoft Speech 技术之间的差异

转载 作者:行者123 更新时间:2023-12-04 07:59:38 28 4
gpt4 key购买 nike

我希望编写一个应用程序,将语音到文本转换为仓库应用程序,反之亦然。主要用例是运算符(operator)将在仓库中佩戴耳机并将指令发送回服务器并从仓库软件接收指令以拣选和打包订单。我们将使用由 Windows Mobile 驱动的耳机,因此它可以记录语音指令并将其发送到服务器以解析为文本。

在了解了 Microsoft 的 Speech 技术后,我仍然不清楚该项目要考虑什么产品套件。我调用他们的销售热线,除了向我出售许可证之外,他们无法提供任何帮助。

有人可以阐明这些技术提供的内容以及它们涵盖的推荐场景吗?我发现 Microsoft 网站上的描述是重叠的,并且它们没有突出每种技术的独特使用场景。
http://www.microsoft.com/speech/developers.aspx

1) 统一通信管理 API

2) 语音服务器 2007

3)Tellme Studio

4) .NET 3.X 系统.语音

4)语音API(SAPI?)

提前致谢。

苏林德

最佳答案

您所描述的是 Speech Server 2007 的核心方案 - 将其视为 BizTalk for Speech - 即核心引擎 + 语音 API。

UC 的设计更多地围绕协作 - 它直接与 Exchange 集成,并允许向您朗读语音邮件等内容。

Tellme 基本上是云中的语音引擎,因此,如果您想要云托管语音,它就是您要走的路。

4 & 5 用于客户端开发,这不是您所描述的。

关于speech-recognition - 各种 Microsoft Speech 技术之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3135545/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com