sapi - 使用 SAPI 将音频(wav 文件)转换为文本？-6ren

sapi - 使用 SAPI 将音频(wav 文件)转换为文本？

转载作者：行者123 更新时间：2023-12-04 14:43:23

24

4

我的任务是将不是来自人类直接语音的音频文件转换为文本。

例如，如果我将“Hello there”存储在 wav 文件中，它将把它转录成文本并在屏幕上显示“Hello there”字符串。

首选任何语言代码，但优先考虑 C#。

最佳答案

SAPI当然可以为所欲为。从进程内识别器开始，将音频连接为文件流，设置听写模式，然后开始。

现在是令人失望的一点。你可能不会得到非常好的结果；事实上，我怀疑除非你非常幸运，否则你可能会得到完全的垃圾。

有几个问题:

只有训练 SR 引擎后，听写才能真正发挥作用。如果你很幸运(像我一样)，你可以获得不错的结果，但如果说话者有口音，则必须进行培训。
训练仅适用于单个声音。如果您在单个音频文件中有多个扬声器，则效果不佳。
用于听写(和一般的语音识别)的音频模型假定您使用的是近距离麦克风(即麦克风紧挨着您的脸，以最大限度地减少噪音拾取)。如果您的 WAV 文件有额外的噪音，准确度会急剧下降。

Dragon Naturally Speaking Professional 支持转录，但仍需要训练和单一语音。 (我确实相信 DNS 具有适用于录音机的自定义音频模型。)我自己没有使用过它，所以我不知道它在您的情况下效果如何。

现在，如果您正在寻找特定关键字，其他人已经成功使用“音频挖掘”——运行识别器在音频流中寻找特定关键字

关于sapi - 使用 SAPI 将音频(wav 文件)转换为文本？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1738804/

24

4

0

文章推荐： java bean : difference between persistent field and persistent property?

文章推荐： CKEDITOR -- DOM 修改后无法恢复光标位置

文章推荐： curl - 'curl' 默认使用什么证书？

文章推荐： git - 如何为单个文件创建分支？

sapi - 使用 SAPI 将音频(wav 文件)转换为文本？
我的任务是将不是来自人类直接语音的音频文件转换为文本。例如，如果我将“Hello there”存储在 wav 文件中，它将把它转录成文本并在屏幕上显示“Hello there”字符串。首选任何语言
c# - SAPI 5.4 语法与 SAPI 5.1 兼容吗？
我在 C# 中为 win 7 编写了一个应用程序，它通过在 System.Speech 中使用 SharedRecognizer 使用 .NET 4.0 和 SAPI 5.4。一切都在那个环境中工作，
sapi - Sapi 5.4 和 Microsoft Speech Platform SDK 11 之间的区别
好的，我已经在 Windows 桌面开发论坛中提出了这个问题，但仍然没有得到答案。所以我会在这里尝试。 Microsoft Sapi 5.4 和 Microsoft Speech Platform S
Delphi SAPI 文本转语音
首先:这不是 Delphi and SAPI 的重复项。我对“SAPI in Delphi”主题有一个具体问题。我使用了 Delphi 2009 中出色的导入类型库指南来在组件选项板中获取 TspV
c# - SAPI 5语音合成和C#
我安装了新的 SAPI5 语音。在语音程序的计算机设置中，新语音可见并可供使用。但是我的程序找不到它。为了找到它，我正在使用这部分代码，我使用 System.Speech.Synthesis 命名空间
c++ - SAPI 费率公式评估
我已经创建了一个计算机语音，我想正确对待 rate 命令。 Microsoft 白皮书对费率 (https://msdn.microsoft.com/en-us/library/ms717037(v=
c++ - SAPI:应用程序不说话
请看下面的代码 main.cpp #define _ATL_APARTMENT_THREADED #include //You may derive a class from CComMod
C# SAPI - 识别没有预定义条件语句的短语
场景: 我有 2 个命令。 1) 在谷歌上搜索“这里有任何词” 2) 打开应用程序“这里有任何单词” 问题: 既然“Search Google for”后面的词可以是任何东西，我怎么知道我要为我的 I
windows - SAPI:语音转文本示例
我是 SAPI 的新手，如果你们中的任何人能给我一个演讲来用 SAPI 文本 Hello World 示例，我将不胜感激。我知道 MS 有一些例子，如“听写”等，但我想从一个非常小的例子开始。很高兴能
c++ - 在 SAPI 中说出进度事件
我正在尝试使用 Microsoft SAPI 编写文本转语音程序。为此，我有以下代码: ISpVoice * pVoice = NULL; int main(int argc, char* argv[
delphi - 将 SAPI 文本转语音本地化为西类牙语
我已经通过以下代码成功地在 Delphi/Lazarus 中使用 SAPI 文本转语音: procedure TForm1.Button1Click(Sender: TObject); var S
c# - 'SAPI 没有实现拼音选择' 异常
每当我尝试在我的笔记本电脑上编写任何语音识别程序时，我总是会收到如下所述的相同消息。我总是可以编译我的代码并让 Windows 窗体应用程序运行。但问题是，该程序将检测不到我的声音..程序无法运行..
c# - 如何使用 SAPI 进行语音转文本？
我想学习 C# 的 SAPI api 来进行语音到文本识别。我找不到任何教程。任何人都可以告诉我示例在哪里或可以在此处显示吗？它需要支持从网络摄像头麦克风获取语音。谢谢。最佳答案 API 文档
c# - 使用 SAPI 将语音转换为文本
有没有人知道如何使用 Microsoft 的 Windows 窗体应用程序语音识别 API 进行 STT？最佳答案 .NET 包含一个用于语音识别的程序集。您需要添加对的引用 System.Spe
c++ - 文字转语音 SAPI 语音
有人能帮帮我吗？我使用 SAPI 语音文本，但我不能设置女声，这是代码，它用男声说话，但我想改变它，我想要女声 #include "stdafx.h" using namespace std; voi
javascript - SAPI 和 JavaScript
我正在网上搜索如何通过 javascript 使用 SAPI 语音识别。更具体地说，我想创建一个可以在本地服务器(可能无法访问互联网)上运行的 Web 应用程序，它将文本转换为语音。我找到了一些例子
c++ - 让 Sapi 说出一个字符串
我有一个程序要求一个人将他们想要翻译成 Al Bhed 的文本，这只是一种将字母四处移动的密码，并让 SAPI 说出来。字符串翻译得很好，但是这段代码: hr = pVoice->Speak(sTra
c++ - SAPI 音频平衡/声像选项
我正在探索在 Windows 7 Embedded 平台上同时运行的两个独立 Win32 应用程序的选项，以将它们的音频输出到音频输出设备的相应 channel (即应用程序“A”使用左声道，应用程序
c# - 检测所有已安装的 SAPI 语音
当我在 C# 中使用 SpeechSynthesizer 类时，我在系统中安装了所有语音。当我在 C++ 中使用基于 COM 对象的 SAPI 时，我只得到其中的 4 个(Microsoft Anna
windows - 我可以直接使用 SAPI 将语音从存储的音频实时转换为文本吗
我真正想要实现的是这个-->假设我播放一个音频文件(使用我的应用程序)，它可以从互联网流式传输/或直接从本地存储访问。现在我想将 SAPI 配置为收听此源而不是麦克风，并像往常一样将语音从音频转换为文

首页

博学

6Ren·AI

商城

sapi - 使用 SAPI 将音频(wav 文件)转换为文本？