gpt4 book ai didi

visual-studio - 使用音频文件作为输入的UWP应用上的文本语音转换

转载 作者:行者123 更新时间:2023-12-03 00:38:59 24 4
gpt4 key购买 nike

我在网上找不到这个问题的答案时遇到麻烦。

我正在开发的项目要求我可以保存录制的音频文件,然后将音频转录为文本,以查找有趣的预定义关键字。

我正在使用Windows.Media.SpeechRecognition框架,当您在录制过程中录制语音时,它可以正常工作。在同一框架中,我找不到可以与音频文件一起用作输入的功能。

有人知道这个问题的好方法吗?还是Windows Apps的另一个[免费]框架?

最佳答案

对于在线识别,尤其是在JS项目中,您可以直接使用Microsoft Cognitive Services,后者在Windows的SpeechRecognition中位于在线识别之后。它在某些限制下是免费的。

特别是在GitHub上为JavaScript包装的开源代码:Oxford.Speech.JS。它可以处理wav文件和麦克风。示例代码的设计类似于网站,但是我敢肯定,您可以轻松地将其转换为基于HTML / JS的UWP应用。

关于visual-studio - 使用音频文件作为输入的UWP应用上的文本语音转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37118005/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com