gpt4 book ai didi

speech-recognition - 语音到文本的大型音频文件 [Microsoft Speech API]

转载 作者:行者123 更新时间:2023-12-03 22:16:04 29 4
gpt4 key购买 nike

使用 Microsoft Speech API 转录中/大型音频文件(每个文件约 6-10 分钟)的最佳方法是什么?像批处理音频文件转录这样的东西?

我使用了 https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample 中提供的代码,用于连续转录语音,但它在某个时候停止转录。转录有什么限制吗?我只使用免费试用帐户 atm。

顺便说一句,我认为 Bing Speech API 和新的 Speech service API 之间没有区别,对吧?

谢谢大家!

最佳答案

感谢您的反馈意见。

我同意样本(以及您正在查看的文档)不是很清楚,我们会尽快更新。

示例使用 RecognizeAsync,应该调用 RecognizeOnceAsync。它目前只是试图从服务返回 FIRST FinalResult。您应该使用 Start/StopRecognizeAsync,并注册以接收 Result 事件。

再次,对于这里糟糕的文档,我们将很快更新,并且可能会在刷新时重命名 API。

如果您有音频文件,您还可以使用批量转录功能。也许这有帮助? https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

干杯沃尔夫冈

关于speech-recognition - 语音到文本的大型音频文件 [Microsoft Speech API],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50796434/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com