gpt4 book ai didi

python - Azure 认知服务的语音服务 (SST) 支持哪些音频格式?

转载 作者:太空宇宙 更新时间:2023-11-04 00:13:45 25 4
gpt4 key购买 nike

请记住,据我所知,Microsoft/Azure 认知服务的“语音服务”目前正在进行合理化工作

https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text

https://learn.microsoft.com/en-us/azure/cognitive-services/speech/home

只有 .wav 二进制文件是可接受的,其他任何给出响应:

{"Message":"Unsupported audio format"}

有没有其他方法可以发现可接受的音频格式/编码等,或者就是这样?

[关于在 python pydub 中预处理任意/.m4a 音频格式的提示的奖励积分,以便它们符合标准 - 目前适用于 .mp3 但不适用于 .m4a]。

谢谢!

最佳答案

目前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz .将来会添加更多格式和编解码器支持。

关于python - Azure 认知服务的语音服务 (SST) 支持哪些音频格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51614216/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com