gpt4 book ai didi

python - 这是什么音频数据类型,如何将其转换为wav/l16?

转载 作者:行者123 更新时间:2023-12-03 00:27:25 24 4
gpt4 key购买 nike

我正在Web浏览器中录制音频并将其发送到Flask后端。从那里,我想使用Watson Speech to Text转录音频。我无法确定我接收音频的数据格式以及如何将其转换为适用于Watson的格式。

我相信Watson希望像b'\ x0c \ xff \ x0c \ xffd这样的字节串。我从浏览器接收到的数据看起来像[-4 -27 -34 -9 1 -8 -1 2 10 -28],由于负值,我无法将其直接转换为字节(使用bytes()给我该错误)。

我真的不知所措,我需要在这里进行哪种转换。 Watson不会为我抛出的任何类型的数据返回任何错误,只是没有响应。

最佳答案

这些值应该没问题,但是在获取它们的字节表示形式之前,您必须定义如何存储它们。

您只想将这些值转换为带符号的2字节/ 16位整数,然后获取这些值的字节表示形式。

关于python - 这是什么音频数据类型,如何将其转换为wav/l16?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55599385/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com