gpt4 book ai didi

audio - 哪些库/API 允许我访问电话的实时音频波形?

转载 作者:行者123 更新时间:2023-12-02 04:27:34 25 4
gpt4 key购买 nike

我正在寻找构建一个需要实时处理电话中传入音频的应用程序。
WebRTC 允许这样做,但我认为这仅适用于他们基于浏览器的 P2P 音频通信功能,但不适用于电话调用/VOIP。

Twilio 和 Plivo 允许您录制音频以进行批处理/稍后处理。

是否有一个库可以让我实时访问音频流?如果不是,我需要从头开始构建这样的服务吗?

谢谢

最佳答案

如果您愿意使用媒体服务器(因此调用不再是 P2P,而是由媒体服务器使用 B2B 模型进行调解),那么也许 Kurento Media Server可以解决你的问题。 Kurento Media Server 可以创建实时应用于媒体流的处理能力。 documentation中有很多例子计算机视觉和增强现实算法在视频流上实时应用。我从未见过纯音频处理模块,但只需创建一个附加模块即可轻松实现,如果您对 C/C++ 和媒体处理概念有所了解,这并不太复杂。

免责声明:我是 Kurento 开发团队的一员。

关于audio - 哪些库/API 允许我访问电话的实时音频波形?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26107343/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com