gpt4 book ai didi

javascript - 如何在 js Web 应用程序中获取音频或视频通话的记录? IE。如何将 MediaStream 路由到语音到文本 API

转载 作者:行者123 更新时间:2023-12-04 15:03:40 25 4
gpt4 key购买 nike

我想制作一个通过实时转录进行视频通话的网络应用程序——使用一些第三方语音到文本服务(例如谷歌或亚马逊)。所以点对点的媒体流将被播放给用户,并被发送到 API 进行转录。
我目前正在使用 https://peerjs.com/创建点对点调用。
这可行吗?我可以使用任何代码示例或库吗?
谢谢你,丹尼尔

最佳答案

我认为它可以很容易地完成
Azure speach to text service ,也许可以使用其他解决方案,但是对于 Azure,我能够快速找到所有部分。
有浏览器用例示例Here
This line负责从麦克风获取音频源,但在您的情况下更有趣的是使用:fromStreamInput函数,它接受 MediaStream。
我还想知道执行这个过程的更好的地方是什么:

  • 在源机器上,将音频发送到接收器和 speachSDK,然后在获得转录后发送。
  • 在接收器机器上,在接收到使用 SDK 获取转录后,在这种情况下,由于在传输过程中被压缩,音频质量可能会更差,因此您可能会得到更差的转录。

  • 然而,这很容易被测试。

    关于javascript - 如何在 js Web 应用程序中获取音频或视频通话的记录? IE。如何将 MediaStream 路由到语音到文本 API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66546510/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com