gpt4 book ai didi

voip - 提取音频并将其注入(inject)正在进行的 VOIP 调用

转载 作者:行者123 更新时间:2023-12-01 22:50:01 28 4
gpt4 key购买 nike

在 VOIP 和与 VOIP 系统的集成方面,我非常陌生。

这是我正在尝试做的事情:

  • 来电者呼入,接线员接听电话。
    1.1。开始将调用者的音频流式传输到云中的分析服务。
  • 一旦执行了音频分析(通常在几秒钟内),运算符(operator)将按下“Hold”按钮以执行分析建议的操作。
    2.1。根据分析结果,将特定的音频文件回放给调用者,让他们知道接线员在等待时正在执行“x”、“y”或“z”。

  • 鉴于我没有使用 VOIP 系统的经验,我正在寻找可以为我指明正确方向的主题、领域、文章、技术的任何建议/指针。

    最佳答案

    我可以给出一些一般性的观点。我假设基于 SIP 的 VOIP 实际上无处不在(IMS、LTE、3GPP 等)。

    VOIP 有两个部分,您在搜索时可能会发现:

  • SIP (控制平面)
  • RTP (数据或有效载荷平面 = 音频)

  • 一般来说,有两种方法,一种来自点对点世界,其中媒体流的每一次变化都被传达给另一方,REFER 出于任何目的实际进行调用转移。但这通常不是首选的做事方式。这是第二种方法,它隐藏了 B 方(称为方)方面的任何变化。 中也使用了这样的东西IMS (这是现代 GSM 网络的背后)。诀窍是 A 方(调用方)实际上到达了 B 方代理。在 方面SIP ,是 B2BUA 又名背靠背用户代理。顾名思义,它涵盖了被叫方网络中发生的所有魔力。

    魔法实际上隐藏在 的背后。 B2BUA 它实际上表现为中间的实体,因此可以同时操纵 SIP RTP .

    因此这个实体实际上可以 fork 使用 的音频MGW (媒体网关)朝向“真正的”乙方(人类/运算符(operator)),并将音频定向到 ML / 人工智能 / 专家系统分析。此过程还包含适当的控制平面事件,例如启动分析过程附加、实际音频 fork ( RTP ) 以及触发 SIP 邀请 最后的乙方。每当分析结束时,就会向 上的某些“富”客户发送带外消息。 SIP 代理 (带软电话的电脑/平板电脑)或一些 客户关系管理 附加到调用中心系统的系统。此类消息应将分析结果告知乙方。

    所有的魔法都隐藏在 中B2BUA 或最终进入 SIP应用服务器这是各种服务的通用名称,例如调用中心代理的调用分配、语音邮件、IVR 等。

    语音分析今天在银行用于调用者验证、情绪分析和许多“智能”音频处理。

    在那个领域,有一些开源和专有的 SIP 系统。它们往往有点复杂。此外,与请求-响应系统(如 HTTP)相比,其逻辑大不相同。调用是一个带有“ session ”(调用〜调用ID)的有状态系统,一切都与此有关。

    希望这可以帮助你。

    关于voip - 提取音频并将其注入(inject)正在进行的 VOIP 调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54412437/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com