gpt4 book ai didi

amazon-web-services - 在通话期间提供反馈的 Amazon Transcribe/Lex

转载 作者:行者123 更新时间:2023-12-01 04:23:44 26 4
gpt4 key购买 nike

我是 AWS 服务的新手,我们想要构建一个简单的演示来检测一个特殊的词,并且:[1] 触发一个 Action [2] 响应(作为通话期间的语音)。
例如,如果用户说:“帮助”,我想回复“确定”并进行操作(AWS lambda)。
我们正在使用 Twilio,并且 Twilio 应该流式传输音频。
据我所知,我有两个选择,Android Lex 和 Transcribe,当 Lex 用于机器人和转录时,只能翻译语音而不能参与对话。
所以问题是:

  • 当特殊词被识别并参与对话时,我应该使用什么服务来触发操作?
  • 我可以通过 Twilio 将调用直接流式传输到 AWS 服务吗?

  • 编辑
    更清楚地说:通信将与两个人实时进行,当有人说“帮助”时,我想在他们通话时插话我想在对话中添加机器人语音并说“好”,例如“

    [Person 1]: Hi, how are you

    [Person 2]: HELP ...

    [BOT]: OK (like a third person in a conference call..).

    最佳答案

    在他们介入帮助之前,我并不完全清楚与用户发生的交互。他们是在收听机器人、媒体文件、TTS 还是与其他人实时交流?

    对于实时分析,您需要使用 Twilio Media Streams,它将语音对话流式传输到一项服务,然后该服务可以近乎实时地将语音转换为文本,查找关键字,然后根据这些关键字以编程方式执行某些操作。

    将 Twilio Media 流与 Lex 结合使用的示例:

    Use Amazon Lex as a conversational interface with Twilio Media Streams

    关于amazon-web-services - 在通话期间提供反馈的 Amazon Transcribe/Lex,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59702058/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com