gpt4 book ai didi

java - 是否有用于监听音频命令的 Kotlin 或 Java 库? (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示)

转载 作者:行者123 更新时间:2023-12-02 22:48:13 26 4
gpt4 key购买 nike

目标:

  • 在低端设备上(树莓派 3)
  • 聆听一组固定的音频短语命令(我的“Hey Google”或“Hey Siri”版本)
  • 这可能是一个非常有限的词汇表(少于 10 个命令)
  • 检测到命令时触发 Kotlin 函数。
  • 无需使用大量 CPU 或大量网络带宽。

  • AFAIK 现代边缘设备(Echo、智能手机、Google Home 等)具有非常精美的硬件+软件解决方案,使它们能够连续收听关键字而不会占用大量 CPU,也无需将所有音频发送到云服务器.我也想要同样的,但我不确定这是否可能——我确信他们训练了他们最小且高效的“Hey Siri”ML 模型来处理各种口音、音量、节奏、年龄、背景噪音, ETC。
  • Java Speech API (JSAPI) 似乎... 不确定。许多示例都是旧的,或者指向不受支持的库,或者最终使用了 Google Cloud Speech。
  • 这不是 作为一个 Java/Kotlin 库,我还可以包装一个 native 命令监听器进程。
  • 我正在查看 ML Kit 和 Firebase ML,但没有看到音频到命令的转换。
  • 如果我能调整灵敏度,那将是最好的,戴着面具的 child 大喊“TWIC R TREET”或“TMURMP ... TWEEF”或其他任何应该做的事情。
  • ...但不是纯粹的音量检测器,开车经过的汽车不应该触发它。

  • 有什么建议么?或者问一个rpi是不合理的?

    最佳答案

    您可以使用像 CMU Sphinx 这样的库离线工作,不需要其他在线服务器。
    有时,公认的结果是相当不准确的。为了解决这个问题,我使用了一个比默认提供的字典小得多的字典。我从未在 Raspberry Pi 上对其进行过全面测试,但我认为它应该可以工作。

    关于java - 是否有用于监听音频命令的 Kotlin 或 Java 库? (想要在 child 大喊 'TRICK OR TREAT' 时触发万圣节显示),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63853946/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com