gpt4 book ai didi

audio - 声音样本识别库/代码

转载 作者:行者123 更新时间:2023-12-01 01:16:28 24 4
gpt4 key购买 nike

我不想要声音到文本的软件。我需要的是以下内容:

  • 我将录制多个(比如 50 多个)音频流(广播电台的录音)
  • 从这些录音中,我会标记有趣的音频剪辑——它们的长度范围从 2 到 60 秒——会有几千个这样的音频剪辑
  • 库应该能够从录制的声音流中找到相同音频剪辑的其他实例
  • 应将置信因子报告给使用的并提供额外的输入,以便下次识别可以更好地执行

  • 你知道这样的软件库吗? LGPL 对我来说最有值(value),但我也可以申请商业许可。

    音频剪辑将包含音乐、文本、效果或其任意组合。所以,文本识别是不可能的。

    体系结构:c++,C# 用于胶水,如果可能的话,使用 CUDA。

    最佳答案

    我还没有找到任何图书馆(还),但是有两篇有趣的论文,它们可能会给你提供术语和背景来优化你的搜索:

  • Audio Fingerprinting for Broadcast Streams
  • Audio Segment Retrieval using HMM

  • 编辑:搜索“音频指纹”来到了一个实现页面,包括开源和商业。
  • http://wiki.musicbrainz.org/AudioFingerprint
  • Picard似乎已经建立良好,如果您的剪辑包含音乐,可能会很有用。

  • 这是一个 introduction to Audio fingerprinting

    关于audio - 声音样本识别库/代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2817663/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com