gpt4 book ai didi

android - 拆分 AAC 流、启动/填充样本问题(无缝播放)

转载 作者:行者123 更新时间:2023-11-29 01:13:20 25 4
gpt4 key购买 nike

我正在使用 Android 的 MediaCodec API 将原始音频编码为 AAC。问题:我需要以一秒为单位向服务器发送 AAC 流。所以我需要拆分流。现在,由于 AAC 帧是 1024 个样本,我为每个 block 采用 round(SAMPLE_RATE/1024) AAC 帧。然而,由于“启动样本”,这种简单的 AAC 流切割不起作用。更多细节如下。将 block 发送到服务器后,客户端在网络浏览器 Chrome 中接收它,并使用 Web Audio API 播放所有接收到的 block 。播放以无间隙的方式完成:最初分配一个大的音频缓冲区,接收到的 block 被解码并复制到音频缓冲区中,播放音频缓冲区。 现在,这不适用于 AAC(尽管它适用于 Ogg/Vorbis)。使用 AAC,我在生成的声音中有伪影。在每一秒结束时,下一秒的开始为零,然后,波形逐渐增长,直到达到正常大小。这持续 10、20 毫秒。 我相信问题是由缺少 "priming samples" 引起的.也许 Web Audio API 期望在每个 AAC block 的开头有“启动样本”,但它没有找到它们,因此修改了实际音频。

问题是:如何拆分原始 AAC 流并发送一秒钟的“好”AAC block ?据我了解,我应该在每个 block 的开头包括前两帧(前一个 block 的最后两帧)。但是,这个数字应该有所不同,并且没有太多文档。一些专家建议表示赞赏。

最佳答案

我正在使用以下方法。我不是 AAC 专家,所以我可能遗漏了一些东西,但在实验上它是有效的。假设 Chrome 解码器期望在每个 block 的开头启动样本,我执行以下操作:在将 block 发送到服务器之前,我在其开头添加前一个 block 的最后 4 个 AAC 帧(如果它是我的第一个 block 不要这样做)。在客户端,我检索了一个 block ,对其进行解码并删除了前 4*1024 个样本(1024 = 一个 AAC 帧中的样本)。这是有效的。

关于android - 拆分 AAC 流、启动/填充样本问题(无缝播放),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41493318/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com