gpt4 book ai didi

audio - 音频转换器如何工作?

转载 作者:行者123 更新时间:2023-12-03 01:44:17 24 4
gpt4 key购买 nike

我目前有在 C# 或 Python 中编写一个小型音频转换器(例如 FLAC 到 MP3 或 m4a 格式)应用程序的想法,但我的问题是我根本不知道音频转换是如何工作的。

经过研究,我听说了模数/数模转换器,但我想这将是数模或类似的东西,不是吗?

如果有人能准确地解释它是如何工作的,将不胜感激。

谢谢。

最佳答案

数字音频被称为 PCM,它是任何音频处理系统的基本原始音频格式......它未压缩......只是一系列整数,表示曲线的每个样本的音频曲线的高度(时间是 Y 轴)沿这条曲线的 X 轴)
...此 PCM 音频可以使用一些编解码器进行压缩,然后通常与视频或元数据 channel 一起捆绑在一个容器中...因此要将音频从 A 转换为 B,您首先需要了解容器规范以及压缩音频编解码器,因此您可以将音频 A 解压缩为 PCM 格式...然后执行相反的操作...将 PCM 压缩为 B 的编解码器,然后将其捆绑到 B 的容器中
在进一步探索之前,我建议您掌握 WAVE 音频文件的艺术...... WAVE 的美妙之处在于它只是一个 44 字节的 header ,后跟音频曲线的未压缩整数......然后编写一些代码来读取 WAVE 文件解析 header (识别位深度、采样率、 channel 数、字节序)以使您能够遍历每个 channel 的每个音频样本...通过将字节发送到输出 WAVE 文件来证明其工作... diff input WAVE反对输出WAVE,因为它们应该是相同的......一旦掌握了你就可以冒险进入上述目标......不要跳过交错立体声音频以及展开具有位深度的单个音频样本的概念在两个字节的存储中使用 16 位,反之亦然,即将多个字节拼接成一个位深度为 16、24 甚至 32 位的整数,同时保持字节序平方……这乍一看可能听起来很吓人,但所有必要的细节在...上网络是我如何自学这种详细程度的
现代音频压缩算法利用人们如何感知声音的知识来丢弃难以辨认(有损)的信息,而不是保留源的所有信息负载的无损算法......作品(http://opus-codec.org/)是当前最受欢迎的编解码器,不受专利并且是开源的

关于audio - 音频转换器如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44888430/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com