- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在开发 mp4 容器解析器,但我正在疯狂地尝试识别流的音频编解码器。我同时使用了 QtAtomViewer 和 AtomicParsley,但是当我找到原子时:
trak->mdia->minf->stbl->stsd
即使 mp4 文件有 mp3 流,我也总是得到“mp4a”。
我应该寻找“.mp3”fourcc 吗?
我附上两个不同的mp4结构:带有 AAC 音频流的 mp4 容器
Atom trak @ 716882 of size: 2960, ends @ 719842
Atom tkhd @ 716890 of size: 92, ends @ 716982
Atom mdia @ 716982 of size: 2860, ends @ 719842
Atom mdhd @ 716990 of size: 32, ends @ 717022
Atom hdlr @ 717022 of size: 33, ends @ 717055
Atom minf @ 717055 of size: 2787, ends @ 719842
Atom dinf @ 717063 of size: 36, ends @ 717099
Atom dref @ 717071 of size: 28, ends @ 717099
Atom stbl @ 717099 of size: 2727, ends @ 719826
Atom stts @ 717107 of size: 24, ends @ 717131
Atom stsz @ 717131 of size: 1268, ends @ 718399
Atom stsc @ 718399 of size: 40, ends @ 718439
Atom stco @ 718439 of size: 32, ends @ 718471
Atom stss @ 718471 of size: 1264, ends @ 719735
Atom stsd @ 719735 of size: 91, ends @ 719826
Atom mp4a @ 719751 of size: 75, ends @ 719826
Atom esds @ 719787 of size: 39, ends @ 719826
Atom smhd @ 719826 of size: 16, ends @ 719842
带有 mp3 音频流的 mp4 容器
Atom trak @ 1663835 of size: 4844, ends @ 1668679
Atom tkhd @ 1663843 of size: 92, ends @ 1663935
Atom mdia @ 1663935 of size: 4744, ends @ 1668679
Atom mdhd @ 1663943 of size: 32, ends @ 1663975
Atom hdlr @ 1663975 of size: 45, ends @ 1664020
Atom minf @ 1664020 of size: 4659, ends @ 1668679
Atom smhd @ 1664028 of size: 16, ends @ 1664044
Atom dinf @ 1664044 of size: 36, ends @ 1664080
Atom dref @ 1664052 of size: 28, ends @ 1664080
Atom stbl @ 1664080 of size: 4599, ends @ 1668679
Atom stsd @ 1664088 of size: 87, ends @ 1664175
Atom mp4a @ 1664104 of size: 71, ends @ 1664175
Atom esds @ 1664140 of size: 35, ends @ 1664175
Atom stts @ 1664175 of size: 24, ends @ 1664199
Atom stsc @ 1664199 of size: 28, ends @ 1664227
Atom stsz @ 1664227 of size: 2228, ends @ 1666455
Atom stco @ 1666455 of size: 2224, ends @ 1668679
谢谢有限元
更新:
我找到了解决问题的方法:通过观看 AtomicParsley 的代码,我发现可以得到有关流原子 (mp4a) 的编解码器信息,读取第 11 个字节进入 esds(基本流描述)原子。
现在我正在这样工作:
如果第 11 个字节的值是 0x40,我假设流是 AAC,否则如果我读取 0x69,我假设流是 MP3。
我不喜欢这些“经验”解决方案,所以我正在寻找更正确的解决方案方式,但我只找到 Understanding_AAC这并不完整。
有人知道在哪里可以获得 MP4 容器的更详细规范吗?
最佳答案
在“esds”原子中,有一些与确定编解码器相关的字段。 esds 原子内容的第一个字节是 objectTypeInduction
(这是解决方案中的第 11 个字节)。该字段应该指示所使用的编解码器,但有一些条目被多个编解码器使用。 MP4RA 有一个 full list of codec values 。以下是与本例相关的一些内容:
0x6B
和 0x69
分别表示 MPEG-1 和 2 层 1、2 和 3。0x67
表示 MPEG-2 AAC LC,但通常不使用 0x040
(0x66
和 0x68
也是 MPEG-2 AAC 配置文件,甚至很少出现)。 0x40
表示 MPEG-4 音频。 MPEG-4 音频通常被认为是 AAC,但 MPEG-4 音频中有一个完整的音频编解码器框架,包括 AAC、BSAC、ALS、CELP 和 MP3On4。 MP3On4 是一种 MP3 变体,带有一些新的多 channel header 信息。
我们可以通过查看 AudioSpecificConfig
来了解 MPEG-4 音频中实际的音频格式。这是解码器的全局 header ,存在于“esds”原子内容的字节 13 处。在AudioSpecificConfig
的开头有一个5位AudioObjectType
。可以在多媒体 wiki 上找到完整列表(在您的帖子中的“MPEG-4 音频”文章下链接:http://wiki.multimedia.cx/index.php?title=MPEG-4_Audio 但以下是有用的值:
如果您不担心“MP3On4”mp3 变体或其他奇怪的 MPEG-4 音频编解码器,那么只需使用 objectTypeInduction
。
在 MPEG 规范中,这些详细信息分布在 14496-1、-12、-14 和 -3 中。其中只有 14496-12 是免费提供的:http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html
关于audio - mp4atom - 如何区分音频编解码器?是 AAC 还是 MP3?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3987850/
我有一个小型WordPress网站。我做了很多音频工作,并且试图在WordPress的博客条目中发布HTML5音频剪辑。由于某种原因,它不起作用。它可能与我在WordPress网站上使用的样式有关,但
我在让 html5 标签与 Web Audio API .createMediaElementSource() 方法配合使用时遇到问题。请参阅下面的 jsFiddle/代码。任何想法这里出了什么问题将
我尝试安装ffmpeg $ brew install ffmpeg 并运行 ffmpeg $ ffmpeg -i audio.m4a -ar 8000 -ab 12.2k audio.amr 我收到以
我已使用Web Audio API中的getByteFrequencyData方法使用了来自Analyzer节点的FFT数据来创建频谱可视化器,如下所示: 在这种情况下,我有256个数据箱。这个数字到
Google VR刚刚为wwise制作了一个VR插件: https://developers.google.com/vr/audio/wwise-getting-started https://git
如何将新记录追加到现有记录中的选定位置或特定位置? 例如,有一个5秒的录制,我想再次录制,但是将此录制追加到先前录制的特定位置,说出来:在3秒钟的录制长度之后追加此录制。 最佳答案 您可以使用getC
我们基于 Raspberry Pi 和 omxplayer 构建简单的网络控制视频播放器。我们遇到的问题是任何使用 ffmpeg 转码的文件都有音频不同步。在 iPad 上制作并直接上传到 Pi 的视
我正在尝试了解Web Audio API的引入对基于Web的游戏的开发意味着什么。 Flash游戏当然可以执行一些相当高级的音频处理,对于简单的游戏,音频元素也许就足够了。但是Web Audio AP
我已经在如何用简单的音频引擎循环播放声音效果方面进行了广泛的搜索,但是在cocos2d论坛上除了hello with looping sfx之外,它并没有取得太大进展,因为它存在多个问题。如何在Sim
我的任务是打开一个扩展名为 mka 的现有音频文件(Matroska 容器)并提取原始音频数据。 This示例仅显示了从 mp2 文件中提取原始数据的示例。我不知道如何使用 mka 容器执行此操作。我
我是Lync 2013 SDK的新手(现在已经使用了几周),并且能够弄清除此以外的大部分东西…… 当我加入 session 时(使用ConversationManager.JoinConference
我好奇。如何实现有史以来最简单的音频引擎?我有一些类似使用默认音频设备的音频数据流的想法。玩了很多 RtAudio,我认为如果可以放弃一些功能,这是可能的。有人知道从哪里开始吗? 最佳答案 我会这样做
我一直在玩网络音频API。 我正在使用getByteFrequencyData来显示频带的分贝数据,但是我想更改显示频带的整个范围,因为现在重要的音频都被压缩为一对频带。 有关如何执行此操作的任何想法
我想在音频 session 以NAudio开始和结束时接收回调。以下代码正在运行: private void SetupMediaSessionCallbacks() {
我可以用trackPosition,offset以某种方式记录并输出到WAV。当在浏览器中播放时,它工作正常,我只想输出到WAV文件。 for (var i = 0; i 0) {
在哪种情况下,我们可以不将Google Resonance Audio SDK与耳机配合使用,而应将其与真实的扬声器配合使用(例如,安装在360°的音圈设置中)? 还是所有算法都不适用于真实的扬声器输
AudioPannerNode是一个处理节点,用于在三维空间中定位/空间化传入的音频流。有没有一种方法可以将其用于常规LR平移,请记住它使用3D笛卡尔坐标系与侦听器结合使用,该侦听器的位置和方向与平移
我有一个带有两个源的音频对象,分别为M4A和OGG格式。 代码如下: 然后,我可以调用document.getElementById('audio1')。play()并开始播放。 它适用于所有
我正在尝试构建一个允许将时间/节奏(可能是音高)输入到 Web 音频振荡器节点的界面。实际上创建了一个“步进音序器”。 为 Web Audio API 振荡器节点触发预定 NoteOn 的最佳方式是什
是否可以使用 Core Audio 以亚毫秒级延迟播放声音? 我尝试过使用具有不同大小和缓冲区数量的 AudioQueues,也尝试过使用 AudioUnits,但我一直无法将延迟降低到 30 毫秒以
我是一名优秀的程序员,十分优秀!