- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一些自动化测试尝试使用 Android 的 MediaDecoder
和 MediaExtractor
将一些 m4a 文件解码为 PCM 数据。这些文件是用各种编码器生成的:fdk-aac , ffmpeg(使用 fdk 或默认的 aac 编码器),iOS。
在 Android 9 上,使用 ffmpeg
创建的剪辑测试失败,导致 PCM 文件为空。相同的剪辑在旧版 Android 上可以正常解码。
我仔细检查了我的代码,解码过程按预期进行:
MediaExtractor
提取压缩数据问题是,当最后一个可用输入缓冲区入队并且带有 MediaCodec.BUFFER_FLAG_END_OF_STREAM
的输出缓冲区出队时,所有输出缓冲区都是空的!
然后我注意到使用 MediaExtractor.getTrackFormat(int track)
从音频文件中提取的 MediaFormat
信息包含一个未记录的 "encoder-delay"
键。
对于 android 8 及更低版本,该 key 仅适用于使用 iTunSMPB
标签信息编码的 m4a 剪辑。以下是我为测试文件获得的值的摘要:
iOS-encoded file: 2112 frames
fdkaac with iTunSMPB tag: 2048 frames
fdkaac with ISO delay info: key not present
ffmpeg: key not present
ffmpeg (fdk): key not present
在 Android 9 上,我得到以下结果:
iOS-encoded file: 2112 frames
fdkaac with iTunSMPB tag: 2048 frames
fdkaac with ISO delay info: 2048 frames
ffmpeg: 45158 frames
ffmpeg (fdk): 90317 frames
看起来有些东西发生了变化,MediaExtractor
现在能够检索所有被测文件的编码器延迟。这在理论上是好的,因为没有 "encoder-delay"
信息的文件在解码的 PCM 数据中确实显示延迟(这是一个已知问题)。
但是...虽然 "fdkaac with ISO delay info" 情况的值是正确的并且导致没有初始填充的有效 PCM 文件(终于!),但 ffmpeg 的值-生成的文件看起来很大而且可能是错误的!
我知道对于 ffmpeg 情况,实际编码器延迟值为 1024,对于 ffmpeg (fdk) 情况,实际编码器延迟值为 2048,我认为 key in 的高值提取的格式是文件为空的原因。
事实上,如果我在将格式传递给 MediaCodec.configure(...)
之前尝试将格式中的 "encoder-delay"
键设置为 0,我以预期的延迟获取正确的未压缩数据。
此时我的猜测是 MediaExtractor
编码器延迟值检索有一些错误,但也许我忽略了一些事情。
由于 ffmpeg 非常流行,我的应用程序用户很可能会尝试导入使用它生成的文件,此时我看不到该问题的万无一失的解决方案。
有人有建议/解决方法吗?
最佳答案
我在 android 问题跟踪器上打开了一个问题: https://issuetracker.google.com/issues/118398811
现在我只是实现了一个解决方法:当“编码器延迟”值出现在 MediaFormat
对象中并且它是一个不可能高的值时,我只是将它设置为零。像这样的东西:
if (format.containsKey("encoder-delay") && format.getInteger("encoder-delay") > THRESHOLD) {
format.setInteger("encoder-delay", 0);
}
注意:这意味着初始间隙不会被消除,但对于没有此类信息的 M4a 文件,在 android-9 之前的设备上已经存在这种情况。
关于Android 9 AAC 解码器使用 ffmpeg 编码文件输出零样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52946610/
令我惊讶的是,dart 没有内置的对象到 json 和 json 到对象的映射器。 我读到我们必须自己手动编写映射代码,这并不令人愉快。 无论如何,虽然我没有针对我的用例对其进行彻底测试,但我发现了
我有 16 位 PCM 音频,我想将其转换为 8 位 PCMU。据我所知,16 位到 8 位的转换很容易 - 只需从每个样本中删除最后 8 位即可。 我想知道如何将8位pcm转换为8位pcmu?任何文
我的任务是使用动态霍夫曼修改 JPEG 格式。所以我试图找到用Java编写的简单Jpeg解码器的源代码。谁能帮我? 最佳答案 看看这个:http://www.dreamincode.net/forum
我收到错误代码(如下),并且无法解码该字符串,我知道它正在查找 JSON 和我也保存的文件,但它无法解析。错误代码: Unexpected token VALUE(-10) at position 8
我制作了这个程序,它是一个随 secret 码。 public class SaadAbdullahCipher { private char[] alphabet = {'a', 'b'
总的来说,我对编程还很陌生,我想知道如何对输入的文本进行编码/解码。 对于 ex A -> D,所有字母必须减去 3 个字母B -> E等等 我将输入一些伪代码作为示例: INPUT MESSAGE:
是否有内置函数或受支持的包中的函数来获取基于输入字符集字符串,例如 ISO-8859-1 或 ISO-8859-15?现在我看到的唯一方法是自己匹配它: func getEncoderForChars
我是新来的。不知何故,我能够理解如何做到这一点。 我在下面做,但它给出了错误 - 无法读取数据,因为它的格式不正确。有人可以帮助我吗?从过去的 4 天开始,我一直坚持这一点。我真的很感激。 impor
就像标题所说,我正在尝试为一个我定义的类的对象编写一个自定义解码器,该对象包含我定义的类的其他对象。 “外部”类是一个 Edge,定义如下: class Edge: def __init__(
我想重新编码音频文件的音频流。以下gstreamer管道可以正常工作: gst-launch-1.0 filesrc location=input.flac ! decodebin ! audioco
使用Swift4、iOS11.1、Xcode9.1, 尝试匹配 Swift4 的可编码结构中的 JSON 文件,我遇到以下问题: 这是我的代码: struct Station: Codable {
正如标题所示,我正在寻找遵循 1.3 版本的 Java(+Android) WBXML 解析器/解码器。如果有必要的话,我什至可以考虑调用 native 代码。谢谢。 最佳答案 我确实记得不久前我使用
当 JABX 解码器尝试解码 xml 时,我遇到以下错误 线程“main”中出现异常 javax.xml.bind.UnmarshalException - 带有链接异常:[org.xml.sax.S
我正在处理不同尺寸(x,y)的图像。当在 MaxPooling2D 之后使用 UpSampling2D 时,它不能很好地重建它,因为 x-dim 不等于 y-dim。当 x=y (例如 28x28)时
http://www.lotterypost.com/js-compress.aspx 这个网站非常适合压缩 JS 但我想解码.... 除了在线之外,有没有最好的免费工具来编码/解码 Js 最佳答案
我刚刚在验证 JWT 时遇到了问题。我正在运行的代码是一个相当肮脏的黑客,它采用 JWT 的第二个组件并通过 Base64 解码器运行它。然而事实证明,通过一些 super 特殊的 JWT,我得到了一
我正在尝试使用 CUDA 解码器项目中的代码将解码后的图像文件保存回 BMP 图像。 if (g_bReadback && g_ReadbackSID)
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以
在自己尝试 URL 解码之后,我设法想出了一些可行的想法 - 但它们不是很有效。由于 URL 解码是我的程序中可能出现严重瓶颈的地方,我决定上网寻找更有效的解决方案。我遇到了这篇 codeguru 文
是否可以“拦截” JAXB 的解码过程? 我有一个 xml 响应,部分应该转换为不同的 java 字段结构: ... 在我的 java 类中,我更愿意将其解码为 List ,
我是一名优秀的程序员,十分优秀!