gpt4 book ai didi

algorithm - H.264算法的综合定义

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:34:05 26 4
gpt4 key购买 nike

我一直在阅读有关 H.264 算法的大量论文(参见 H.264 codec explained),并且所有这些论文都做出了某些假设,使得理解该算法变得不可能,例如 Alexander Herman 的 H.264/MPEG-4 Advanced Video Coding

The intra frame Prediction predicts the values of a block, by using previously decoded data in a frame.

但它没有解释预测是什么

  • 我们会随机选择一个数字吗?
  • 我们是否会随意复制之前的预测值?
  • 我们是否闭上眼睛等待值出现?

是否有详细解释 H.264 的好文档?

最佳答案

Iain Richardson 的“The H.264 Advanced Video Compression Standard”是标准书。有关详细信息,请联系 specification可用。

每个像素都是通过结合预测和残差产生的。

在帧内,通过将像素复制到该 block 的左侧或上方来预测方形像素 block 。 (要复制的像素由位流中的位指定 - 在某些模式下,预测是从像素的过滤版本而不是直接复制形成的。)

对于图像中的第一个 block ,没有先前解码的像素,因此预测值设置为 128。

一旦您有了预测,就会将一个值(称为残差)添加到此以形成像素的最终值(假设去 block 化已关闭)。残差的值包含在比特流中(实际上是残差的转换版本,因为转换意味着需要更少的比特来编码残差)。

因此,总而言之,比特流首先指定一个数字,说明使用哪种方法复制/过滤先前解码的像素以形成预测,以及另一组数字指定将什么值添加到此预测以获得最终结果像素。

目标是预测非常接近实际图像,因此需要在残差上花费很少的比特。

关于algorithm - H.264算法的综合定义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33443680/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com