vector - 在ffmpeg H.264解码器中修改运动向量-6ren

vector - 在ffmpeg H.264解码器中修改运动向量

转载作者：行者123 更新时间：2023-12-04 21:22:45

27

4

出于研究目的，我尝试在解码过程中在运动补偿之前为每个 P 和 B 帧修改 H.264 运动矢量 (MV)。我为此目的使用 FFmpeg。修改的一个例子是将每个 MV 替换为其原始空间邻居，然后使用生成的 MV，而不是原始的 MV 进行运动补偿。请适本地指导我。

到目前为止，我已经能够对文件中的MV进行简单的修改。/libavcodec/h264_cavlc.c .在函数中， ff_h264_decode_mb_cavlc() ，修改 MX 和我的变量，例如，通过增加它们的值来修改解码期间使用的 MV。

例如，如下所示， MX 和我的值增加了 50，从而延长了解码器中使用的 MV。

mx += get_se_golomb(&s->gb)+50;
my += get_se_golomb(&s->gb)+50;

但是，在这方面，我不知道如何访问 的邻居。 MX 和我的对于我在第一段中提到的空间均值分析。我相信这样做的关键在于操纵数组， mv_cache .

我进行的另一个实验在文件中， libavcodec/error_resilience.c .基于 guess_mv() 函数，我创建了一个新函数， mean_mv() 在 中执行ff_er_frame_end() 在第一个 if 语句中。第一个 if 语句退出函数 ff_er_frame_end() 如果条件之一是零错误计数 (s->error_count == 0)。但是，我决定插入我的 mean_mv() 在这一点上运行，以便在错误计数为零时始终执行。这个实验在一定程度上产生了我想要的结果，因为我可以开始在视频的顶部看到伪影，但它们仅限于右上角。我猜我插入的功能没有完成以满足播放截止日期或其他内容。

下面是修改后的 if 语句。唯一的补充是我的功能， mean_mv(s) .

if(!s->error_recognition || s->error_count==0 || s->avctx->lowres ||
       s->avctx->hwaccel ||
       s->avctx->codec->capabilities&CODEC_CAP_HWACCEL_VDPAU ||
       s->picture_structure != PICT_FRAME || // we dont support ER of field pictures yet, though it should not crash if enabled
       s->error_count==3*s->mb_width*(s->avctx->skip_top + s->avctx->skip_bottom)) {
        //av_log(s->avctx, AV_LOG_DEBUG, "ff_er_frame_end in er.c\n"); //KG
        if(s->pict_type==AV_PICTURE_TYPE_P)
            mean_mv(s);
        return;

这是 mean_mv() 我基于 创建的函数guess_mv() .

static void mean_mv(MpegEncContext *s){
    //uint8_t fixed[s->mb_stride * s->mb_height];
    //const int mb_stride = s->mb_stride;
    const int mb_width = s->mb_width;
    const int mb_height= s->mb_height;
    int mb_x, mb_y, mot_step, mot_stride;

    //av_log(s->avctx, AV_LOG_DEBUG, "mean_mv\n"); //KG

    set_mv_strides(s, &mot_step, &mot_stride);

    for(mb_y=0; mb_y<s->mb_height; mb_y++){
        for(mb_x=0; mb_x<s->mb_width; mb_x++){
            const int mb_xy= mb_x + mb_y*s->mb_stride;
            const int mot_index= (mb_x + mb_y*mot_stride) * mot_step;
            int mv_predictor[4][2]={{0}};
            int ref[4]={0};
            int pred_count=0;
            int m, n;

            if(IS_INTRA(s->current_picture.f.mb_type[mb_xy])) continue;
            //if(!(s->error_status_table[mb_xy]&MV_ERROR)){
            //if (1){
            if(mb_x>0){
                mv_predictor[pred_count][0]= s->current_picture.f.motion_val[0][mot_index - mot_step][0];
                mv_predictor[pred_count][1]= s->current_picture.f.motion_val[0][mot_index - mot_step][1];
                ref         [pred_count]   = s->current_picture.f.ref_index[0][4*(mb_xy-1)];
                pred_count++;
            }

            if(mb_x+1<mb_width){
                mv_predictor[pred_count][0]= s->current_picture.f.motion_val[0][mot_index + mot_step][0];
                mv_predictor[pred_count][1]= s->current_picture.f.motion_val[0][mot_index + mot_step][1];
                ref         [pred_count]   = s->current_picture.f.ref_index[0][4*(mb_xy+1)];
                pred_count++;
            }

            if(mb_y>0){
                mv_predictor[pred_count][0]= s->current_picture.f.motion_val[0][mot_index - mot_stride*mot_step][0];
                mv_predictor[pred_count][1]= s->current_picture.f.motion_val[0][mot_index - mot_stride*mot_step][1];
                ref         [pred_count]   = s->current_picture.f.ref_index[0][4*(mb_xy-s->mb_stride)];
                pred_count++;
            }

            if(mb_y+1<mb_height){
                mv_predictor[pred_count][0]= s->current_picture.f.motion_val[0][mot_index + mot_stride*mot_step][0];
                mv_predictor[pred_count][1]= s->current_picture.f.motion_val[0][mot_index + mot_stride*mot_step][1];
                ref         [pred_count]   = s->current_picture.f.ref_index[0][4*(mb_xy+s->mb_stride)];
                pred_count++;
            }

            if(pred_count==0) continue;

            if(pred_count>=1){
                int sum_x=0, sum_y=0, sum_r=0;
                int k;

                for(k=0; k<pred_count; k++){
                    sum_x+= mv_predictor[k][0]; // Sum all the MVx from MVs avail. for EC
                    sum_y+= mv_predictor[k][1]; // Sum all the MVy from MVs avail. for EC
                    sum_r+= ref[k];
                    // if(k && ref[k] != ref[k-1])
                    // goto skip_mean_and_median;
                }

                mv_predictor[pred_count][0] = sum_x/k;
                mv_predictor[pred_count][1] = sum_y/k;
                ref         [pred_count]    = sum_r/k;
            }

            s->mv[0][0][0] = mv_predictor[pred_count][0];
            s->mv[0][0][1] = mv_predictor[pred_count][1];

            for(m=0; m<mot_step; m++){
                for(n=0; n<mot_step; n++){
                    s->current_picture.f.motion_val[0][mot_index + m + n * mot_stride][0] = s->mv[0][0][0];
                    s->current_picture.f.motion_val[0][mot_index + m + n * mot_stride][1] = s->mv[0][0][1];
                }
            }

            decode_mb(s, ref[pred_count]);

            //}
        }
    }
}

我真的很感激一些关于如何正确处理这个问题的帮助。

最佳答案

很长时间以来，我一直在内部与 FFMPEG 的代码脱节。

但是，鉴于我对 FFMPEG 内部恐怖的经验(你会明白我的意思)，我宁愿给你一个简单实用的建议。

建议#1
最好的可能性是，当每个 block 的运动矢量被识别时 - 您可以在 FFMPEG 编码器上下文(又名 s )中创建自己的附加数组，该数组将存储所有这些。当您的算法运行时，它将从那里获取值。

建议#2
我读的另一件事(我不确定我是否读对了)

the mx and my values are increased by 50

我认为 50 是一个非常大的运动向量。并且通常，运动矢量编码的 F 值范围是先验限制的。如果您将内容更改 +/- 8(甚至 +/- 16)可能就可以了 - 但 +50 可能会如此之高，以至于最终结果可能无法正确编码。

我不太明白你关于 mean_mv() 的目的。以及您期望从那里发生的失败。请重新措辞一下。

关于vector - 在ffmpeg H.264解码器中修改运动向量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9270250/

27

4

0

文章推荐： sql - 将逻辑运算符与其他中缀运算符区分开来

文章推荐： sql - 每年计算两个不同的值

文章推荐： vim - vim中的鼠标滚动滚动终端窗口

Dart JSON 解码器
令我惊讶的是，dart 没有内置的对象到 json 和 json 到对象的映射器。我读到我们必须自己手动编写映射代码，这并不令人愉快。无论如何，虽然我没有针对我的用例对其进行彻底测试，但我发现了
java - 8位PCMU编码器/解码器
我有 16 位 PCM 音频，我想将其转换为 8 位 PCMU。据我所知，16 位到 8 位的转换很容易 - 只需从每个样本中删除最后 8 位即可。我想知道如何将8位pcm转换为8位pcmu？任何文
Java Jpeg 解码器
我的任务是使用动态霍夫曼修改 JPEG 格式。所以我试图找到用Java编写的简单Jpeg解码器的源代码。谁能帮我？最佳答案看看这个:http://www.dreamincode.net/forum
Java JSON 解码器
我收到错误代码(如下)，并且无法解码该字符串，我知道它正在查找 JSON 和我也保存的文件，但它无法解析。错误代码: Unexpected token VALUE(-10) at position 8
java - 随机编码器/解码器
我制作了这个程序，它是一个随 secret 码。 public class SaadAbdullahCipher { private char[] alphabet = {'a', 'b'
java - 如何创建编码器？解码器？
总的来说，我对编程还很陌生，我想知道如何对输入的文本进行编码/解码。对于 ex A -> D，所有字母必须减去 3 个字母B -> E等等我将输入一些伪代码作为示例: INPUT MESSAGE:
go - 获取字符集字符串的编码器/解码器
是否有内置函数或受支持的包中的函数来获取基于输入字符集字符串，例如 ISO-8859-1 或 ISO-8859-15？现在我看到的唯一方法是自己匹配它: func getEncoderForChars
JSON 解码器无法读取数据，因为它的格式不正确
我是新来的。不知何故，我能够理解如何做到这一点。我在下面做，但它给出了错误 - 无法读取数据，因为它的格式不正确。有人可以帮助我吗？从过去的 4 天开始，我一直坚持这一点。我真的很感激。 impor
json - 如何为复杂对象编写自定义 JSON 解码器？
就像标题所说，我正在尝试为一个我定义的类的对象编写一个自定义解码器，该对象包含我定义的类的其他对象。 “外部”类是一个 Edge，定义如下: class Edge: def __init__(
audio - 重新编码音频:gstreamer中的libav编码器/解码器
我想重新编码音频文件的音频流。以下gstreamer管道可以正常工作: gst-launch-1.0 filesrc location=input.flac ! decodebin ! audioco
Swift4 的 JSON 解码器
使用Swift4、iOS11.1、Xcode9.1，尝试匹配 Swift4 的可编码结构中的 JSON 文件，我遇到以下问题: 这是我的代码: struct Station: Codable {
java - WBXML 解析器/解码器
正如标题所示，我正在寻找遵循 1.3 版本的 Java(+Android) WBXML 解析器/解码器。如果有必要的话，我什至可以考虑调用 native 代码。谢谢。最佳答案我确实记得不久前我使用
java - 将架构位置添加到 JAXB 解码器
当 JABX 解码器尝试解码 xml 时，我遇到以下错误线程“main”中出现异常 javax.xml.bind.UnmarshalException - 带有链接异常:[org.xml.sax.S
python - Keras Conv2D 解码器
我正在处理不同尺寸(x，y)的图像。当在 MaxPooling2D 之后使用 UpSampling2D 时，它不能很好地重建它，因为 x-dim 不等于 y-dim。当 x=y (例如 28x28)时
javascript - 压缩 JS 解码器
http://www.lotterypost.com/js-compress.aspx 这个网站非常适合压缩 JS 但我想解码.... 除了在线之外，有没有最好的免费工具来编码/解码 Js 最佳答案
java - 不同的 Base64 解码器
我刚刚在验证 JWT 时遇到了问题。我正在运行的代码是一个相当肮脏的黑客，它采用 JWT 的第二个组件并通过 Base64 解码器运行它。然而事实证明，通过一些 super 特殊的 JWT，我得到了一
c++ - 将输出帧保存为图像文件 CUDA 解码器
我正在尝试使用 CUDA 解码器项目中的代码将解码后的图像文件保存回 BMP 图像。 if (g_bReadback && g_ReadbackSID)
c++ - FLV & F4V开源C++解码器
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以
c++ - 帮助我理解这个 URL 解码器 :
在自己尝试 URL 解码之后，我设法想出了一些可行的想法 - 但它们不是很有效。由于 URL 解码是我的程序中可能出现严重瓶颈的地方，我决定上网寻找更有效的解决方案。我遇到了这篇 codeguru 文
java - 具有自定义拦截器的 JAXB 解码器？
是否可以“拦截” JAXB 的解码过程？我有一个 xml 响应，部分应该转换为不同的 java 字段结构: ... 在我的 java 类中，我更愿意将其解码为 List ，

首页

博学

6Ren·AI

商城

vector - 在ffmpeg H.264解码器中修改运动向量