c++ - 如何使openCV的solvePNP头部姿势估计输出更准确-6ren

c++ - 如何使openCV的solvePNP头部姿势估计输出更准确

转载作者：行者123 更新时间：2023-12-02 17:56:40

我正在使用OpenCV Solventpnp进行实时头部姿势估计(x，y，z，俯仰，偏航，横滚)，我正在使用该信息向用户显示视频游戏中的正确 View ，因此，如果他以相同的 Angular 摇头视频游戏(例如Xbox Kinect)中会发生这种情况。
问题是，即使用户的头部保持恒定，输出的声音也会很嘈杂(显示用户在不动时头部移动)，或者当用户在移动头部时输出仍会不平滑并且坐标会在整个位置上跳跃。
我尝试添加更多的2d点(面部界标)和用于solvepnp甚至solvepnpransac的不同标志，但是没有任何效果。
这是我正在使用的代码

double getCordinates(double *listPtr, int size, int imCols, int imRows, int position)
{

    // 2D image points.
    std::vector<cv::Point2d> image_points;
    // Nose tip
    image_points.push_back(cv::Point2d(*(listPtr + 0), *(listPtr + 1)));
    // Chin
    image_points.push_back(cv::Point2d(*(listPtr + 2), *(listPtr + 3)));
    // Left eye left corner
    image_points.push_back(cv::Point2d(*(listPtr + 4), *(listPtr + 5)));
    // Right eye right corner
    image_points.push_back(cv::Point2d(*(listPtr + 6), *(listPtr + 7)));
    // Left Mouth corner
     image_points.push_back(cv::Point2d(*(listPtr + 8), *(listPtr + 9)));
    // Right mouth corner
     image_points.push_back(cv::Point2d(*(listPtr + 10), *(listPtr + 11)));


    // 3D model points.
    std::vector<cv::Point3d> model_points;
    // Nose tip
    model_points.push_back(cv::Point3d(0.0, 0.0, 0.0));
    // Chin
    model_points.push_back(cv::Point3d(0.0, -330.0, -65.0));
    // Left eye
    model_points.push_back(cv::Point3d(-225.0, 170.0, -135.0));
    // Right eye
    model_points.push_back(cv::Point3d(225.0, 170.0, -135.0));
    // Left Mouth
    model_points.push_back(cv::Point3d(-150.0, -150.0, -125.0));
    // Right mouth
    model_points.push_back(cv::Point3d(150.0, -150.0, -125.0));
 

    // Camera internals
    double focal_length = imCols;
    // Approximate focal length.
    cv::Point2d center = cv::Point2d(imCols / 2, imRows / 2);
    cv::Mat camera_matrix = (cv::Mat_<double>(3, 3) << focal_length, 0, center.x, 0, focal_length, center.y, 0, 0, 1);
    // Assuming no lens distortion
    cv::Mat dist_coeffs = cv::Mat::zeros(4, 1, cv::DataType<double>::type);
    // Output rotation and translation
    cv::Mat rotation_vector;
    // Rotation in axis-angle form
    cv::Mat translation_vector;
    // Solve for pose
    cv::solvePnP(model_points, image_points, camera_matrix, dist_coeffs, rotation_vector, translation_vector, false,0);


    // convert rotation vector to retotation matrix

    cv::Mat rotation_matrix;
    cv::Rodrigues(rotation_vector, rotation_matrix);
    // get eulerAngles
    cv::Vec3d eulerAngles;
    cv::Mat cameraMatrix, rotMatrix, transVect, rotMatrixX, rotMatrixY, rotMatrixZ;
    double *_r = rotation_matrix.ptr<double>();
    double projMatrix[12] = {_r[0], _r[1], _r[2], 0,
                             _r[3], _r[4], _r[5], 0,
                             _r[6], _r[7], _r[8], 1};

    cv::decomposeProjectionMatrix(cv::Mat(3, 4, CV_64FC1, projMatrix),
                                  cameraMatrix,
                                  rotMatrix,
                                  transVect,
                                  rotMatrixX,
                                  rotMatrixY,
                                  rotMatrixZ,
                                  eulerAngles);

    double xTurn = eulerAngles[0];
    double yTurn = eulerAngles[1];
    double zTurn = eulerAngles[2];

    if (position == 1)
        return translation_vector.ptr<double>()[0];
    else if (position == 2)
        return translation_vector.ptr<double>()[1];
    else if (position == 3)
        return translation_vector.ptr<double>()[2];
    else if (position == 4)
        return xTurn;
    else if (position == 5)
        return yTurn;
    else if (position == 6)
        return zTurn;

    return xTurn;
}

最佳答案

您的问题是您对头部位置的测量很嘈杂。应对您的噪声测量的一种(最好是最好的)解决方案是卡尔曼滤波器。二维情况下没有间距，偏航和滚动的结果如下所示:https://www.youtube.com/watch?v=7Z_8-Ew7u2k。
正如您在视频中看到的那样，卡尔曼滤波器(蓝/红线)并不直接跟随噪声测量(绿点)，而是“随心所欲”。
但是，设计卡尔曼滤波器并非易事。首先，您应该处理一个简单的问题，以了解卡尔曼滤波的工作原理，然后再回到最初的问题。不幸的是，这就是我能为您做的一切。
编辑
我刚刚发现了一篇有关3维头部跟踪的有趣论文，其中没有俯仰，偏航和横摇。 Head Pose Estimation Based on Head Tracking and the Kalman Filter 。您会在此处找到卡尔曼滤波器所需的矩阵。
我认为应该在某个地方针对您的问题提供直接可行的解决方案。但是很遗憾，我必须承认我找不到它，对不起。

关于c++ - 如何使openCV的solvePNP头部姿势估计输出更准确，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64527675/

文章推荐： angular - 如何正确地 forkJoin 可观察对象列表或其订阅？

文章推荐： javascript - 如何将数据从指令函数传递到服务？

文章推荐： vue.js - 为什么 react 变量在未分配给 v-model 时会发生变化

从世界空间骨骼矩阵计算绑定(bind)姿势/蒙皮矩阵
目前我将所有骨骼存储在世界空间中并直接从二进制文件加载它们。我通过放置一个“箭头对象”来检查这个骨架，其中矩阵 bone_mat 作为“modelmatrix”。按预期工作。 Variable ex
math - 如何将 3D 协方差矩阵投影到给定的图像平面(姿势)
我有一个 3d 点的 3x3 协方差矩阵，我想知道等效的 2d 协方差(对于图像平面中的 u,v)，给定图像位姿 [Xc,Yc,Zc,q0,q1, q2,q3] , 3d 协方差可以是一个 3d 椭圆
.net - Collada 中的绑定(bind)姿势、关节变换
我正在尝试将自定义 3D 模型格式导出到 Collada。我已经通过 XSD 构建了 Collada 数据类，现在当我尝试用数据填充它们时出现问题，特别是对于矩阵相关的问题。我的 Skeleton
OpenGL : Bone Animation, 为什么在使用 GPU 时需要反向绑定(bind)姿势？
我实现了一个带有软件皮肤的 MD5 Loader。 md5 中的绑定(bind)姿势是最终的、绝对位置和旋转，您只需要计算与关节相关的权重。我试图实现 GPU 蒙皮，但我被困在了一个点上。由于这些坐
c++ - 如何使用 2D 跟踪和初始 3D 姿势估计 3D 姿势
当物体在场景中移动时如何计算 3D 姿态，我使用 SURF 跟踪场景中的物体并且该物体的初始 3D 姿态是已知的。我所知道的是，一旦我使用 SURF，两个连续帧之间的 2D 对应关系就知道了，因此通过
node.js - 图像处理/计算机视觉 - body 部位识别 - 姿势(站立/坐) - 监督学习
我正在寻求图像处理/计算机视觉专家的建议。尝试开发一种强大的、可缩放的算法来提取人体的尺寸。例如，他的上半身宽度。问题: 没有面孔的图像坐着的人多个面孔人拿着某物，从而覆盖了他的 body 的

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 如何使openCV的solvePNP头部姿势估计输出更准确