gpt4 book ai didi

opencv - 如何找到离相机最近的物体?

转载 作者:行者123 更新时间:2023-12-02 16:39:29 26 4
gpt4 key购买 nike

我正在研究一种算法,该算法可以找到物体最接近相机的点。我通过使用 meanshift 在网上找到了一些帮助。我已经粘贴了代码来做到这一点。代码的工作原理是:它使用 track_window 来跟踪最近的对象。但问题是我不知道如何找到最近物体的位置。
我试过的:
我可以让 track_window 遍历整个图像,从而缩小感兴趣的区域,但它太长了,我仍然不知道确切的位置。
有人可以帮我找到靠近相机的物体吗?
这是我的代码:

    /*
* back_project.cpp
*
* Created on: Mar 8, 2015
* Author: sushrut
*/

#include "backProject.h"

using namespace cv;
using namespace std;

/// Global Variables
Mat src; Mat hsv; Mat hue;
int bins = 25;
Rect track_window = cv::Rect(250, 250, 50, 50);
int x=1, y=1, wr=1, hr=1;

/// Function Headers
void Hist_and_Backproj(int, void* );

/** @function main */
int back_proj_main()
{
VideoCapture cap(0);

if(!cap.isOpened())
{
cout << "Cannot open the first web cam" << endl;
return -1;
}
while(true)
{
Mat src;
bool bSuccess = cap.read(src);
if(!bSuccess)
{
cout << "Cannot read a frame from video stream 1" << endl;
break;
}

/// Transform it to HSV
cvtColor( src, hsv, CV_BGR2HSV );

/// Use only the Hue value
hue.create( hsv.size(), hsv.depth() );
int ch[] = { 0, 0 };
mixChannels( &hsv, 1, &hue, 1, ch, 1 );

/// Create Trackbar to enter the number of bins
char* window_image = "Source image";
namedWindow( window_image, CV_WINDOW_AUTOSIZE );
createTrackbar("* Hue bins: ", window_image, &bins, 180, Hist_and_Backproj );
Hist_and_Backproj(0, 0);

// create a rectangle on the image
rectangle(src, Point(x,y), Point(x+wr, y+hr), Scalar(0, 250, 0));
/// Show the image
imshow( window_image, src );

if (waitKey(30) == 27) //wait for 'esc' key press for 30ms. If 'esc' key is pressed, break loop
{
cout << "esc key is pressed by user" << endl;
break;
}
}
// TODO release the capture
return 0;
}


/**
* @function Hist_and_Backproj
* @brief Callback to Trackbar
*/
void Hist_and_Backproj(int, void* )
{
MatND hist;
int histSize = MAX( bins, 2 );
float hue_range[] = { 0, 180 };
const float* ranges = { hue_range };

/// Get the Histogram and normalize it
calcHist( &hue, 1, 0, Mat(), hist, 1, &histSize, &ranges, true, false );
normalize( hist, hist, 0, 255, NORM_MINMAX, -1, Mat() );

/// Get Backprojection
MatND backproj;
calcBackProject( &hue, 1, 0, hist, backproj, &ranges, 1, true );

/// Draw the backproj
imshow( "BackProj", backproj );

// code to create a meanshift
meanShift(backproj,track_window, TermCriteria(TermCriteria::COUNT|TermCriteria::EPS, 10, 1));

// update the value of recctange
x = track_window.x;
y = track_window.y;
wr = track_window.width;
hr = track_window.height;
cout << "values: " << x << ", " << y << ", " << wr << ", " << hr << endl;

/// Draw the histogram
int w = 400; int h = 400;
int bin_w = cvRound( (double) w / histSize );
Mat histImg = Mat::zeros( w, h, CV_8UC3 );

for( int i = 0; i < bins; i ++ )
{ rectangle( histImg, Point( i*bin_w, h ), Point( (i+1)*bin_w, h - cvRound( hist.at<float>(i)*h/255.0 ) ), Scalar( 0, 0, 255 ), -1 ); }

imshow( "Histogram", histImg );
}

引用文献:
http://www.opencv.org.cn/opencvdoc/2.3.1/html/doc/tutorials/imgproc/histograms/back_projection/back_projection.html

最佳答案

一般来说,如果你只有一帧和一个摄像头——物体相对位置,是不可能检测到哪个物体离摄像头最近的。
您应该处理视频序列并跟踪特征点以确定对象在相机坐标系中的位置。

您应该研究一些关于多 View 几何的 Material 。例如,YouTube 上 Daniel Cremers 教授的讲座。 Hartley 和 Zisserman 的一本书也很不错。

看完评论更新

目前尚不清楚您的意思是什么。它们是图像中对象的像素坐标还是 3D 欧几里得空间中的点?

如果首先,那么您可以进行以下操作。 Backproject 会返回一个图像,其中每个像素都包含属于该对象的概率。您可以对该图像进行阈值处理以排除非常低的概率,从噪声中过滤结果,使用形态算子(侵 eclipse ,关闭)进行细化,从而得到一个像素 block ,很可能属于您的对象。然后你可以找到它的边界矩形。如果你不想使用 backproject,因为它并不总是找到对象,那么你可以使用 2D feature detectors and matchers来自 OpenCV。他们可以估计属于对象的一些“极端”点的位置。

在第二种情况下,任务看起来像 SLAM(同时定位和映射)的任务。这是一个更复杂的主题。我再次向您推荐多 View 几何和 SLAM 类(class)。此任务还大量使用 2D 特征点。

关于opencv - 如何找到离相机最近的物体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28949481/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com