c++ - 如何使用 SVM 从视频中检测对象-6ren

c++ - 如何使用 SVM 从视频中检测对象

转载作者：行者123 更新时间：2023-11-28 03:12:00

26

4

这是我用于训练车辆数据集的代码，当它完全训练时，我希望它从视频(.avi)预测数据(车辆)，如何从视频预测训练数据以及如何在其中添加该部分？，我希望当车辆在视频中显示时将其计为 1 并计算出检测到物体，如果第二辆车过来，它将计数增加为 2

    IplImage *img2;
    cout<<"Vector quantization..."<<endl;
    collectclasscentroids();
    vector<Mat> descriptors = bowTrainer.getDescriptors();
    int count=0;
    for(vector<Mat>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)
    {
       count += iter->rows;
    }
    cout<<"Clustering "<<count<<" features"<<endl;
    //choosing cluster's centroids as dictionary's words
    Mat dictionary = bowTrainer.cluster();
    bowDE.setVocabulary(dictionary);
    cout<<"extracting histograms in the form of BOW for each image "<<endl;
    Mat labels(0, 1, CV_32FC1);
    Mat trainingData(0, dictionarySize, CV_32FC1);
    int k = 0;
    vector<KeyPoint> keypoint1;
    Mat bowDescriptor1;
    //extracting histogram in the form of bow for each image 
   for(j = 1; j <= 4; j++)
    for(i = 1; i <= 60; i++)
            {
              sprintf( ch,"%s%d%s%d%s","train/",j," (",i,").jpg");
              const char* imageName = ch;
              img2 = cvLoadImage(imageName, 0); 
              detector.detect(img2, keypoint1);
              bowDE.compute(img2, keypoint1, bowDescriptor1);
              trainingData.push_back(bowDescriptor1);
              labels.push_back((float) j);
             }
    //Setting up SVM parameters
    CvSVMParams params;
    params.kernel_type = CvSVM::RBF;
    params.svm_type = CvSVM::C_SVC;
    params.gamma = 0.50625000000000009;
    params.C = 312.50000000000000;
    params.term_crit = cvTermCriteria(CV_TERMCRIT_ITER, 100, 0.000001);
    CvSVM svm;



    printf("%s\n", "Training SVM classifier");

    bool res = svm.train(trainingData, labels, cv::Mat(), cv::Mat(), params);

    cout<<"Processing evaluation data..."<<endl;


    Mat groundTruth(0, 1, CV_32FC1);
    Mat evalData(0, dictionarySize, CV_32FC1);
    k = 0;
    vector<KeyPoint> keypoint2;
    Mat bowDescriptor2;


    Mat results(0, 1, CV_32FC1);;
    for(j = 1; j <= 4; j++)
      for(i = 1; i <= 60; i++)
         {
           sprintf( ch, "%s%d%s%d%s", "eval/", j, " (",i,").jpg");
           const char* imageName = ch;
           img2 = cvLoadImage(imageName,0);
           detector.detect(img2, keypoint2);
           bowDE.compute(img2, keypoint2, bowDescriptor2);
           evalData.push_back(bowDescriptor2);
           groundTruth.push_back((float) j);
           float response = svm.predict(bowDescriptor2);
           results.push_back(response);
         }



    //calculate the number of unmatched classes 
    double errorRate = (double) countNonZero(groundTruth- results) / evalData.rows;

问题是这段代码不是从视频中预测的，我想知道如何从视频中预测它，意思是我想从电影中检测车辆，就像它应该在什么时候显示 1它从电影中找到车辆

对于那些不明白问题的人:

我想用上面的代码播放电影

VideoCapture cap("movie.avi"); //movie.avi is with deleted background

假设我有一个包含车辆的训练数据，而“movie.avi”包含 5 辆车，所以它应该从 movie.avi 中检测到车辆并给我 5 作为输出

上面代码中这部分是怎么做的

最佳答案

通过查看您的代码设置

params.svm_type = CvSVM::C_SVC;

您似乎用两个以上的类来训练分类器。交通场景中的一个典型示例可能是汽车/行人/自行车/......但是，您正在寻求一种仅检测汽车的方法。如果没有对您的训练数据和视频的描述，就很难判断您的想法是否有意义。我猜前面的答案假设如下:

您遍历每一帧并希望输出该帧中的汽车数量。因此，一个帧可能包含多辆汽车，比如 5 辆。如果您将整个帧作为分类器的输入，它可能会响应“汽车”，即使设置在概念上可能有点偏差。您无法使用这种方法可靠地检索汽车数量。

相反，建议尝试使用滑动窗口方法。这意味着，例如，您遍历帧的每个像素并将像素周围的区域(称为子窗口或感兴趣区域)作为输入分类器。假设一个固定的scale，子窗口的大小可以是 150x50px 以及你的训练数据。您可能会在训练数据中固定汽车的比例，但在真实世界的视频中，汽车的尺寸会有所不同。为了找到不同比例的汽车，假设它是训练数据的两倍，典型的方法是缩放图像(比如使用 2 倍)并重复滑动窗口方法。

通过对所有相关尺度重复此操作，您最终会得到一个算法，该算法为每个像素位置和每个尺度提供分类器的结果。这意味着您有三个循环，或者换句话说，有三个维度(图像宽度、图像高度、比例)。最好将其理解为三维金字塔。 “为什么是金字塔？”你可能会问。因为每次缩放图像(比如 2)，图像都会变小(/变大)，下一个缩放是不同尺寸的图像(例如尺寸的一半)。

像素位置表示汽车的位置，比例尺表示汽车的大小。现在，如果你有一个 N 类分类器，这个金字塔中的每个槽都将包含一个数字 (1,...,N) 来指示类别。如果你有一个二元分类器(有车/无车)，那么你最终会得到包含 0 或 1 的每个槽。即使在这种简单的情况下，你也会想简单地计算 1 的数量并将计数输出为车的数量，你仍然会遇到同一辆车可能有多个响应的问题。因此，如果你有一个汽车检测器，它会给出 0 到 1 之间的连续响应，然后你可以在这个金字塔中找到最大值，那就更好了。每个最大值表示一辆汽车。这种检测已成功用于角点特征，您可以在所谓的尺度空间金字塔中检测感兴趣的角点。

总而言之，无论您是将问题简化为二元分类问题(“汽车”/“没有汽车”)，还是坚持更困难的区分多个类别的任务(“汽车”/“动物”/“行人”/...)，您仍然需要解决每一帧中的比例和位置问题。

关于c++ - 如何使用 SVM 从视频中检测对象，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18172371/

26

4

0

文章推荐： C++ Qt RegExp 不匹配 @ 或 | 等特殊字符或^

文章推荐： javascript - 悬停时类更改 : CSS vs jQuery (transition glich)

文章推荐： php - 表单正在向数据库提交多个条目而不是单个条目

文章推荐： C++自定义类返回

java - Eclipse 视频 Intent 视频
我对此很陌生，我在这里的论坛上检查过答案，但我没有找到任何真正可以帮助我的答案。我正在尝试播放 res/raw 文件夹中的视频。到目前为止我已经设置了这段代码: MediaPlayer mp; @Ov
javascript - 视频，表单，然后是 html 视频
我可以播放一个视频剪辑，检测视频的结尾，然后创建一个表单，然后播放另一个视频剪辑。我的问题是，表单 react 不正确，我创建了带有提交按钮和两个单选按钮可供选择的表单。我希望让用户进行选择，验证响应
python - web2py 网站不加载所有图像/视频(尤其是较大的图像/视频)
首先，我必须说我在web2py讨论组中看到过类似的内容，但我不太理解。我使用 web2py 设置了一个数据库驱动的网站，其中的条目只是 HTML 文本。其中大多数将包含 img和/或video指向相
android - 视频 View 不播放 youtube 视频
我正在尝试在视频 View 中播放 YouTube 视频。我将 xml 布局如下: 代码是这样的: setContentView(R.layout.webview); VideoV
android - 如何在 Android 视频 View 中播放 Youtube 视频？
我正在开发一个需要嵌入其中的 youtube 视频播放器的 android 应用程序。我成功地从 API 获得了 RTSP 视频 URL，但是当我试图在我的 android 视频 View 中加载这个
javascript - 使用 YouTube 视频 ID 访问 YouTube 视频 URL
我目前正在从事一个使用 YouTube API 的网络项目。我完全不熟悉 API。所以每一行代码都需要付出很多努力。使用以下代码，我可以成功检索播放列表中的项目: https://www.goog
php - 使用 PHP、视频 ID 和 API key 删除 youtube 视频
是否可以仅使用视频 ID 和 key 使用 API V3 删除 youtube 视频？我不断收到有关“必需参数:部分”丢失的错误消息。我用服务器和浏览器 api 键试了一下这是我的代码: // $yo
python - 使用 RegEx 从字符串中获取 YouTube 视频 url 或 YouTube 视频 ID
所以我一直坚持这个大约一个小时左右，我就是无法让它工作。到目前为止，我一直在尝试从字符串中提取整个链接，但现在我觉得只获取视频 ID 可能更容易。 RegEx 需要从以下链接样式中获取 ID/URL，
javascript - 在 Angular js 中嵌入来自 json 响应的 Youtube 视频 url 和 Vimeo 视频 url 时的问题
var app = angular.module('speakout', []).config( function($sceDelegateProvider) {
Android如何从xml中识别音频/视频？
我正在努力从 RSS 提要中阅读音频、视频新闻。我如何确定该 rss 是用于新闻阅读器还是用于音频或视频？这是视频源:http://feeds.cbsnews.com/CBSNewsVideo 这是
如何用python反转图片,视频
利用python反转图片/视频准备：一张图片/一段视频 python库：pillow,moviepy 安装库 ?
HTML5 视频 - 双击全屏
我希望在用户双击视频区域时让我的视频全屏显示，而不仅仅是在他们单击控件中的小图标时。有没有办法添加事件或其他东西来控制用户点击视频时发生的情况？谢谢! 最佳答案按照 Musa 的建议，附
PHP转换图像+音频=视频
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
本地服务器上的 HTML5 视频
我有一个公司培训视频加载到本地服务器上。我正在使用 HTML5 的视频播放来观看这些视频。该服务器无法访问网络，但我已加载 apache 并且端口 8080 对同一网络上的所有机器开放。这些文件位于
ffmpeg - 使用ffmpeg混合不同长度的音频/视频
我想混合来自 video.mp4 的视频(时长 1 分钟)和来自 audio.mp3 的音频(10 分钟持续时间)到一个持续时间为 1 分钟的输出文件中。来自 audio.mp3 的音频应该是从 4
c# - 如何通过互联网向多个客户端发送音频/视频？
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 8年前关闭。 Improve this questi
javascript - 视频/音频通信
我正在尝试使用 peer/getUserMedia 创建一个视频 session 网络应用程序。目前，当我将唯一 ID 发送到视频 session 时，我能够听到/看到任何加入我的 session
video - 视频/列表统计信息多久更新一次？
考虑到一段时间内的观看次数，我正在评估一种针对半自动脚本的不同方法，该脚本将对视频元数据执行操作。简而言之，只要视频达到指标中的某个阈值，就说观看次数，它将触发某些操作。现在要执行此操作，我将不得
html - 适用于YouTube的HTML5 <视频>
我正在通过iBooks创建专门为iPad创建动态ePub电子书的网站。它需要支持youtube视频播放，所以当我知道视频的直接路径时，我正在使用html5 标记。有没有一种使用html5 标签嵌入
android - 如何在Webview中显示Youtube网站/视频？
我对Android不熟悉，我想浏览youtube.com并在Webview内从网站显示视频。当前，当我尝试执行此操作时，将出现设备的浏览器，并让我使用设备浏览器浏览该站点。如果Webview不具备这种

首页

博学

6Ren·AI

商城

c++ - 如何使用 SVM 从视频中检测对象