Python OpenCV : Detecting a general direction of movement?-6ren

Python OpenCV : Detecting a general direction of movement?

转载作者：太空狗更新时间：2023-10-29 21:10:24

25

4

我仍在编写书籍扫描脚本，现在，我所需要的只是能够自动检测翻页。这本书占据了 90% 的屏幕(我使用了一个粗糙的网络摄像头来检测运动)，所以当我翻页时，运动的方向基本上是同一个方向。

我已经修改了一个运动跟踪脚本，但衍生品让我无处可去:

#!/usr/bin/env python

import cv, numpy

class Target:
    def __init__(self):
        self.capture = cv.CaptureFromCAM(0)
        cv.NamedWindow("Target", 1)

    def run(self):
        # Capture first frame to get size
        frame = cv.QueryFrame(self.capture)
        frame_size = cv.GetSize(frame)
        grey_image = cv.CreateImage(cv.GetSize(frame), cv.IPL_DEPTH_8U, 1)
        moving_average = cv.CreateImage(cv.GetSize(frame), cv.IPL_DEPTH_32F, 3)
        difference = None
        movement = []

        while True:
            # Capture frame from webcam
            color_image = cv.QueryFrame(self.capture)

            # Smooth to get rid of false positives
            cv.Smooth(color_image, color_image, cv.CV_GAUSSIAN, 3, 0)

            if not difference:
                # Initialize
                difference = cv.CloneImage(color_image)
                temp = cv.CloneImage(color_image)
                cv.ConvertScale(color_image, moving_average, 1.0, 0.0)
            else:
                cv.RunningAvg(color_image, moving_average, 0.020, None)

            # Convert the scale of the moving average.
            cv.ConvertScale(moving_average, temp, 1.0, 0.0)

            # Minus the current frame from the moving average.
            cv.AbsDiff(color_image, temp, difference)

            # Convert the image to grayscale.
            cv.CvtColor(difference, grey_image, cv.CV_RGB2GRAY)

            # Convert the image to black and white.
            cv.Threshold(grey_image, grey_image, 70, 255, cv.CV_THRESH_BINARY)

            # Dilate and erode to get object blobs
            cv.Dilate(grey_image, grey_image, None, 18)
            cv.Erode(grey_image, grey_image, None, 10)

            # Calculate movements
            storage = cv.CreateMemStorage(0)
            contour = cv.FindContours(grey_image, storage, cv.CV_RETR_CCOMP, cv.CV_CHAIN_APPROX_SIMPLE)
            points = []

            while contour:
                # Draw rectangles
                bound_rect = cv.BoundingRect(list(contour))
                contour = contour.h_next()

                pt1 = (bound_rect[0], bound_rect[1])
                pt2 = (bound_rect[0] + bound_rect[2], bound_rect[1] + bound_rect[3])
                points.append(pt1)
                points.append(pt2)
                cv.Rectangle(color_image, pt1, pt2, cv.CV_RGB(255,0,0), 1)

            num_points = len(points)

            if num_points:
                x = 0
                for point in points:
                    x += point[0]
                x /= num_points

                movement.append(x)

            if len(movement) > 0 and numpy.average(numpy.diff(movement[-30:-1])) > 0:
              print 'Left'
            else:
              print 'Right'

            # Display frame to user
            cv.ShowImage("Target", color_image)

            # Listen for ESC or ENTER key
            c = cv.WaitKey(7) % 0x100
            if c == 27 or c == 10:
                break

if __name__=="__main__":
    t = Target()
    t.run()

它检测所有框的平均中心的平均运动，这是非常低效的。我将如何快速准确地检测此类运动(即在阈值内)？

我正在使用 Python，并且我打算坚持使用它，因为我的整个框架都是基于 Python 的。

非常感谢您的帮助，在此先感谢大家。干杯。

最佳答案

我以前没有在 Python 中使用过 OpenCV，只是在 C++ 和 openframeworks 中使用过一点。

为此我假设 OpticalFlow的 velx,vely 属性会起作用。

有关光流如何工作的更多信息，请查看 this paper .

HTH

关于Python OpenCV : Detecting a general direction of movement?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4496063/

25

4

0

文章推荐： python - 使用urllib2时如何解决Python内存泄漏？

文章推荐： Python 列表/字典与 numpy 数组 : performance vs. 内存控制

文章推荐： c++ - 自定义条件作用域互斥锁

android - Xamarin iOS/安卓 : Detect Lockscreen/home screen click detection or swipe detection
我正在使用 xamarin 表单开发移动应用程序，是否可以检测 Android 中的滑动手势以进行屏幕截图或单击锁定屏幕或主屏幕？如果可以通过 Objective C/swift/java 实现，那
c++ - OpenCV : Object detection and tracking based on feature detection
我刚刚涉足计算机视觉领域，并试图揭开它的各种复杂性的神秘面纱。我正在尝试使用冲浪特征检测器来增强卡尔曼滤波器。但是我不明白在使用冲浪特征在检测到的帧上构造单应性和有界矩形后如何调用和使用卡尔曼方法。在
python-3.x - opencv2 : Circle detection not detecting the obvious ones
问题我正在尝试使用 opencv2 来检测静止图像中的 PlayStation Move 运动 Controller 。为了增加球体和背景之间的对比度，我决定修改输入图像以自动缩放每个 channe
android - OpenCV，安卓 : Detecting an object from an image instead of real-time detection
我正在制作一个 android 应用程序，它可以从从视频中捕获的图像帧中检测对象。 openCV中的示例应用只有实时检测的例子。附加信息:-我正在使用 Haar 分类器截至目前，我正在将捕获的帧存
c++ - OpenCV C++/Obj-C : Detecting a sheet of paper/Square Detection
我在我的测试应用程序中成功实现了 OpenCV 平方检测示例，但现在需要过滤输出，因为它非常困惑 - 还是我的代码错误？我对论文的四个角点感兴趣，以减少偏斜(如 that)和进一步处理......
ios - swift : CoreImage Face Detection will Detect Every round object as a Face
在我的应用程序中，我想对 UIImage 使用人脸检测，所以我使用库中的 CoreImage 构建(我知道 Vision Library 也是最新的人脸检测库。但它仅支持 ios 11.0 及以上)。
c - Linux 3.0 : "glibc detected" abort - tuning corruption detected feature?
我的 Linux 3.0/glibc 2.13 应用程序因以下形式的错误而停止: *** glibc detected *** MYAPP: double free or corruption (fa
javascript - "@metamask/detect-provider: Unable to detect window.ethereum"错误，即使 Metamask 已安装并正在运行
我正在尝试运行一个基本程序来检测用户是否安装了 window.ethereum。当我运行我的程序时，我得到“@metamask/detect-provider:无法检测到 window.ethereu
python - OpenCV 和 Python : Face Detection using haarcascades is detecting many boxes as eyes.
我正在使用 Haarcascades 检测人脸和眼睛。我的问题是，它像眼睛一样包围了许多盒子。我的语法是 face_cascade = cv2.CascadeClassifier('haarcasca
ios - swift 3 : iMessage Extension detect User tap on Message and Detect Manual Slide
我如何检测用户在对话中点击“消息”？如果 MessageViewController Controller 很紧凑并且用户向上滑动我如何检测到它？我试过这些代表，但它不能正常工作 override
object-detection - (Microsoft Azure 自定义视觉服务 : Object Detection) How to find bounding box info of training data?
我在对象检测中使用 Microsoft 自定义视觉服务来提取需要的对象。我想做一个回归测试来比较结果。但是，我找不到一个地方可以导出带有用户通过 GUI 定义的边界框的训练图片。模型训练是在 Mic
ssl - 如何获取 'Chrome has detected insecure content' 而不是 'Chrome has detected either high-risk insecure content'
我对 chrome 进行了扩展。当我浏览到 https 下的网站时，我的链接仍在 http 下，我收到:“该站点使用 SSL，但 Google Chrome 检测到页面上存在高风险不安全内容或站点证书
go - JetBrains Gogland :A fatal error has been detected by the Java Runtime Environment:A fatal error has been detected by the Java Runtime Environment:
我用的是JetBrains的Gogland工具来学习go语言，我安装成功了，但是打不开，现将报错列如下，有没有人遇到过这个问题？如能解决，将不胜感激。错误: Java 运行时环境检测到 fatal
detection - 社区检测算法的评估指标
我想在 R 中评估和比较我的社区检测算法的结果。我的算法不允许重叠，并且有一些节点没有被处理。例如，对于 Zachary 空手道俱乐部，我有 1 个节点未处理。我找到了很多指标(NMI、ARI、Mod
detection - 如何检测语言
是否有任何好的开源引擎来检测文本使用的语言，也许是概率度量？我可以在本地运行并且不查询 Google 或 Bing 的一个？我想在大约 1500 万页的 OCR 文本中检测每个页面的语言。并非所有文
collision-detection - 涉及快速旋转物体的碰撞检测
我正在开发一款 2D 游戏，其中包含高速射弹，这些射弹会撞击高速(并且可能旋转得非常快)的多边形目标对象。我一直在试验和寻找适合我的强大碰撞检测算法。如果快速旋转不是一个因素(即 0 或慢速旋转)，
collision-detection - 如何在碰撞动态移相器js中删除物质js对象
我正在制作一款平台游戏，其中有玩家和一些 Prop 。为了检查碰撞，我使用了 matterjs collisionactive 函数: this.matter.world.on("collisiona
collision-detection - 与矩形以外的形状碰撞..？
我已经习惯于使用矩形进行碰撞检测，现在我有点难住了。我正在处理类似菱形的形状，在过去的几个小时里，我一直在试图找出如何检查碰撞。我尝试检查第一个对象的四个点是否在第二个对象的点内，但这只是一个框(我
collision-detection - 没有初始速度的两个加速球体之间的碰撞检测？
最初，两个半径为 R1 和 R2 的非接触球体处于静止状态。然后在时间 = 0 时分别给它们两个加速度 a1 和 a2。查明他们是否会接触。它们的初始位置分别表示为 (x1,y1,z1) 和 (x2
collision-detection - 计算轴对齐边界框的大小
我目前正在学习使用 LWJGL 和 OpenGL 的 ThinMatrix 3d 游戏开发教程。我正在尝试在我的游戏中实现碰撞检测。我已经准备好检测 AABB 与 AABB 碰撞的代码，但似乎无法弄清

首页

博学

6Ren·AI

商城

Python OpenCV : Detecting a general direction of movement?