screenshot - 屏幕截图上的运动检测-6ren

screenshot - 屏幕截图上的运动检测

转载作者：行者123 更新时间：2023-12-04 14:04:22

27

4

我想知道是否有一种快速算法可以检测在两个连续屏幕截图之间移动的部分。该算法应该采用两张图像并输出一个图像中的一组(矩形)区域和一个描述匹配区域在另一张图像中的位置的向量。

我想将它用于为屏幕捕获而简化的无损视频压缩算法。我认为这使得用例与通常的运动检测应用略有不同:

图片是截图。不太可能存在任何伪影或图像噪声

如果图像的一部分移动，它会按像素移动。移动部分的像素差异通常小于 2%

移动的区域通常很大且呈矩形

由于视频压缩管道还有其他步骤并且应该实时发生，因此运动检测应该很快。

有什么有用的吗？

最佳答案

我有一些想法，以及您可以考虑的可能可行的解决方案。

首先，考虑跟踪单个像素增量并仅传输/存储那些。典型的交互式 session 通常只涉及 UI 更改的很小部分；对于长时间使用计算机的 session ，移动或调整窗口大小往往不太常见(据传闻)。这可以有效地捕获简单的内容，例如输入的文本、光标移动和小的 UI 更新，而无需进行大量额外工作。

您还可以考虑尝试在较低级别 Hook 操作系统，以获得例如像素的显示列表，甚至(最佳)“损坏”矩形列表。例如，Mac OS X 的 Quartz 合成器可以为您提供此信息。这可以帮助您快速缩小要更新的范围，并且在理想情况下，可以有效地表示屏幕本身。

如果您可以查询操作系统(窗口管理器)关于窗口的信息，您可以为每个可见窗口存储单独的数据流(像素增量)，然后应用简单的显示列表方法在播放期间“渲染”它们。然后，识别移动窗口是微不足道的，因为您可以简单地比较显示列表。

如果您可以查询操作系统关于光标位置的信息，您可以使用光标移动来快速估计移动增量，因为光标移动通常与屏幕上的对象移动(例如移动窗口、图标、拖动对象等)密切相关。这使您可以避免处理图像以确定运动增量。

关于可能的解决方案(或万一您仍然无法通过上述方法确定移动增量的最后手段):我们实际上可以相当轻松地处理单个移动矩形的(非常常见的)情况。为帧中发生变化的所有像素制作一个蒙版。识别掩码中最大的连接组件。如果它近似于一个矩形，那么你可以假设它代表一个移动的区域。窗口移动完全正交(例如完全在 x 或 y 方向)，在这种情况下总增量看起来像一个稍大的矩形，或者窗口对角移动，在这种情况下总增量将有一个 8 边形状。无论哪种方式，您都可以估计运动矢量，并通过区分区域来验证这一点。请注意，这种处理故意忽略了您必须考虑的细节，例如在窗口附近独立移动的像素，或看起来没有变化的区域(例如窗口中的大块纯色)。实际的实现必须处理上述所有问题。

最后，我会查看有关实时运动估计的现有文献。在优化运动估计和补偿方面已经做了很多工作，例如视频编码，因此如果您发现上述方法不足，您也可以使用该工作。

关于screenshot - 屏幕截图上的运动检测，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11976736/

27

4

0

文章推荐： perl - 在 perl 中使用 lib 和 if pragma

文章推荐： linux - curl 流输出逐行读取并包含条件

文章推荐： java - 如何遍历 JPA 响应并从中获取值

文章推荐： wcf - 在IIS中使用wsHttpBinding承载WCF服务的问题

.NET窗口/屏幕截图
图像采集源除了显示控件（上一篇《.NET 控件转图片》有介绍从界面控件转图片），更多的是窗口以及屏幕。窗口截图最常用的方法是GDI，直接上Demo吧： 1 private
Python 屏幕截图
我正在尝试编写一个程序来使用全局热键获取屏幕截图。下面是相应的代码: from datetime import datetime import os from pynput import keyboa
Android，屏幕截图
我正在构建一个应用程序，它应该为任何具有 Android 4 及更高版本的无根设备实现屏幕~镜像~，2 帧/秒就足够了。我正在尝试使用 ADB“framebuffer:”命令来抓取设备屏幕截图 AD
C++ 屏幕截图
如何使用 C++ 捕获屏幕截图？我将使用 Win32。请不要使用 MFC 代码。最佳答案 #include "windows.h" // should be less than and great
java代码实现截图功能(屏幕截图)
代码如下: import java.awt.Dimension; import java.awt.Rectangle; import java.awt.Robot; import java.aw
谷歌浏览器扩展的 javascript 屏幕截图
我目前正在构建一个 Google Chrome 扩展程序，该扩展程序可以从不同页面获取多个屏幕截图并将其发布到端点上。我遇到的问题是时间不对。我的意思是，在页面停止加载之前就太早截取屏幕截图了。其次，
ios - 如何在导航栏动画期间删除不需要的黑色区域。屏幕截图
我有一个 View Controller ，其中导航栏是透明的。我的下一个 View 是表格 View ，其中导航栏是白色的。为了停止不需要的动画，我在表格 View 的“viewDidDissap
浏览器顶部的 python 屏幕截图
我正在尝试从多个 URL 制作屏幕截图。我的代码工作正常，但结果我得到了事件窗口的图像。但我需要带有浏览器顶部的完整屏幕截图(URL) file = open('links.txt', 'r', en
隐藏父窗口后拍摄的 Java 屏幕截图
我正在尝试(并实现)获取屏幕截图: robot = new Robot(); BufferedImage biScreen = robot.createScreenCapture(rectScreen
android - 如何捕捉安卓设备的视频/屏幕截图
是否有任何应用程序可以拍摄 android 设备的视频/屏幕截图。我知道在桌面上捕获屏幕视频/图像的软件很少，例如 camtasia、snagit。 Android 设备有类似的东西吗？我知道使用
javascript - 非事件选项卡的捕获(屏幕截图)
想要捕获可能处于非事件状态的选项卡的图像。问题是，当使用此处显示的方法时，选项卡通常在捕获完成之前没有时间加载，从而导致失败。 chrome.tabs.update() 回调在标签页被捕获之前执行。
python - 如何在不保存的情况下在python窗口中显示图像/屏幕截图
我想在新的 tkinter 窗口 (TopLevel) 中显示我的屏幕截图，但我不想将其保存在电脑上。当我保存它时它工作正常但是当我尝试从内存加载屏幕截图时出现错误:图像不存在。我的主窗口是root
swift - 屏幕截图 - 奇怪的灰色区域
我正在 try catch 我当前所在的屏幕，因此当我覆盖下一个 View Controller 时，我可以使它成为它后面的 ImageView 并使其显示为半透明。这是有效的，但现在它在中间产生了一
c# - 文档的“屏幕截图”
我正在寻找将 docx(以及后来的 excel 和 powerpoint)文档的第一页转换为图像的方法。我宁愿不手动解析文档的整个 xml，因为这看起来工作量很大；) 所以我想我只是想收集一些关于如何
c# - 创建和删除图片/屏幕截图
好吧，碰巧我正在编写一个程序来截取一些屏幕截图，并且在处理另一个进程已经在使用的文件时遇到了一些困难，希望有人能帮助我找到一种方法来“关闭”这个进程或启发我如何继续. //Create a new b
带有通用状态栏的 Android 屏幕截图
我即将在 App Store 上发布我的应用程序，我想截取我的应用程序的屏幕截图，但状态栏中没有所有信息，例如运营商和 Debug模式等。我知道 Marshmallow 有一个 System UI
ios - UItableView 屏幕截图
UIGraphicsBeginImageContext(self.reportList.frame.size); CGRect tableViewFrame = self.reportList.fra
Android 屏幕截图 - 如何？
是否有任何简洁的方法来访问 android 设备的屏幕截图以编程方式。我正在寻找大约 15-20fps。我找到了一个代码android\generic\frameworks\base\service
screenshot - 为多个网站拍摄多个视口(viewport)屏幕截图
好的，我正在尝试为多个网站运行多个屏幕截图!我已经获得了多个站点的一个屏幕截图，我还可以获得一个站点的多个 Viewport 屏幕截图，但我有 34 个站点需要这样做!那么有人知道用 casperjs
ios - 我需要我没有的设备的 iOS 屏幕截图
我正在为 iOS 制作一个贴纸包，在将其提交到 App Store 之前，我需要包含至少一张来自 5.5 英寸 iPhone 和 12.9 英寸 iPad Pro 的应用截图。这些都是我没有的设备。

首页

博学

6Ren·AI

商城

screenshot - 屏幕截图上的运动检测