python - 如何识别图像并点击它们-6ren

python - 如何识别图像并点击它们

转载作者：行者123 更新时间：2023-12-05 01:09:46

26

4

我想制作一个脚本，根据询问的内容点击图像，它需要通过图像列表。例如，如果程序要求用户点击绿色圆圈:

question_list = greencircle, redcircle, bluesquare, redtriangle

if(greencircle == greencircle.png){
    pyautogui.click(greencircle.png)
}

有人可以帮忙吗？

最佳答案

PyAutoGUI 有一个内置的 function调用 locateOnScreen() 如果它可以在当前屏幕上找到它，则返回图像中心的 x、y 坐标(它会截取屏幕截图然后分析它)。

图片必须完全匹配才能正常工作；即，如果您想单击 button.png 该按钮图片必须与窗口中的按钮具有相同的大小/分辨率，以便程序识别它。实现此目的的一种方法是截取屏幕截图，在绘图中打开它，然后只剪下您想要按下的按钮(或者您可以让 PyAutoGUI 为您完成，我将在后面的示例中展示)。

import pyautogui

question_list = ['greencircle', 'redcircle', 'bluesquare', 'redtriangle']

user_input = input('Where should I click? ')

while user_input not in question_list:
    print('Incorrect input, available options: greencircle, redcircle, bluesquare, redtriangle')
    user_input = input('Where should I click?')

location = pyautogui.locateOnScreen(user_input + '.png')
pyautogui.click(location)

上面的例子要求你已经有 greencircle.png 和你目录中的所有其他 .png

PyAutoGUI 也可以取screenshots并且您可以指定要拍摄屏幕的哪个区域 pyautogui.screenshot(region=(0, 0, 0, 0)) 前两个值是左上角的 x,y 坐标您要选择的区域，第三个是向右多远(x)，第四个是向下多远(y)。

以下示例截取 Windows 10 Logo ，将其保存到文件中，然后使用指定的 .png 文件单击 Logo

import pyautogui

pyautogui.screenshot('win10_logo.png', region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen('win10_logo.png')
pyautogui.click(location)

您也不必将屏幕截图保存到文件中，只需将其保存为变量即可

import pyautogui

win10 = pyautogui.screenshot(region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen(win10)
pyautogui.click(location)

让程序检测用户是否点击了某个区域(比如说，windows 10 Logo )将需要另一个库，如 pynput .

from pynput.mouse import Listener    

def on_click(x, y, button, pressed):
    if 0 < x < 50 and 1080 > y > 1041 and str(button) == 'Button.left' and pressed:
        print('You clicked on Windows 10 Logo')
        return False    # get rid of return statement if you want a continuous loop

with Listener(on_click=on_click) as listener:
    listener.join()

把它们放在一起

import pyautogui
from pynput.mouse import Listener

win10 = pyautogui.screenshot(region=(0, 1041, 50, 39))
location = pyautogui.locateOnScreen(win10)

# location[0] is the top left x coord
# location[1] is the top left y coord
# location[2] is the distance from left x coord to right x coord
# location[3] is the distance from top y coord to bottom y coord

x_boundary_left = location[0]
y_boundary_top = location[1]
x_boundary_right = location[0] + location[2]
y_boundary_bottom = location[1] + location[3]


def on_click(x, y, button, pressed):
    if x_boundary_left < x < x_boundary_right and y_boundary_bottom > y > y_boundary_top and str(button) == 'Button.left' and pressed:
        print('You clicked on Windows 10 Logo')
        return False    # get rid of return statement if you want a continuous loop


with Listener(on_click=on_click) as listener:
    listener.join()

关于python - 如何识别图像并点击它们，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64790303/

26

4

0

文章推荐： dart - 有没有办法在 dart 中本地化数字和日期？

文章推荐： scheme - Racket 图的语法

文章推荐： hacklang - 如何在hacklang中迭代形状的字段？

文章推荐： c++ - pow 在 CUDA 的 __device__ 函数中无法正常工作

javascript - 点击 child 不会触发 parent 点击
当点击content 时，我想触发我的alert。我的 content 中可以有任意数量的子元素，所以我不想对每个元素都进行硬编码。我想也许我可以监听对该父元素的点击，然后每次点击子元素都会触发我的操
objective-c - 检测 Cocoa 应用程序中的用户事件(点击、点击……)
对于 Mac 应用程序，我想检测应用程序中的用户事件，因此我可以定期让 Web 服务知道用户在端点上仍然处于事件状态。在 Cocoa Touch 中，我会覆盖 UIApplication 的 sen
Javascript-点击
第一次在这里发帖，但天知道我一直使用这个网站来搜索问题 :P 好吧，我现在遇到了自己的问题，我似乎无法轻松地在 Google 上搜索，在玩了大约 2 小时后，我终于决定发布一个问题，看看你们是怎么想的
AngularJS 点击 TouchStart
Angular 触控 ngTouch导致在触摸释放时发生点击。有没有办法让点击发生在触摸开始？ fast-click下面的指令似乎可以在触摸屏上执行我想要的操作，但它不适用于鼠标点击。 myApp.
Flutter - 点击/触摸区域如何工作？
1) 如果我有这个，当我点击子 Container 时它不会打印'tap': Container( color: Colors.red, child: GestureDetector(
jquery解除绑定(bind)点击
我简直要发疯了，只是想从 jQuery 中的事件中解除 onclick 处理程序的绑定(bind)，以便稍后可以将其绑定(bind)到另一个函数。我已将代码隔离在测试页中，因此除了核心之外什么都没有
jquery - 如何在jquery中触发Live()点击
我有一个有趣的情况。我需要触发实时点击，因为简单的点击不起作用。这就是我所拥有的: $('.text').trigger('click'); 但我需要这样的东西: $('.text').trigge
javascript - 点击 'Confirm'后没有出现警告窗口
这是我的作业，这是我第一次做表单验证。以下代码分别是我的HTML代码和JavaScript代码。 HTML 代码: First N
magento - 如何获取特定产品的浏览/点击
正如标题所示，如何获取 Magento 中特定产品的浏览量/点击量/展示次数。欢迎任何帮助。最佳答案这个简单的示例将为您提供在您指定的日期+其查看次数之间查看过的产品列表: $fromDate =
java - fragment 点击
我正在创建一个应用程序，但在其中遇到错误。我想在按钮上添加 OnclickListner。该按钮位于 fragment 类上。从这个 fragment 类我想继续另一个类。代码如下: fragment
点击 PHP "continue"
我在数组中有一些值。首先，我想在 View 中显示该数组的前两个值，接下来我想在某些按钮单击操作后显示剩余的值，并将数组索引增加 1。例如:一次点击显示第三个值，然后另一次点击显示第四个值。我怎样才
jquery - 如何查看CMD+点击
在下面的代码片段中，如果在链接上执行“CMD+CLICK”，则不会显示 alert('CMD')。这是为什么？我想在用户按下 CMD 按钮(或 Windows 上的 CTRL 键)+单击 href
javascript - 点击()开始加载
我希望在单击链接时开始加载一些内容。在单击该链接之前，我不希望它使用任何带宽。另外如何实现几乎所有灯箱中都能看到的旋转光标动画？最佳答案使用$.ajax()函数动态加载内容。对于动画，请找到一个
javascript - 点击 'a'打开两个链接
我有如下的 DOM: users 当用户点击按钮时，它会将新的“td”附加到“tr”。它运作良好。问题:单击“a”我想打开两个链接。最好的方法是首先将当前页面重定向到另一个页面，然后
javascript - 显示数组项一次(点击)
这是我正在尝试做的.. 点击按钮会显示一个随机数组项。数组项只能显示一次。目前我已经将代码设置为: 点击随机数组项显示。按钮点击继续循环，没有结束。按钮点击多次显示元素。这是代码的链接 ht
C# 编程鼠标移动/点击
我想创建...基本上是一个宏程序。点击记录后，它会记录所有鼠标(可能最终是键盘)事件。然后你可以保存，然后播放，鼠标应该移动并点击在相同的地方当你录制它时它会发生。我知道如何获取全局鼠标事件，但我不
android - ListView 点击？
我有一个关于将 onClick 添加到 ListView 的问题，我已经尝试尽可能多地遵循 Android NotePad 教程，但是对于我的布局我不太明白如何添加它。这是 Activity 类，它
javascript - 点击/点击不适用于触摸屏
我正在使用一个网站以表格的形式显示信息。用户可以单击表格中的行来更改它们的颜色，我还有一个按钮允许用户暂停页面的刷新，这样就不会添加新信息。这两个功能都适用于桌面，但不适用于触摸屏。我的第一个想法是触
javascript - 点击标签时的事件顺序
所以我的网站上有一个正常的链接，我想为它添加跟踪。我可以设想很多方法来做到这一点，但我已经确定通过编写一个小的 jquery 函数并在我的标签中放置一个小片段来实现这一点非常简单: click me!
Android - ImageButton 点击
我正在尝试使我的图片按钮看起来不错。我尝试了几种不同的方法，但它们看起来都不对。这是一个圆形图像，我想让它看起来像是可以按下的。这是我到目前为止所得到的。 android:textAppearance

首页

博学

6Ren·AI

商城

python - 如何识别图像并点击它们