一、简介

PyAutoGUI是一个Python 第三方库,需要pip install 安装。它允许我们通过编程方式模拟鼠标和键盘的操作,窗口操作,以及界面的截图匹配。由于它是照搬人的操作,底层没有套牢在Windows系统,所以它可以跨平台。

二、安装

通过pip命令可以轻松安装PyAutoGUI

pip install pyautogui -i https://pypi.tuna.tsinghua.edu.cn/simple

三、主要功能

  • 鼠标操作:PyAutoGUI可以模拟鼠标移动、点击、拖拽等操作,可以控制鼠标的位置和点击的坐标。
  • 键盘操作:PyAutoGUI可以模拟键盘按键和组合键的操作,如按下和释放按键、输入文本等。
  • 屏幕操作:PyAutoGUI集成了pyscreeze模块,可以直接调用函数截屏、查找指定图像的位置等
  • 延时控制:PyAutoGUI可以控制鼠标和键盘操作的延时,以确保操作的正确性和稳定性。
  • 窗口控制:PyautoGUI集成了pygetwindow模块,可以直接调用函数获取窗口信息、控制窗口大小、移动、关闭等

3.1、基础功能

获取鼠标当前位置

import pyautoguiprint(pyautogui.position()) # Point(x=1964, y=1338)

获取屏幕大小

import pyautoguiprint(pyautogui.size())# Size(width=3840, height=2160)

判断坐标是否在屏幕中

import pyautoguiprint(pyautogui.onScreen(200, 200))print(pyautogui.onScreen(2000, 4000))

3.2、GUI控制功能

自动防故障功能

默认这项功能为True,意味着:当鼠标的指针在屏幕的最坐上方,程序会报错;目的是为了防止程序无法停止;

import pyautoguiprint(pyautogui.FAILSAFE)pyautogui.FAILSAFE = Falseprint(pyautogui.FAILSAFE)

停顿功能

这个停顿只是在用pyautogui控制鼠标和键盘时生效,如果是执行一般功能的命令,则该停顿不生效

import pyautoguipyautogui.PAUSE = 5pyautogui.moveTo(200, 200, duration=1);pyautogui.moveTo(2000, 1000, duration=1)

3.3、鼠标控制功能

控制移动鼠标

移动到指定位置

import pyautoguipyautogui.moveTo(100,300,duration=1) #(100,300)是坐标, duration 的作用是设置移动时间,单位秒,所有的gui函数都有这个参数,而且都是可选参数 相对移动,按方向移动

相对移动,按方向移动

import pyautoguipyautogui.moveRel(100,500,duration=4) # 第一个参数是左右移动像素值,第二个是上下移动像素值

控制鼠标点击

单击鼠标

import pyautoguipyautogui.click(10,10) # 鼠标点击指定位置,默认左键pyautogui.click(10,10,button='left') # 单击左键pyautogui.click(1000,300,button='right') # 单击右键pyautogui.click(1000,300,button='middle') # 单击中间 

双击鼠标

import pyautoguipyautogui.doubleClick(10,10) # 指定位置,双击左键pyautogui.rightClick(10,10) # 指定位置,双击右键pyautogui.middleClick(10,10) # 指定位置,双击中键 

按下和释放分解:点击&释放

import pyautoguipyautogui.mouseDown()pyautogui.mouseUp() # 两句命令相当于pyautogui.press()pyautogui.mouseDown(button='right') # 按下右键pyautogui.mouseUp(button='right', x=100, y=200) # 移动到(100,200),释放右键

控制鼠标拖动

拖动到指定位置

import pyautoguipyautogui.dragTo(100,300,duration=1) # 将鼠标拖动到指定的坐标

拖动到相对位置,按方向拖动

import pyautoguipyautogui.dragRel(100,500,duration=4) # 第一个参数是左右移动像素值,第二个是上下移动像素值, 向右拖动100px,向下拖动500px, 这个过程持续 4 秒钟

控制鼠标滚动

控制鼠标滚动的函数是scroll(), 传入一个整数的参数,说明向上或向下滚动多少个单位;单位根据操作系统不同而不同

import pyautoguipyautogui.scroll(300) # scroll up 300 "clicks"pyautogui.scroll(10) # scroll up 10 "clicks"pyautogui.scroll(10, x=100, y=100) # move mouse cursor to 100, 200, then scroll up 10 "clicks" 

补间/缓动函数(import Pytweening)

指示鼠标移动到目标位置时的进度,可以使鼠标移动变得更漂亮

3.4、键盘控制功能

按键

import pyautoguipyautogui.press('enter')# 按enter键,并释放pyautogui.press('f1')pyautogui.press(['left', 'left', 'left'])pyautogui.press('left', presses=3) # 可以设置按键次数

组合按键,按下&释放

例如:要在按住 Shift 键的同时按向左箭头键

import pyautoguipyautogui.keyDown('shift') # 按下shift键pyautogui.press('left') # 按左键,并释放pyautogui.keyUp('shift')# 释放shift键

输入字符串

import pyautoguipyautogui.write('Hello world!', interval=0.25)# interval 每个字符输入间隔时间

hold()上下文管理器

import pyautoguiwith pyautogui.hold('shift'):pyautogui.press(['left','left','left'])

热键hotkey()函数

hotkey()可以传递多个按键字符串,这些按键字符串将按顺序按下,然后按相反的顺序释放。

import pyautoguipyautogui.hotkey('ctrl','shift','esc)# 相当于以下代码# pyautogui.keyDown('ctrl')# pyautogui.keyDown('shift')# pyautogui.keyDown('esc')# pyautogui.keyUp('esc')# pyautogui.keyUp('shift')# pyautogui.keyUp('ctrl')

3.5、消息框功能

警报框

import pyautoguipyautogui.alert(text='This is an alert box', title='Test', button='OK')# 显示一个简单的消息框,其中包含文本和一个“确定”按钮。返回button键的值。

确认框/选择框

import pyautoguipyautogui.confirm('选择一项', buttons=['A', 'B', 'C'])pyautogui.confirm(text='',title='',buttons=['OK','N']) # 显示一个选择框,有多个按键,返回按键的值

提示输入框

import pyautoguipyautogui.prompt(text='',title='',default='') # 显示带有文本输入的消息框以及“确定”和“取消”按钮。返回输入的文本,如果单击“取消”,则返回None

密码输入框

import pyautoguipyautogui.password(text='', title='', default='', mask='*’)# 显示带有文本输入的消息框以及“确定”和“取消”按钮。键入的字符显示为*。返回输入的文本,如果单击“取消”,则返回None

3.6 桌面截图,图片匹配,像素点RGB信息

源码,从源码中可看到,引用了PyScreeze模块、Pillow模块,这两个模块会在安装pyautogui模块时一起安装。

引用的方法是红色框住的这些

截图功能

import pyautoguipyautogui.screenshot("C:\\Users\\XX\\test.png") # 全屏截图,传递一个文件名字符串会将截图保存到一个文件中,并将其作为一个Image对象返回。 pyautogui.screenshot("C:\\Users\\XX\\test.png", region=(0, 0, 300, 400)) # 非全屏截图,可选的region关键字参数。可以传递一个包含要捕获区域的左、顶、宽、高的四个整数元组

图片匹配

import pyautoguipyautogui.locateAll(needleImage, haystackImage, grayscale=None, region=None)# # 返回一个生成器,用tuple转换一下生成器,得到一个元组,元组中的每个元素是BOX类的实例对象,未匹配到则返回空元组pyautogui.locate(needleImage, haystackImage)# 返回值就是上图的b[0],即BOX类的一个实例对象,如果未匹配则报异常pyautogui.locateAllOnScreen(needleImage, minSearchTime)# 与locateAll()相比第二个参数变成了minSearchTime,可以理解最小匹配时间,会在这个时间中一直从当前界面找needleImage图,直至找到返回,返回值与pyautogui.locateAll一样,是返回一个生成器pyautogui.locateOnScreen(needleImage, minSearchTime)# 返回值是BOX类的一个实例对象,如果未匹配则报异常pyautogui.locateCenterOnScreen(needleImage)# 匹配失败返回异常,匹配成功返回一个Point类的一个实例,实例属性x, y坐标,匹配到的图片中心点pyautogui.locateOnWindow(image, title)# 里面使用了pygetwindow模块,匹配title的UI界面中是否包含image,返回值同pyautogui.locateOnScreen

像素点RGB信息

import pyautoguipyautogui.center((10, 10, 6, 8))# Point(x=13, y=14)# 返回一个Point类的一个实例,tuple转换后为一个元组pyautogui.pix(x, y)# 返回屏幕像素在x, y处的颜色作为RGB元组,每种颜色表示从0到255。(x,y)像素点的(r, g, b)pyautogui.pixelMatchesColor(x, y, (r, g, b))pyautogui.pixelMatchesColor(200,500, (60,63,65))# 返回True or False,即像素点的颜色匹配是否一致

3.7、窗口控制功能

PyautoGUI集成了pygetwindow模块,可以直接调用函数获取窗口信息、控制窗口大小、移动、关闭等

获得窗口对象

获得当前活动(聚焦)窗口的对象
import pyautoguipyautogui.getActiveWindow() # 返回当前活动(聚焦)窗口的对象
获得所有可见窗口的窗口对象列表
import pyautoguipyautogui.getAllWindows() # 返回所有可见窗口的窗口对象列表
获得当前活动(聚焦)窗口的标题
import pyautoguipyautogui.getActiveWindowTitle()# 返回当前活动(聚焦)窗口的标题
获得所有可见窗口的标题字符串列表
import pyautoguipyautogui.getAllTitles() # 返回所有可见窗口的标题字符串列表
获得标题文本中包含字符’ibox’的窗口对象列表
import pyautoguipyautogui.getWindowsWithTitle(“ibox”)# 返回标题文本中包含子字符'ibox'的窗口对象列表。
获得包含坐标点的窗口对象列表
import pyautoguipyautogui.getWindowsAt(2000, 2000)# 返回一个窗口对象列表,这些窗口包含坐标(2000, 2000)

控制窗口

窗口对象的属性
import pyautoguiwin = pyautogui.getWindowsWithTitle('Untitled')[0]# win是title是'Untitled'的窗口对象# 窗口对象的属性win.size#(132,100)返回元组,窗口大小win.width# 返回int,窗口的宽度win.height# 返回int,窗口的高度win.topleft# (10,10)返回元组,窗口最左上角坐标 win.bottomright# (200,200)返回元组,窗口最右下角坐标win.top# 返回int,窗口上边缘的y坐标值win.left# 返回int,窗口左边缘的x坐标值win.isMaximized# 返回bool,窗口是否是最大窗口win.isMinimized # 返回bool,窗口是否是最小窗口
窗口对象的方法
import pyautoguiwin = pyautogui.getWindowsWithTitle('Untitled')[0]# win是title是'Untitled'的窗口对象# 窗口对象的方法win.maximize() # 窗口最大化win.minimize() # 窗口最大化win.restore() # 恢复窗口大小win.resize(200,200) # 窗口x轴增加200,y轴增加200win.resizeTo(200,200) # 窗口变化至x轴宽度200,y轴宽度200win.move(10, 10) # 窗口相对当前位置x轴移动10,y轴移动10win.moveTo(10, 10) # 窗口移动至10,y轴移动至10,左上角坐标(10,10)

四、应用

自动化测试

可以模拟用户的操作,用于自动化测 试各种软件和系统的功能。

数据采集和处理

可以帮助自动化从网页或应用程序中采集数据,并进行处理和分析。

软件演示和教程录制

可以用于自动化演示软件的功能和操作,录制教程视频等。

游戏辅助工具

可以用来制作游戏辅助工具,自动化完成一些重复性操作。

五、官方文档

Pyautogui

https://pyautogui.readthedocs.io/en/latest/msgbox.html

Pygetwindow

https://pygetwindow.readthedocs.io/en/latest/#

Pillow/PIL

https://pillow.readthedocs.io/en/latest/#

Pyscreeze

https://github.com/asweigart/pyscreeze