web自动化框架:selenium学习使用操作大全(Python版)

目录

    • 一、浏览器驱动下载
    • 二、selenium-python安装(打开网站、操作元素)
    • 三、网页解析(HTML、xpath)
    • 四、selenium基本操作
      • 1、元素定位八种方法
      • 2、元素动态定位
      • 3、iframe切换
      • 4、填充表单_填充文本框
      • 5、填充表单_单选按钮
      • 6、填充表单_下拉列表
      • 7、切换窗口和标签页
      • 8、显式等待
      • 9、隐式等待
      • 10、警告框
      • 11、confirm确认框
      • 12、prompt提示框
      • 13、鼠标操作动作链
      • 14、执行js代码_滚动1
      • 15、执行js代码_滚动2
      • 16、上传操作_input上传
      • 17、上传操作_非input上传_pywinauto
      • 18、上传操作_非input上传_pyautogui
    • 五、selenium调整窗口大小
    • 六、判断元素是否允许被操作
    • 七、获取某个元素的html
    • 八、其他问题
      • 1、svg定位
      • 2、处理chrome显示通知弹框
      • 3、获取元素的文本
      • 4、切换网址
      • 5、find_element_by_xpath()被弃用解决方案

一、浏览器驱动下载

Selenium需要浏览器驱动程序才能与所选浏览器交互。例如,Firefox需要安装geckodriver。确保它在PATH中。

主流浏览器驱动下载地址如下:

浏览器驱动名称打开方式及注意事项地址
Chromechromedriverdriver = webdriver.Chrome()
下载浏览器对应版本的chromedriver.exe
一定要创建对象,不然打开会闪退!!!
https://registry.npmmirror.com/binary.html?path=chromedriver
Firefoxgeckodriverwebdriver.Firefox()
下载最新版本的geckodriver.exe
https://github.com/mozilla/geckodriver/releases
EdgeMicrosoftWebDriverdriver = webdriver.Edge()
最好在官网下载对应版本的浏览器:https://www.microsoft.com/en-us/edge,然后下载浏览器对应版本的msedgedriver.exe
一定要创建对象,不然打开会闪退!!!
windows10运行代码时:将msedgedriver.exe重命名为MicrosoftWebDriver.exe,不然运行程序会报错!!!
windows11运行代码时:msedgedriver.exe不要重命名!!!
https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver
IEIEDriverServerwebdriver.Ie()
下载selenium对应版本的IEDriverServer.exe
https://registry.npmmirror.com/binary.html?path=selenium

具体,可以查看:chromedriver、geckodriver、MicrosoftWebDriver、IEDriverServer和operadriver之间的恩怨纠葛
ps:最新版chromedriver的下载地址:
https://googlechromelabs.github.io/chrome-for-testing/#stable

二、selenium-python安装(打开网站、操作元素)

1.安装

pip install -U selenium

注:-U就是指定下载最新版本的selenium
2. 控制浏览器
2.1 打开浏览器

from selenium import webdriver# 打开浏览器driver = webdriver.Chrome()

或者,可以指定驱动路径:

driver = webdriver.Chrome(executable_path=r'D:\Program Files\Python36\chromedriver.exe')

关闭浏览器及其对应驱动:

driver.quit()

还可以通过上下文来控制其执行操作后自动关闭:

with webdriver.Chrome(executable_path='chromedriver.exe') as driver:driver......

2.2 打开网站

driver.get('https://blog.csdn.net/testleaf/article/details/123269042')

延时3秒:

import timetime.sleep(3)

2.3 定位元素
传说中的八大元素定位方法:

driver.find_element_by_id() # 通过id属性定位(唯一);常用driver.find_element_by_xpath()# 通过xpath表达式定位;常用driver.find_element_by_class_name() # 通过类名定位;常用driver.find_element_by_name() # 通过name属性定位driver.find_element_by_tag_name() # 通过标签名定位driver.find_element_by_css_selector() # 通过css选择器定位driver.find_element_by_link_text()# 通过链接标签的text类容定位driver.find_element_by_partial_link_text()# 通过匹配链接标签的text类容定位

上面的都是找到第一个元素,每一个方法都有对应多个元素的方法:
如:driver.find_elements_by_id()

示例1:
driver.find_element_by_id(“toolbar-search-input”)
图片[1] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL
示例2:
driver.find_element_by_name(“wd”)
图片[2] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL
2.4 操作元素

# 定位搜索框element = driver.find_element_by_id("toolbar-search-input")# 输入搜索内容element.send_keys('web自动化框架:selenium入门')# 定位搜索按钮search_button = driver.find_element_by_id('toolbar-search-button')# 点击搜索按钮search_button.click()

三、网页解析(HTML、xpath)

1.HTML
HTML【Hyper Text Markup Language】:超文本标记语言,不是编程语言,用来描述网页的。也称为:网页的源码、html源码、html文档、document。
具体,可以查看:
网页的源码,html源码,html文档,document
HTML常用标签
HTML示例:

<!DOCTYPE html><html lang="zh-CN"><head><meta charset="UTF-8"><title>Title</title><style>#table {border: 1px solid}.th {font-size: 20px}</style></head><body><div>我是一个div标签</div><h1>我是一个大<span style="color:red">标签</span></h1><p></p><a href="https://blog.csdn.net/testleaf">testleaf</a><table id="table"><thead><tr><th class="th aaa">字段1</th><th class="th">字段2</th><th class="th">字段3</th></tr></thead><tbody><tr><td>1</td><td>2</td><td>3</td></tr></tbody></table><form action=""><p>用户名: <input type="text"></p><p>密码:<input type="password"></p><p><input type="submit"></p></form></body></html>

2.xpath
xpath:一个解析html/xml的语言。

  • 语法
    • 选取节点
      • nodename 选取此节点的所有子节点
      • / 从根节点选取
      • // 从匹配选择的当前节点选择文档中的节点,不考虑它们的位置
      • . 选取当前节点
      • … 表示选取当前节点的父节点,如://div[@class="active"]/..
      • @ 选取属性
      • 案例
        • //div 获取文档中的所有的div
    • 谓语 用来查找特定的节点,或者包含指定值的节点
      • 谓语被包裹在中括号中
      • //div[@class="active"]
      • //div[@class="active" and @id="kw"]
      • //div[@class="active" or @id="kw"]
      • //div[@class="active"]/span[last()]
    • 轴 用来查找相对于当前节点的节点
      • 使用语法 轴名称::节点名称[谓语]
      • ancestor 选取当前节点的所有父辈节点
      • parent 选取当前节点的父节点
      • 如://div[@class="active"]/child::book
      • …详见 https://www.w3school.com.cn/xpath/xpath_axes.asp
    • 函数
      • text() 元素的text内容
        • //li[text()="强烈推荐"]
      • contains(@属性名/text(), value)包含的内容
        • //li[contains(@class, "ls")]

在浏览器中进行验证:

$x('//div')

图片[3] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL

四、selenium基本操作

Pycharm-Terminal操作:

IPYTHONfrom selenium import webdriverdriver = webdriver.Chrome()driver.get('https://www.baidu.com')driver.quit()exit()

图片[4] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL
浏览器-Console操作:

window.scrollTo(0,100)

图片[5] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL

1、元素定位八种方法

传说中的八大元素定位方法:

driver.find_element_by_id() # 通过id属性定位(唯一);常用driver.find_element_by_xpath()# 通过xpath表达式定位;常用driver.find_element_by_class_name() # 通过类名定位;常用driver.find_element_by_name() # 通过name属性定位driver.find_element_by_tag_name() # 通过标签名定位driver.find_element_by_css_selector() # 通过css选择器定位driver.find_element_by_link_text()# 通过链接标签的text类容定位driver.find_element_by_partial_link_text()# 通过匹配链接标签的text类容定位

以上方法只会返回匹配到的第一个元素;
返回的是 selenium.webdriver.remote.webelement.WebElement的对象;
返回多个元素在element后加s即可,例如:driver.find_elements_by_xpath(),使用时要小心;
凡是elements的方法返回的是列表;

from selenium import webdriverdriver = webdriver.Chrome()# 打开百度页面driver.get('https://www.baidu.com')# 1. 获取搜索框search_input = driver.find_element_by_id('kw')print(type(search_input))print('1.搜索框的name属性值=', search_input.get_attribute('name'))# 2. 搜索按钮search_btn = driver.find_element_by_xpath('//input[@value="百度一下"]')print('2.搜索按钮的id=', search_btn.get_attribute('id'))# 3. 百度logologo = driver.find_element_by_class_name('index-logo-src')print('3.百度logo的src=', logo.get_attribute('src'))# 4. 通过name属性定位搜索框search_input_by_name = driver.find_element_by_name('wd')print('4.搜索框的id=', search_input_by_name.get_attribute('id'))# 5. 热搜榜中的链接hot_ul = driver.find_element_by_xpath('//ul[@id="hotsearch-content-wrapper"]')# hot_ul = driver.find_element_by_xpath('//ul[@text()="热榜"]')hot_a_s = hot_ul.find_element_by_tag_name('a')print('5.热搜榜第一的标题是:', hot_a_s.text)# 6. 通过css选择器定位搜索框search_input_by_css = driver.find_element_by_css_selector('#kw')print('6.搜索框的name=', search_input_by_css.get_attribute('name'))# 7. 新闻栏目el_a = driver.find_element_by_link_text('新闻')print('7.新闻栏目的url=', el_a.get_attribute('href'))# 8. 通过部分text匹配新闻栏目el_a1 = driver.find_element_by_partial_link_text('新')print('8.新闻栏目的url=', el_a1.get_attribute('href'))driver.quit()

2、元素动态定位

问题:元素的定位方式不确定,可能是id,可能是xpath,需要通过不同的方式动态指定定位方法;
办法:加判断语句,不需要我们写,selenium底层定位就是这么做的;

driver.find_element(by,value)driver.find_elements(by,value)

by: 定位方式
value: 定位表达式

import timefrom selenium import webdriverfrom selenium.webdriver.common.by import Bydriver = webdriver.Chrome()# 打开百度页面driver.get('https://www.baidu.com')id_loc = 'kw'xpath_loc = '//input[@id="kw"]'e1 = driver.find_element(By.ID, id_loc)# send_keys往输入框输入文本e1.send_keys('我通过id定位')time.sleep(3)# e2 = driver.find_element(By.XPATH, xpath_loc)e2 = driver.find_element('xpath', xpath_loc)e2.clear()# 清空原有内容e2.send_keys('我通过xpath定位')time.sleep(3)driver.quit()

3、iframe切换

当页面中包含iframe时,不能直接操作iframe中的元素,需要先切换进iframe才行;
selenium通过driver.switch_to.frame(frame_reference)来切换;
selenium切换iframe有三种方式:

  • 1.通过webelement:
    • 使用webelement进行切换是最灵活的选择,先定位到iframe然后切换到它;
  • 2.通过name或id:
    • iframe一般都会有id或name属性,则可以使用该属性进行切换,如果name或id在页面上不唯一,name将切换到找到的第一个;
  • 3.通过iframe在页面中的索引进行切换(从0开始):
    • 在浏览器console调试工具中使用window.ampInaboxIframes可以查询当前页面中的iframe;退出iframe:driver.switch_to.default_content()
import timefrom selenium import webdriver# 使用with语句进行上下文管理# 异常时也会关闭浏览器驱动with webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=eg_html_form_radio')# 切换iframe# 1. webelement的方式# 先获取到iframeiframe = driver.find_element_by_id('iframeResult')# 再切换到driver.switch_to.frame(iframe)# 2. name/id的方式# 直接通过name/id切换driver.switch_to.frame('iframeResult')# 3. 使用索引# 切换到第二个iframetime.sleep(1)driver.switch_to.frame(1)# 找到female单选框female = driver.find_element_by_xpath('//input[@value="female"]')print(female)# 4. 离开iframe,回到主页面driver.switch_to.default_content()driver.find_element_by_xpath('//a[text()="运行代码"]')

4、填充表单_填充文本框

import timefrom selenium import webdriverwith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')# 搜索框定位search_input = driver.find_element_by_id('kw')# element.send_keys(string)输入文本# 所有可输入的标签都适用search_input.send_keys('软件测试')# 搜索按钮定位search_btn = driver.find_element_by_xpath('//input[@value="百度一下"]')# 点击# element.click()点击search_btn.click()time.sleep(3)

5、填充表单_单选按钮

import timefrom selenium import webdriverwith webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=eg_html_form_radio')# 切换iframeiframe = driver.find_element_by_id('iframeResult')driver.switch_to.frame(iframe)# 找到female单选框female = driver.find_element_by_xpath('//input[@value="female"]')# 在元素上点击female.click()# 选中time.sleep(5)

6、填充表单_下拉列表

下拉框有两种处理方法:
(1)直接定位到要选中的option选项,然后点击
(2)通过selenium.webdriver.support.ui.Select类

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import Selectwith webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=eg_html_elements_select')# 切换iframeiframe = driver.find_element_by_id('iframeResult')driver.switch_to.frame(iframe)# 找到audi选项# 1. 通过option直接操作option = driver.find_element_by_xpath('//option[@value="audi"]')option.click()time.sleep(1)# 2. 通过select类# 找到selectselect = Select(driver.find_element_by_xpath('//select[@name="cars"]'))## # 选中索引为1的选项,索引从0开始select.select_by_index(1)time.sleep(1)## # 选中value等于audi的选项select.select_by_value('audi')time.sleep(1)## # 选中option的文本为Volvo的选项select.select_by_visible_text('Volvo')time.sleep(3)

7、切换窗口和标签页

webdriver 不区分窗口和标签页。打开一个新的标签页或者窗口,selenium会使用窗口句柄来处理它。
每个窗口都有一个唯一的标识符,该标识符在单个会话中保持持久性。
(1)获取当前窗口句柄:driver.current_window_handle
(2)切换窗口或标签页:通过循环遍历的方式来切换;

import timefrom selenium import webdriverwith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')# 找到搜索框search_input = driver.find_element_by_id('kw')search_input.send_keys('图片')# 点击搜索按钮driver.find_element_by_id('su').click()time.sleep(1)# 获取原窗口的handleoriginal_window = driver.current_window_handleprint('当前窗口句柄', original_window)print('窗口的title', driver.title)# 选取第一个结果并点击driver.find_element_by_xpath('//div[@id="3001"]//a').click()# time.sleep(1)for handle in driver.window_handles:if handle != original_window:# 切换到新窗口driver.switch_to.window(handle)break# 打印当前窗口句柄print('新打开的搜索页面句柄', driver.current_window_handle)print('新打开的页面的title', driver.title)time.sleep(5)

8、显式等待

浏览器渲染页面的时候需要时间,如果没有渲染完成就对元素进行定位将会找不到到该元素;
所以需要加延时进行等待,有三种等待方式:
(1)time.sleep()
前面已经反复使用了;等待时间固定,不稳定;等待时间多半不确定;

(2)显式等待
显式等待就是在元素操作前循环判断操作的条件是否满足,满足后再操作;
selenium通过selenium.webdriver.support.ui.WebDriverWait类的对象来实现显式等待;webDriverWait类实例化时可以接收3个参数:

  • driver: webdriver对象
  • timeout:超时时间,最多等待多少秒
  • poll_frequency: 检查频率,默认0.5秒

until方法接受1个参数:

  • conditions:条件在selenium.webdriver.support.expected_conditions 模块中;
    常见条件:
    presence_of_element_located:元素存在于dom中
    visibility_of_element_located:元素可见
    element_to_be_clickable:元素可点击
    element_to_be_selected:元素可选择

实例化条件需要传入一个定位参数,是一个二元元组:(by, loc_expression)

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.common.by import Byimport selenium.webdriver.support.expected_conditions as ECwith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')# 找到搜索框search_input = driver.find_element_by_id('kw')search_input.send_keys('图片')# 点击搜索按钮driver.find_element_by_id('su').click()# 获取原窗口的idoriginal_window = driver.current_window_handleprint('当前窗口句柄', original_window)print('窗口的title', driver.title)# 选取第一个结果并点击## WebDriverWait(driver, timeout=3).until(# EC.visibility_of_element_located((By.XPATH, '//div[@id="3001"]//a'))# ).click()s_time = time.time()btn = WebDriverWait(driver, timeout=3).until(EC.visibility_of_element_located((By.ID, '3001')))btn.click()e_time = time.time()print(e_time-s_time)# WebDriverWait(driver, timeout=3).until(# EC.visibility_of_element_located(('id', '3001'))# ).click()# 会等待id为3001的元素可见,timeout=3表示最多等待3秒钟,超时就抛出异常# driver.find_element_by_xpath('//div[@id="3001"]//a').click()# time.sleep(1)for handle in driver.window_handles:if handle != original_window:# 切换到新窗口driver.switch_to.window(handle)break# 打印当前窗口句柄print('新打开的搜索页面句柄', driver.current_window_handle)print('新打开的页面的title', driver.title)time.sleep(5)

9、隐式等待

(3)隐式等待
隐式等待本质上是设置了一个全局等待时间,WebDriver在试图查找任何元素时都会轮询一定时间,默认情况下隐式等待是禁用的。
警告:不要混用隐式等待和显示等待,这样会导致不可预测的等待时间。
例如:隐式等待设置10秒,显式等待设置15秒,可能导致在20秒后发生超时;
隐式等待是告诉WebDriver如果在查找一个或多个不是立即可用的元素时轮询DOM一段时间。默认设置为0,表示禁用。一旦设置好,隐式等待就会被设置为会话的生命周期。

import timefrom selenium import webdriverwith webdriver.Chrome() as driver:# 设置隐式等待5秒driver.implicitly_wait(5)driver.get('https://www.baidu.com')# 找到搜索框search_input = driver.find_element_by_id('kw')search_input.send_keys('图片')# 点击搜索按钮driver.find_element_by_id('su').click()# 获取原窗口的idoriginal_window = driver.current_window_handleprint('当前窗口句柄', original_window)print('窗口的title', driver.title)# 选取第一个结果并点击driver.find_element_by_xpath('//div[@id="3001"]//a').click()for handle in driver.window_handles:if handle != original_window:# 切换到新窗口driver.switch_to.window(handle)break# 打印当前窗口句柄print('新打开的搜索页面句柄', driver.current_window_handle)print('新打开的页面的title', driver.title)time.sleep(5)

10、警告框

WebDriver提供了一个API,用于处理JavaScript提供的三种类型的原生弹窗消息
(1)Alerts警告框

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=js_alert')driver.switch_to.frame('iframeResult')button = WebDriverWait(driver, timeout=3).until(EC.visibility_of_element_located(('xpath', '//button')))# 有时候需要结合sleep来处理# time.sleep(1)button.click()# time.sleep(3)# 等待alert弹出alert = WebDriverWait(driver, timeout=3).until(EC.alert_is_present())# time.sleep(1)# alert = driver.switch_to.alert# 获取弹出框文本text = alert.textprint(text)time.sleep(1)# # 确认alert.accept()time.sleep(1)

11、confirm确认框

(2) confirm确认框
与警告框不同,确认框还有取消按钮;

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=js_confirm')driver.switch_to.frame('iframeResult')button = WebDriverWait(driver, timeout=3).until(EC.visibility_of_element_located(('xpath', '//button')))button.click()# # 等待confirm弹出WebDriverWait(driver, timeout=3).until(EC.alert_is_present())## # 获取alertalert = driver.switch_to.alert## # 获取弹出框文本text = alert.textprint(text)time.sleep(2)# # 取消# 点击取消后 当前的alert对象就会被销毁alert.dismiss()# alert.accept() 确认time.sleep(2)

12、prompt提示框

(3)prompt提示框
还可以输入文本;

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get('https://www.w3school.com.cn/tiy/t.asp?f=js_prompt')driver.switch_to.frame('iframeResult')button = WebDriverWait(driver, timeout=3).until(EC.visibility_of_element_located(('xpath', '//button')))# 避免js没有绑定出现意外问题,加一秒延时time.sleep(1)button.click()# 等待alert弹出WebDriverWait(driver, timeout=3).until(EC.alert_is_present())# 获取alertalert = driver.switch_to.alert# 输入信息alert.send_keys('testleaf')time.sleep(3)# 确认alert.accept()# alert.dismiss() 取消time.sleep(3)

13、鼠标操作动作链

鼠标是通过使用底层接口执行的,需要调用ActionChains对象来执行对应的方法。
(1)clickAndHold:它将移动到该元素,然后在给定元素的中间单击(不释放);
(2)contextClick:此方法首先将鼠标移动到元素的位置, 然后在给定元素执行上下文点击(右键单击);
(3)doubleClick:它将移动到该元素, 并在给定元素的中间双击;
(4)moveToElement:此方法将鼠标移到元素的中间. 执行此操作时, 该元素也会滚动到视图中;
(5)moveByOffset:此方法将鼠标从其当前位置(或0,0)移动给定的偏移量. 如果坐标在视图窗口之外, 则鼠标最终将在浏览器窗口之外;
(6)dragAndDrop:此方法首先在源元素上单击并按住,然后移动到目标元素的位置后释放鼠标;
(7)release:此操作将释放按下的鼠标左键. 如果WebElement转移了, 它将释放给定WebElement上按下的鼠标左键;

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get(r'file://D:\project\action.html')div = WebDriverWait(driver, timeout=3).until(EC.visibility_of_element_located(('xpath', '//div[@οnmοuseοver="mOver(this)"]')))# 移动到指定元素 move_to_elementwebdriver.ActionChains(driver).move_to_element(div).perform()time.sleep(2)# 移开多大位置x,y move_by_offsetwebdriver.ActionChains(driver).move_by_offset(xoffset=500, yoffset=500).perform()time.sleep(2)# 点住不放 click_and_holddiv = driver.find_element_by_xpath('//div[@οnmοusedοwn="mDown(this)"]')webdriver.ActionChains(driver).click_and_hold(div).perform()time.sleep(2)# 松开鼠标 releasewebdriver.ActionChains(driver).release(div).perform()time.sleep(2)# double_click 双击button = driver.find_element_by_xpath('//button[@ondblclick]')webdriver.ActionChains(driver).double_click(button).perform()time.sleep(2)# drag 将div1拖拽到div2上div1 = driver.find_element_by_id('draggable')div2 = driver.find_element_by_id('droppable')webdriver.ActionChains(driver).drag_and_drop(div1, div2).perform()time.sleep(3)# contextClick 点击鼠标右键div = driver.find_element_by_xpath('//div[@οnmοusedοwn="whichButton(event)"]')webdriver.ActionChains(driver).context_click(div).perform()time.sleep(2)

14、执行js代码_滚动1

selenium执行js有几个方法,这里我们使用最常用的方法execute_script;

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get('https://image.baidu.com')search_input = WebDriverWait(driver, 3).until(EC.visibility_of_element_located(('id', 'kw')))search_input.send_keys('软件测试')WebDriverWait(driver, 3).until(EC.element_to_be_clickable(('xpath', '//input[@value="百度一下"]'))).click()time.sleep(3)# 滚动到(0px,100px)的位置driver.execute_script("window.scrollTo(0,100)")time.sleep(1)driver.execute_script("window.scrollTo(0,200)")time.sleep(1)driver.execute_script("window.scrollTo(0,300)")time.sleep(3)# 移动到底部driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")time.sleep(3)# 移动到顶部driver.execute_script("window.scrollTo(0,0)")time.sleep(3)

15、执行js代码_滚动2

selenium执行js有几个方法,这里我们使用最常用的方法execute_script
执行js时,还可以传递参数给js脚本;
下面的案例:
打开页面,并滚动到指定的元素可见为止;
下面的代码 div 被传递给了arguments,通过切片的方式可以取出;

import timefrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECwith webdriver.Chrome() as driver:driver.get(r'file://D:\project\scroll.html')time.sleep(2)div = driver.find_element_by_xpath('//div')# 移动到元素的底端与当前窗口的底部对齐driver.execute_script("arguments[0].scrollIntoView(false);", div)time.sleep(2)# 移动到元素的顶端与当前窗口的顶端对齐driver.execute_script("arguments[0].scrollIntoView();", div)time.sleep(2)

16、上传操作_input上传

selenium只支持input元素的上传,直接使用send_keys将文件绝对地址写入元素即可;

import timefrom selenium import webdriverwith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')span = driver.find_element_by_xpath('//span[@class="soutu-btn"]')span.click()time.sleep(1)input = driver.find_element_by_xpath('//input[@class="upload-pic"]')input.send_keys(r'D:\project\find.jpg')# 有可能还需要提交的操作,百度是不需要time.sleep(10)

17、上传操作_非input上传_pywinauto

很多时候页面不是使用input来进行文件上传,这是就需要通过其他第三方包来操作系统界面;
(1)pywinauto
缺点: 只能在windwows上使用;
优点:可以选择多个文件,路径中有中文也可以;

import timefrom selenium import webdriverfrom pywinauto.keyboard import send_keyswith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')span = driver.find_element_by_xpath('//span[@class="soutu-btn"]')span.click()time.sleep(1)# select_span = driver.find_element_by_xpath('//span[text()="选择文件"]')select_span = driver.find_element_by_xpath('//div[@class="upload-wrap"]')# 点击打开选择文件窗口select_span.click()time.sleep(3)# 选择文件send_keys(r'D:\project\find.jpg')time.sleep(1)# # 选择确定send_keys('{ENTER}')time.sleep(10)

18、上传操作_非input上传_pyautogui

很多时候页面不是使用input来进行文件上传,这里就需要通过其他第三方包来操作系统界面;
(2)pyautogui
缺点: 只能选择一个文件,文件路径有中文会出问题;
优点:跨平台(windows,mac,linux);

import timefrom selenium import webdriverimport pyautoguiwith webdriver.Chrome() as driver:driver.get('https://www.baidu.com')span = driver.find_element_by_xpath('//span[@class="soutu-btn"]')span.click()time.sleep(1)# select_span = driver.find_element_by_xpath('//span[text()="选择文件"]')select_span = driver.find_element_by_xpath('//div[@class="upload-wrap"]')# 点击打开选择文件窗口select_span.click()time.sleep(3)# 选择文件pyautogui.write(r"D:\project\find.jpg")time.sleep(1)# 选择确定pyautogui.press('enter', 2)time.sleep(10)

五、selenium调整窗口大小

selenium调整窗口到指定大小:

driver.set_window_size(900,1000)

浏览器最大化:

driver.maximize_window() 

六、判断元素是否允许被操作

driver.find_element_by_name("XXX").is_enabled() # 是否可以编辑,或者按钮是否可以点击 driver.find_element_by_name("XXX").is_displayed() # 判断元素是否显示 element=driver.find_element_by_name("XXX").is_selected() # 判断元素是否选中状态

七、获取某个元素的html

driver.find_element_by_id('XXX').get_attribute('innerHTML')

八、其他问题

1、svg定位

问题描述:
使用xpath方法对svg下元素进行定位,会发现无法定位到svg下的元素:

driver.find_element(xpath,"/html/body/div[19]/svg")

解决方法1【错误】:
从svg元素开始,下面的元素都要以*[name()=‘svg element’] 这种形式进行编写

driver.find_element(xpath,"/html/body/div[19]/*[name()='svg']/*[name()='path']")

会发现仍然定位不到;
解决办法2【正确】:
绝对路径的话,*[name()='svg']前面得加双斜杠,不然定位不到:

driver.find_element(xpath,"/html/body/div[19]//*[name()='svg']")

相对路径的话,*[name()='svg']前就不用加双斜杠,只用单斜杠:

driver.find_element(xpath,"//*[@id='userinfo']/*[name()='svg']/*[name()='use']")

2、处理chrome显示通知弹框

使用chrome打开weibo.com会出现以下界面的弹出框:
图片[6] - web自动化框架:selenium学习使用操作大全(Python版) - MaxSSL

这东西不属于页面alert弹框,而是属于浏览器的设置项。

要关掉它,需要对浏览器进行属于配置。具体见下面脚本:

from selenium import webdriveroptions = webdriver.ChromeOptions()prefs = {'profile.default_content_setting_values':{'notifications':2}}options.add_experimental_option('prefs',prefs)driver = webdriver.Chrome(options = options)driver.get("https://blog.csdn.net/testleaf/article/details/123269042")

3、获取元素的文本

element.text
get_attribute(“textContent”)
优点:可以获取隐藏元素的文本
缺点:IE不支持;获取有些元素的文本时,结果中带有空字符串;(没有尝试过)
get_attribute("innerText")
优点:可以获取隐藏元素的文本
缺点:FireFox不支持;(每个博客能搜到的都说这个缺点,但实际操作发现可以获取到每次所需的文本)

4、切换网址

直接进行切换就可以了,如下:

driver.get('https://blog.csdn.net/testleaf/article/details/123269042')time.sleep(2)driver.get('https://blog.csdn.net/testleaf/article/details/123302863')

5、find_element_by_xpath()被弃用解决方案

from selenium.webdriver.common.by import Byfrom selenium import webdriverdriver = webdriver.Chrome() #启动chromedriverdriver.get('http://www.baidu.com') #打开http://www.baidu.comdriver.find_element(By.XPATH,'//div[@class="detail-item-ctn"][1]').click() #点击按钮

免责声明:
1.编写此文是为了更好地学习selenium的使用,如果损害了有关人的利益,请联系删除;
2.如果文中描述欠妥,请在评论中进行指正;
3.文字编写不易,若感觉有用,点赞收藏关注会让博主很开心哦;
4.此外,本文支持任何形式的转载,转载请注明出处,非常感谢!!!
本文源自:https://blog.csdn.net/testleaf/article/details/123269042

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享