Selenium入门必备：学会用代码控制浏览器，打开网页、找到元素和退出浏览器

一、前期准备

1、概述

2、学习目标

3、安装

二、selenium的基本使用

1、加载网页：

2、定位和操作：

3、查看请求信息：

4、退出

小结

三、元素定位的方法

学习目标

1、selenium的定位操作

2、元素的操作

小结

四、selenium的其他操作

学习目标

1、无头浏览器

1、selenium 处理cookie

2、页面等待

3、switch方法切换的操作

4、selenium的优缺点

小结

5、selenium的配置

五、实战案例

大家好，我是凡哥。

作为一个想要学习Web自动化测试的小白，刚开始接触Selenium时可能会有些迷茫和不知所措。但是，不用担心，通过本文的学习，你将能够初步掌握Selenium的基础应用技能，包括如何用代码控制浏览器，打开并加载网页，找到并操作其中的元素，以及最后如何优雅地退出浏览器！

相信随着不断的实践和学习，你定能成为一名出色的Web自动化测试工程师。接下来，就让我们一起开始这段“陪伴式”学习之旅吧！

一、前期准备

1、概述

selenium本身是一个自动化测试工具。它可以让python代码调用浏览器。并获取到浏览器中加载的各种资源。我们可以利用selenium提供的各项功能。帮助我们完成数据的抓取。

2、学习目标

掌握 selenium发送请求，加载网页的方法
掌握 selenium简单的元素定位的方法
掌握 selenium的基础属性和方法
掌握 selenium退出的方法

2023最新自动化测试自学教程新手小白26天入门最详细教程,目前已有300多人通过学习这套教程入职大厂！！

【留言：selenium丨免费获取教程】

3、安装

安装：pip install selenium

它与其他库不同的地方是他要启动你电脑上的浏览器, 这就需要一个驱动程序来辅助.

这里推荐用chrome浏览器

chrome驱动地址:http://chromedriver.storage.googleapis.com/index.html

根据你电脑的不同自行选择吧. win64选win32即可.

然后关键的来了. 把你下载的浏览器驱动放在python解释器所在的文件夹

Windwos: py -0p 查看Python路径

Mac: open + 路径

例如：open /usr/local/bin/

前期准备工作完毕. 上代码看看感受一下selenium

from selenium.webdriver import Chrome# 导入谷歌浏览器的类# 创建浏览器对象web = Chrome()# 如果你的浏览器驱动放在了解释器文件夹web.get("http://www.baidu.com")# 输入网址print(web.title)# 打印title

运行一下你会发现神奇的事情发生了. 浏览器自动打开了. 并且输入了网址. 也能拿到网页上的title标题.

二、selenium的基本使用

1、加载网页：

selenium通过控制浏览器，所以对应的获取的数据都是elements中的内容

from selenium import webdriverfrom selenium.webdriver.common.by import Bydriver = webdriver.Chrome()# 访问百度driver.get("http://www.baidu.com/")# 截图driver.save_screenshot("baidu.png")"""# 使用同一个浏览器进行多次操作from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsoptions = Options()options.add_experimental_option("debuggerAddress", "127.0.0.1:12306")driver = webdriver.Chrome()driver.get('http://www.baidu.com')driver.get('http://www.sougou.com')"""

2、定位和操作：

# 搜索关键字 杜卡迪driver.find_element(By.ID, "kw").send_keys("杜卡迪")# 点击id为su的搜索按钮driver.find_element(By.ID, "su").click()

3、查看请求信息：

driver.page_source # 获取页面内容driver.get_cookies()driver.current_url

4、退出

driver.close()# 退出当前页面driver.quit() # 退出浏览器

小结

selenium的导包:from selenium import webdriver
selenium创建driver对象:driver = webdriver.Chrome()
selenium请求数据:driver.get("http://www.baidu.com/")
selenium查看数据:driver.page_source
关闭浏览器:driver.quit()
根据id定位元素:driver.find_element_by_id("kw")/driver.find_element(By.ID, "kw")
操作点击事件:click()
给输入框赋值:send_keys()

三、元素定位的方法

学习目标

掌握 selenium定位元素的方法
掌握 selenium从元素中获取文本和属性的方法

通过selenium的基本使用可以简单定位元素和获取对应的数据,接下来我们再来学习下定位元素的其他方法

1、selenium的定位操作

元素定位的两种写法：

直接调用型

 el = driver.find_element_by_xxx(value) # xxx是定位方式，后面我们会讲，value为该方式对应的值

使用By类型(需要导入By) 建议使用这种方式

 # 直接掉用的方式会在底层翻译成这种方式from selenium.webdriver.common.by import Bydriver.find_element(By.xxx,value)

元素定位的两种方式:
- 精确定位一个元素,返回结果为一个element对象,定位不到则报错
```
driver.find_element(By.xx, value)# 建议使用driver.find_element_by_xxx(value)
```
- 定位一组元素,返回结果为element对象列表,定位不到返回空列表
```
driver.find_elements(By.xx, value)# 建议使用driver.find_elements_by_xxx(value)
```

元素定位的八种方法:

以下方法在element之后添加s就变成能够获取一组元素的方法

By.ID 使用id值定位

el = driver.find_element(By.ID, '')el = driver.find_element_by_id()

By.XPATH 使用xpath定位

el = driver.find_element(By.XPATH, '')el = driver.find_element_by_xpath()

By.TAG_NAME. 使用标签名定位

el = driver.find_element(By.TAG_NAME, '')el = driver.find_element_by_tag_name()

By.LINK_TEXT使用超链接文本定位

el = driver.find_element(By.LINK_TEXT, '')el = driver.find_element_by_link_text()

By.PARTIAL_LINK_TEXT 使用部分超链接文本定位

el = driver.find_element(By.PARTIAL_LINK_TEXT, '')el = driver.find_element_by_partial_link_text()

By.NAME 使用name属性值定位

el = driver.find_element(By.NAME, '')el = driver.find_element_by_name()

By.CLASS_NAME 使用class属性值定位

el = driver.find_element(By.CLASS_NAME, '') el = driver.find_element_by_class_name()

By.CSS_SELECTOR 使用css选择器定位

el = driver.find_element(By.CSS_SELECTOR, '')el = driver.find_element_by_css_selector()

注意：

建议使用find_element/find_elements
find_element和find_elements的区别
by_link_text和by_partial_link_text的区别：
全部文本和包含某个文本

使用：以豆瓣为例

import timefrom selenium import webdriverfrom selenium.webdriver.common.by import Bydriver = webdriver.Chrome()driver.implicitly_wait(10)# 等待节点加载完成driver.get("https://www.douban.com/search" /># 搜索输入框使用find_elements进行获取# ret2 = driver.find_elements(By.ID, "inp-query")# ret2 = driver.find_elements_by_id("inp-query")# print(ret2)#输出为：[]# 搜索按钮使用xpath进行获取# ret3 = driver.find_elements(By.XPATH, '//*[@id="inp-query"]')# ret3 = driver.find_elements_by_xpath("//*[@id="inp-query"]")# print(len(ret3))# print(ret3)# 匹配图片标签ret4 = driver.find_elements(By.TAG_NAME, 'img')for url in ret4:print(url.get_attribute('src')) #ret4 = driver.find_elements_by_tag_name("img")print(len(ret4))ret5 = driver.find_elements(By.LINK_TEXT, "浏览发现")# ret5 = driver.find_elements_by_link_text("浏览发现")print(len(ret5))print(ret5)ret6 = driver.find_elements(By.PARTIAL_LINK_TEXT, "浏览发现")# ret6 = driver.find_elements_by_partial_link_text("浏览发现")print(len(ret6))# 使用class名称查找ret7 = driver.find_elements(By.CLASS_NAME, 'nbg')print(ret7)driver.close()

注意：

find_element与find_elements区别

只查找一个元素的时候:可以使用find_element(),find_elements()
find_element()会返回一个WebElement节点对象,但是没找到会报错,而find_elements()不会,之后返回一个空列表
查找多个元素的时候:只能用find_elements(),返回一个列表,列表里的元素全是WebElement节点对象
找到都是节点(标签)
如果想要获取相关内容(只对find_element()有效,列表对象没有这个属性) 使用 .text
如果想要获取相关属性的值(如href对应的链接等,只对find_element()有效,列表对象没有这个属性):使用 .get_attribute(“href”)

2、元素的操作

find_element_by_xxx方法仅仅能够获取元素对象，接下来就可以对元素执行以下操作从定位到的元素中提取数据的方法

从定位到的元素中获取数据

el.get_attribute(key) # 获取key属性名对应的属性值el.text# 获取开闭标签之间的文本内容

对定位到的元素的操作

el.click()# 对元素执行点击操作el.submit() # 对元素执行提交操作el.clear()# 清空可输入元素中的数据el.send_keys(data)# 向可输入元素输入数据

使用示例：

from selenium import webdriverfrom selenium.webdriver.common.by import Bydriver =webdriver.Chrome()driver.get("https://www.douban.com/")# 打印页面内容 （获取到以后可以进行后续的xpath,bs4 或者存储等）print(driver.page_source)ret4 = driver.find_elements(By.TAG_NAME, "h1")print(ret4[0].text)#输出：豆瓣ret5 = driver.find_elements(By.LINK_TEXT, "下载豆瓣 App")print(ret5[0].get_attribute("href"))#输出：https://www.douban.com/doubanapp/app?channel=nimingyedriver.close()

小结

根据xpath定位元素:driver.find_elements(By.XPATH,"//*[@id='s']/h1/a")
根据class定位元素:driver.find_elements(By.CLASS_NAME, "box")
根据link_text定位元素:driver.find_elements(By.LINK_TEXT, "下载豆瓣 App")
根据tag_name定位元素:driver.find_elements(By.TAG_NAME, "h1")
获取元素文本内容:element.text
获取元素标签属性:element.get_attribute("href")
向输入框输入数据:element.send_keys(data)

四、selenium的其他操作

学习目标

掌握 selenium处理cookie等方法
掌握 selenium中switch的使用
掌握selenium中无头浏览器的设置

1、无头浏览器

我们已经基本了解了selenium的基本使用了. 但是呢, 不知各位有没有发现, 每次打开浏览器的时间都比较长. 这就比较耗时了. 我们写的是爬虫程序. 目的是数据. 并不是想看网页. 那能不能让浏览器在后台跑呢? 答案是可以的

from selenium.webdriver import Chromefrom selenium.webdriver.chrome.options import Optionsopt = Options()opt.add_argument("--headless")opt.add_argument('--disable-gpu')opt.add_argument("--window-size=4000,1600")# 设置窗口大小web = Chrome(options=opt)

1、selenium 处理cookie

通过driver.get_cookies()能够获取所有的cookie

获取cookie
```
dictCookies = driver.get_cookies()
```
设置cookie
```
driver.add_cookie(dictCookies)
```

删除cookie

#删除一条cookiedriver.delete_cookie("CookieName")# 删除所有的cookiedriver.delete_all_cookies()

2、页面等待

为什么需要等待
如果网站采用了动态html技术，那么页面上的部分元素出现时间便不能确定，这个时候就可以设置一个等待时间，强制等待指定时间，等待结束之后进行元素定位，如果还是无法定位到则报错

页面等待的三种方法

强制等待

import timetime.sleep(n)# 阻塞等待设定的秒数之后再继续往下执行

显式等待(自动化web测试使用，爬虫基本不用)

from selenium.webdriver.common.keys import Keysfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECWebDriverWait(driver, 10,0.5).until( EC.presence_of_element_located((By.ID, "myDynamicElement"))# 显式等待指定某个条件，然后设置最长等待时间10，在10秒内每隔0.5秒使用指定条件去定位元素，如果定位到元素则直接结束等待，如果在10秒结束之后仍未定位到元素则报错

隐式等待隐式等待设置之后代码中的所有元素定位都会做隐式等待

driver.implicitly_wait(10)# 在指定的n秒内每隔一段时间尝试定位元素，如果n秒结束还未被定位出来则报错

注意：

Selenium显示等待和隐式等待的区别
1、selenium的显示等待
原理：显示等待，就是明确要等到某个元素的出现或者是某个元素的可点击等条件，等不到，就一直等，除非在规定的时间之内都没找到，就会跳出异常Exception

(简而言之，就是直到元素出现才去操作，如果超时则报异常)

2、selenium的隐式等待

原理：隐式等待，就是在创建driver时，为浏览器对象创建一个等待时间，这个方法是得不到某个元素就等待一段时间，直到拿到某个元素位置。
注意：在使用隐式等待的时候，实际上浏览器会在你自己设定的时间内部断的刷新页面去寻找我们需要的元素

3、switch方法切换的操作

3.1 一个浏览器肯定会有很多窗口，所以我们肯定要有方法来实现窗口的切换。切换窗口的方法如下：

也可以使用 window_handles 方法来获取每个窗口的操作对象。例如：# 1. 获取当前所有的窗口current_windows = driver.window_handles# 2. 根据窗口索引进行切换driver.switch_to.window(current_windows[1])driver.switch_to.window(web.window_handles[-1])# 跳转到最后一个窗口driver.switch_to.window(current_windows[0])# 回到第一个窗口

3.2 iframe是html中常用的一种技术，即一个页面中嵌套了另一个网页，selenium默认是访问不了frame中的内容的，对应的解决思路是

driver.switch_to.frame(name/el/id) 传入的参数可以使iframe对应的id值，也可以是用元素定位之后的元素对象

动手：qq邮箱

在使用selenium登录qq邮箱的过程中，我们会发现，无法在邮箱的登录input标签中输入内容，通过观察源码可以发现，form表单在一个frame中，所以需要切换到frame中

3.3 当你触发了某个事件之后，页面出现了弹窗提示，处理这个提示或者获取提示信息方法如下：

alert = driver.switch_to_alert()

4. 页面前进和后退

driver.forward() # 前进driver.back()# 后退driver.refresh()# 刷新driver.close() # 关闭当前窗口

5、设置浏览器最大窗口

driver.maximize_window()#最大化浏览器窗口

4、selenium的优缺点

优点
- selenium能够执行页面上的js，对于js渲染的数据和模拟登陆处理起来非常容易
- 使用难度简单
- 爬取速度慢，爬取频率更像人的行为，天生能够应对一些反爬措施
缺点
- 由于selenium操作浏览器，因此会将发送所有的请求，因此占用网络带宽
- 由于操作浏览器，因此占用的内存非常大(相比较之前的爬虫)
- 速度慢，对于效率要求高的话不建议使用

小结

获取cookie:get_cookies()
删除cookie:delete_all_cookies()
切换窗口:switch_to.window()
切换iframe:switch_to.frame()

5、selenium的配置

selenium启动谷歌浏览器的参数设置_enable-automation_qq_35999017的博客-CSDN博客

五、实战案例

使用打码平台进行模拟登陆

import base64import jsonimport requestsfrom selenium.webdriver import Chromeimport timefrom selenium.webdriver.common.by import Bydef base64_api(uname, pwd, img, typeid):with open(img, 'rb') as f:base64_data = base64.b64encode(f.read())b64 = base64_data.decode()data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}result = json.loads(requests.post("http://api.ttshitu.com/predict", json=data).text)if result['success']:return result["data"]["result"]else:#！！！！！！！注意：返回 人工不足等 错误情况 请加逻辑处理防止脚本卡死 继续重新 识别return result["message"]return ""if __name__ == "__main__":driver = Chrome()driver.get('https://www.gushiwen.cn/')time.sleep(1)# 查找我的按钮mine = driver.find_element(By.XPATH, '/html/body/div[1]/div/div[2]/div[1]/a[6]')# 点击我的mine.click()# 输入登陆的信息email = driver.find_element(By.XPATH, '//*[@id="email"]')email.send_keys('793390457@qq.com')pwd = driver.find_element(By.XPATH, '//*[@id="pwd"]')pwd.send_keys('xlg17346570232')code = driver.find_element(By.XPATH, '//*[@id="code"]')# 找到验证节点 并截取验证码图片driver.find_element(By.ID, 'imgCode').screenshot('code.png')# 打码平台进行识别img_path = "./code.png"result = base64_api(uname='luckyboyxlg', pwd='17346570232', img=img_path, typeid=3)print(result)code.send_keys(result)# 点击登陆driver.find_element(By.XPATH, '//*[@id="denglu"]').submit()

使用163获取新闻数据

from selenium import webdriverimport timefrom selenium.webdriver.common.by import By# 将滚动条拖拽到底部然后点击加载更增多直到加载完所有数据def scroll_window(driver, stop_length, step_length):while True:if stop_length - step_length <= 0:break# 使用js代码进行下拉driver.execute_script(f'window.scrollBy(0, {step_length})')stop_length -= step_lengthtime.sleep(0.5)if __name__ == '__main__':driver = webdriver.Chrome()driver.get('https://news.163.com/')for i in range(1, 6):# 每次滚动距离step_length = 2000# 滚动停止的距离stop_length = 30000scroll_window(driver, stop_length, step_length)# 点击加载更多more = driver.find_element(By.XPATH, '//*[@id="index2016_wrap"]/div[3]/div[2]/div[3]/div[2]/div[5]/div/a[3]')# more.click()driver.execute_script('arguments[0].click();', more)print(f'第{i}次点击')# 获取页面所有数据print(driver.page_source)

文章版权归作者所有，未经允许请勿转载。

THE END