# 导入webdriverfrom appium import webdriverfrom page.base_page import BasePageclass PhoneLoginPage(BasePage):# 声明driver: webdriver = None
在调用百度OCR图片识别前,需要先申请百度通用文字识别接口,申请方法如下:
1.登录百度AI平台,申请百度通用文字识别接口,免费激活AI平台的使用权限
百度AI平台网址:https://ai.baidu.com/
进入开放能力→文字识别→通用文字识别,如下图:
点击立即使用:
创建应用:
创建成功后进入管理应用,能查看创建的应用AppID、API Key、Secret Key,如下图:
2. 查看适用不同平台/语言/功能的SDK
文字识别链接:https://ai.baidu.com/sdk#ocr
下载需要语言的SDK:
我使用的是python语言,所以下载的是对应的Python SDK(支持python版本:2.7.+,3.+),下载完成后,安装方式有两种:
①已经安装pip,打开命令提示符,输入以下命令即可
pip install baidu-aip
②已经安装setuptools,打开命令提示符,输入以下命令即可
python setup.py install
出现下图表示安装成功:
3.文字识别接口说明(参考文档)
文字识别接口说明链接:https://ai.baidu.com/ai-doc/OCR/7kibizyfm
或者可以通过上面图片(下载所需语言的SDK)→使用说明→接口说明进入(后续会使用到这篇文档,建议在写脚本前先阅读)
方法:在工程中自动创建一个存放图片的文件夹,再定位图片验证码的控件,截取图片验证码,将截取到的图片使用自动生成的规则的文件名,保存在创建的图片文件夹内,存储后通过百度的OCR文字识别,获取到保存的截图,进行文字识别,再将识别的结果输出到验证码输入框内
注意:
问:为什么要将图片有规则的命名?
答:方便后续查找核对
问:为什么截图保存不能保存在本地磁盘内,而是保存在本地工程目录下方?
答:如果保存图片时使用的是本地固定的磁盘,那别人使用你的代码时就需要修改保存的路径,如果保存在本地工程目录下方,别人就不需要手动创建文件夹,直接运行代码就能自动在工程目录下生成文件夹
1.screenshot.py— 验证码截图,并通过特定的规律保存在特定的文件夹中
import timefrom common.image_recognition import ImageRecognitionfrom page.base_page import BasePageclass Screen(BasePage): # 图片验证码输入框 _img_check_code = "/hierarchy/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.widget.RelativeLayout/android.widget.FrameLayout/android.webkit.WebView/android.webkit.WebView/android.widget.Image" # 截取页面中特定区域的图片 def get_part_screen(self): # 截图将图片保存至固定的位置 img_folder = 'E:\\study\\Fork\\Weibo_Demo\\Weibo\\image\\' # 截图的文件名组成 times = time.strftime('%Y%m%d%H%M', time.localtime(time.time())) # 图片存储位置+文件名 screen_save_path = img_folder + times + '.png' # 截取特定位置的图片,并保存在已定义的存储位置和规定的文件名 self.find_xpath(self._img_check_code).screenshot(screen_save_path) # 实例化ImageRecognition,传入需要识别的图片位置 ir = ImageRecognition(screen_save_path) a = ir.ocr()return a
2.image_recognition.py — 调用百度OCR文字识别
from aip import AipOcrclass ImageRecognition: # 初始化path,定义为字符类型 def __init__(self, path: ''): self.path = path # 你的 APPID AK SK APP_ID = '123456' API_KEY = 'fydhafbuebfuebiufwbiufe' SECRET_KEY = 'difwebfubweufbweffefefefefefef' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 配置参数,识别到图片内容时,需要输出的内容 def get_garameter(self): options = { # 识别语言类型,默认为CHN_ENG "language_type": "ENG", # 是否检测图像朝向,默认不检测,即:false "detect_language": "true" # 是否返回识别结果中每一行的置信度 # "probability": "true" } return options # 打开文件 def get_file_content(self, file_path): with open(file_path, 'rb') as fp: return fp.read() # 需要识别的图片的路径 def get_image(self): return self.get_file_content(self.path) # 调用百度ocr接口,进行精准识别 def ocr(self): image_content = self.client.basicAccurate(self.get_image()), self.get_garameter() return image_content
注意:在调用百度OCR识别需要在运行环境(工程)下安装baidu-aip,安装步骤如下:
打开Setting→Python Interpreter,点击+号
搜索输入:baidu-aip,点击搜索结果列表中第一个,点击install package
在Setting→Python Interpreter页面出现下图,表示安装成功
3.retrieve_password_page.py — 对获取到的图片验证码解析
from time import sleepfrom selenium.webdriver.common.by import Byfrom common.screenshot import Screenfrom page.base_page import BasePageclass RetrievePasswordPage(BasePage):# 初始化,用于实例化Screen类 def __init__(self, driver): super().__init__(driver) self.screen = Screen(driver)# 自动获取图片验证码中的内容 def auto_get_check_code(self, telephone): self.input_telephone(telephone) # 获取图片验证码,获取到的是元组 check_code_tuple = self.screen.get_part_screen() print(check_code_tuple) # 在元组中提取第一个数据(元组下标位置从0开始),获取到的数据为字典(字典是一组键值对) check_code_list = check_code_tuple[0] print(check_code_list) # 在字典中提取第三个数据'words_result',获取到的数据为列表 word_result = check_code_list['words_result'] # 判断获取到的列表的值是否为空,为空则在列表中自定义一个字典“word_result”的值 if word_result: print(word_result) else: word_result = [{'words': 'F3HA'}] print(word_result) # 在列表中提取一个数据,获取到的数据是字典 dic_words = word_result[0] print(dic_words) # 在字典中输出"words" word = dic_words['words'] print(word) self.input_image_check_code(word) self.find_xpath(self._btn_confirm).click() sleep(1)
说明:由于通过百度OCR识别到的内容是一个字典,如下:
({'log_id': 6483429546783692489, 'words_result_num': 1, 'words_result': [{'words': ' F3H'}]}, {'language_type': 'ENG', 'detect_language': 'true'})
通过处理,将以上内容转换为JSON格式,转换后如下图显示:
我们需要获取的是words,所以需要一层一层的获取元素,具体的获取方式是请查看python的字典、元组、列表,可参考菜鸟教程:https://www.runoob.com/python3/python3-dictionary.html
注意:经实验,该种方式对于比较奇葩的图片验证码识别概率低,识别中规中矩的图片验证码成功率较高
4.testcase.py— 测试用例
# 找回密码测试用例脚本import pytestfrom common.init import AppStartclass TestRetrievePassword: def setup(self): self.retrievepassword = AppStart.start().enter_retrieve_password() # 自动获取图片验证码 def test_auto_get_check_code(self): telephone = "18056120351" self.retrievepassword.auto_get_check_code(telephone) assert self.retrievepassword.get_phone_and_check_code_tips() == "请输入正确的验证码" def teardown(self): AppStart.quit()
最后: 给大家推荐一个 q 群:902061117 里面有许多资料共享!资料都是面试时面试官必问的知识点,也包括了很多测试行业常见知识,其中包括了有基础知识、Linux必备、Shell、互联网程序原理、Mysql数据库、抓包工具专题、接口测试工具、测试进阶-Python编程、Web自动化测试、APP自动化测试、接口自动化测试、测试高级持续集成、测试架构开发测试框架、性能测试、安全测试等。
如果对你有一点点帮助,各位的「点赞」就是小编创作的最大动力,我们下篇文章见!
2021软件测试工程师面试题汇总(内含答案)-看完BATJ面试官对你竖起大拇指!
什么样的人适合从事软件测试工作?
软件测试和软件开发哪个发展更好
那个准点下班的人,比我先升职了…