前言
陪玩这个行业应该没哪个好兄弟没听说过吧
有男有女,还有很多漂亮的妹妹
就是说,今天来带你们爬爬陪玩的数据
一起看看行情咋样
一 、数据来源分析:
- 确定需求, 采集那个网站上面什么数据
- 抓包分析, 通过开发者工具进行抓包分析
二、代码实现步骤过程:
- 发送请求, 对于刚刚分析得到url地址发送请求
- 获取数据, 获取服务器返回响应数据
- 解析数据, 提取我们想要数据内容,音频试音,陪玩照片, 基本陪玩数据
- 保存数据, 保存本地文件夹
开发环境
- python 3.8
- pycharm
模块使用
- import os: 文件操作
- import re: 正则
- import requests: 数据请求
- import json:json数据转换
- import csv: 保存csv数据
代码实现
请求数据
保存数据
陪玩详情数据
import os.pathc = open('data.csv', mode='a', encoding='utf-8-sig', newline='')# c 文件对象 fieldnames 字段名csv_writer = csv.DictWriter(c, fieldnames=[ '昵称', '价格', '热度', '简介', '详情页',])# 写入表头csv_writer.writeheader()# 保存表格数据csv_writer.writerow(dit)print(dit)
保存试音音频、图片数据
python学习交流Q群:309488165 ### 源码领取img_content = requests.get(url=img_url).content # 图片二进制数据audio_content = requests.get(url=audio_url).content # 音频二进制数据title = index["nickname"]# 自动创建文件夹 data\\憨憨\\file = f'data\\{title}\\'# 判断如果没有文件夹if not os.path.exists(file): # 自动创建文件夹 os.makedirs(file)with open(file + title + '.jpg', mode='wb') as img: img.write(img_content)with open(file + title + '.mp3', mode='wb') as audio: audio.write(audio_content)
今天的分享到这里就结束了
对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/