Python采集某网站小视频内容, m3u8内容下载


前言

大家早好、午好、晚好吖~

图片[1] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

目录标题

    • 前言
    • 环境使用:
    • 模块使用:
    • 模块安装问题:
        • 如果安装python第三方模块:
        • 安装失败原因:
      • 如何配置pycharm里面的python解释器” />

        请求参数

        data = {    'quickViewId': 'ac-space-video-list',    'reqID': '13',    'ajaxpipe': '1',    'type': 'video',    'order': 'newest',    'page': '2',    'pageSize': '20',    't': '1666360290070',}

        模拟伪装

        headers = {    # User-Agent 用户代理 表示浏览器基本身份信息    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'}

        发送请求

        response_1 = requests.get(url=link, params=data, headers=headers)

        解析数据

        video_id_list = re.findall('atomid.*?":.*?"(\d+).*?",', response_1.text)# for循环遍历for video_id in video_id_list:

        图片[2] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

            # 发送请求    response = requests.get(url=url, headers=headers)

        2. 获取数据, 获取服务器返回响应数据

        • 开发者工具里 response

        response.text 获取响应文本数据

        3. 解析数据, 提取我们想要的数据内容

        • m3u8链接

        • 视频标题

        调用re模块里面findall方法, 去找到所有我们想要的数据内容

        re.findall(‘什么数据’, ‘什么地方’)

        从什么地方去找你想要的什么数据

        response.text 这里面 去找 "title":"(.*" />

        7. 保存数据

        –> 需要发送请求 + 获取数据

                ts_content = requests.get(url=ts_url, headers=headers).content        with open('video\\' + title + '.mp4', mode='ab') as f:            # 写入数据            f.write(ts_content)        print(ts_url)

        效果展示

        图片[3] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL
        图片[4] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

        图片[5] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL
        图片[6] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

        图片[7] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

        图片[8] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL图片[9] - Python采集某网站小视频内容, m3u8内容下载 - MaxSSL

        文章看不懂,我专门录了对应的视频讲解,本文只是大致展示,完整代码和视频教程点击下方蓝字

        点击

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享