爬某网站延禧宫率第一集视频

import requestsimport refrom tqdm import tqdm# 网址链接：https://v.ijujitv.cc/play/24291-1-1.htmlurl = 'https://v6.1080pzy.co/20220801/urxniJCN/hls/index.m3u8'headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36","Referer":"https://jx.ijujitv.cc/"}m3u8_data = requests.get(url=url,headers=headers).textm3u8_data = re.sub("#EXTM3U",'',m3u8_data)m3u8_data = re.sub("#EXT-X-VERSION:\d",'',m3u8_data)m3u8_data = re.sub("#EXT-X-TARGETDURATION:\d",'',m3u8_data)m3u8_data = re.sub("#EXT-X-PLAYLIST-TYPE:VOD",'',m3u8_data)m3u8_data = re.sub("#EXT-X-MEDIA-SEQUENCE:\d",'',m3u8_data)m3u8_data = re.sub("#EXTINF:\d\.\d+,",'',m3u8_data)m3u8_data = re.sub("#EXTINF:\d,",'',m3u8_data)m3u8_data = re.sub("#EXT-X-ENDLIST",'',m3u8_data).split()for m3u8_url in tqdm(m3u8_data):content = requests.get(url=m3u8_url,headers=headers).contentwith open('延禧宫率'+'.mp4',mode='ab') as f:f.write(content)

爬取的页面如下：

爬取步骤：

又点击检查-network-xhr，发现有许多ts文件，复制浏览即会下载。-在搜索框搜索m3u8，找到一个html的包，如下。