import requestsimport refrom tqdm import tqdm# 网址链接:https://v.ijujitv.cc/play/24291-1-1.htmlurl = 'https://v6.1080pzy.co/20220801/urxniJCN/hls/index.m3u8'headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36","Referer":"https://jx.ijujitv.cc/"}m3u8_data = requests.get(url=url,headers=headers).textm3u8_data = re.sub("#EXTM3U",'',m3u8_data)m3u8_data = re.sub("#EXT-X-VERSION:\d",'',m3u8_data)m3u8_data = re.sub("#EXT-X-TARGETDURATION:\d",'',m3u8_data)m3u8_data = re.sub("#EXT-X-PLAYLIST-TYPE:VOD",'',m3u8_data)m3u8_data = re.sub("#EXT-X-MEDIA-SEQUENCE:\d",'',m3u8_data)m3u8_data = re.sub("#EXTINF:\d\.\d+,",'',m3u8_data)m3u8_data = re.sub("#EXTINF:\d,",'',m3u8_data)m3u8_data = re.sub("#EXT-X-ENDLIST",'',m3u8_data).split()for m3u8_url in tqdm(m3u8_data):content = requests.get(url=m3u8_url,headers=headers).contentwith open('延禧宫率'+'.mp4',mode='ab') as f:f.write(content)
爬取的页面如下:
爬取步骤:
又点击检查-network-xhr,发现有许多ts文件,复制浏览即会下载。-在搜索框搜索m3u8,找到一个html的包,如下。
点开后发现其为:
得到了所有ts的包,进行访问提取所有的ts路径代码。