成年人的世界真不容易啊
总是悲伤大于欢喜
爱情因为懵懂而快乐
却走进了复杂和困惑的婚姻

前言

我最近喜欢去听情感类的节目，比如说，婚姻类，我可能老了吧。我就想着怎么把音乐下载下来了，保存到手机上，方便我们业余时间去听。

环境使用

python 3.9
pycharm

模块使用

requests

模块介绍

requests
requests是一个很实用的Python HTTP客户端库，爬虫和测试服务器响应数据时经常会用到，requests是Python语言的第三方的库，专门用于发送HTTP请求，使用起来比urllib简洁很多。
parsel
parsel是一个python的第三方库，相当于css选择器+xpath+re。
parsel由scrapy团队开发，是将scrapy中的parsel独立抽取出来的，可以轻松解析html，xml内容，获取需要的数据。
相比于BeautifulSoup，xpath，parsel效率更高，使用更简单。
re
re模块是python独有的匹配字符串的模块，该模块中提供的很多功能是基于正则表达式实现的，而正则表达式是对字符串进行模糊匹配，提取自己需要的字符串部分，他对所有的语言都通用。
os
os 就是 “operating system” 的缩写，顾名思义，os模块提供的就是各种 Python 程序与操作系统进行交互的接口。通过使用 os 模块，一方面可以方便地与操作系统进行交互，另一方面也可以极大增强代码的可移植性。
csv
它是一种文件格式，一般也被叫做逗号分隔值文件，可以使用 Excel 软件或者文本文档打开。其中数据字段用半角逗号间隔（也可以使用其它字符），使用 Excel 打开时，逗号会被转换为分隔符。csv 文件是以纯文本形式存储了表格数据，并且在兼容各个操作系统。

模块安装问题:

如果安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
在pycharm中点击Terminal(终端) 输入安装命令

安装失败原因:

失败一: pip 不是内部命令
解决方法: 设置环境变量
失败二: 出现大量报红 (read time out)
解决方法: 因为是网络链接超时, 需要切换镜像源
清华：https://pypi.tuna.tsinghua.edu.cn/simple阿里云：https://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学：https://pypi.hustunique.com/山东理工大学：https://pypi.sdutlinux.org/豆瓣：https://pypi.douban.com/simple/例如：pip3 install -i https://pypi.doubanio.com/simple/ 模块名
失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入
解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好，或者你pycharm里面python解释器没有设置好。

代码实现

发送请求

首先，我们要确定我们的目标网址，我们想要获取到每一个音频的地址。

我们发送请求，获取网页源代码。我们相信大家这里的代码都会写了。

url = 'https://www.ximalaya.com/album/37453303'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',}res = requests.get(url,headers=headers)

requests是 Python 的一个内置模块，用于发送 HTTP 请求。在这个例子中，我们使用requests.get()函数向https://www.ximalaya.com/album/37453303发送一个 GET 请求，并将请求头和响应体作为参数传递给函数。

获取数据

info_list = re.findall('"tracks":[(.*?)]', res.text)[1]print(info_list)

re.findall()函数用于在字符串中查找所有匹配的子字符串。在这个例子中，我们使用re.findall()函数查找了响应体中的tracks字符串，并使用切片[1]取出了子字符串列表。

子字符串列表中的第一个元素就是我们要找的tracks字符串。我们将其存储在info_list变量中，并使用print()函数输出。

我们发现，我们想要的数据，就在我们匹配的内容中。里面包含了每一个音乐的标题和其id，我们接下来把这个获取下来。

注意，这里，不是json数据，所以，我们只能正则去匹配。

trackIds = re.findall('"trackId":(\d+)', info_list)# print(trackIds)titles = re.findall('"title":"(.*?)"', info_list)# print(titles)

解析数据

我们通过对比url发现，我们只需要拿到uid，就可以直接访问到音频。这里就不多解释。

audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'

我们只需要把trackID换掉，就可以了。请求上面的url，就可以拿到音频的地址。接下来，我们写代码。

for trackId, title in zip(trackIds, titles):audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'print(audio)audio_res = requests.get(audio, headers=headers)audio_url = audio_res.json()['data']['src']print(audio_url)

zip()函数用于将两个列表合并成一个列表。在这个例子中，我们使用zip()函数将trackIds和titles两个列表合并成一个列表，并将其存储在trackIds变量中。

然后，我们将trackId和title转换为字符串格式，并将其存储在audio变量中。

接下来，我们使用requests.get()函数向audio发送一个 GET 请求，并将请求头和响应体作为参数传递给函数。最后，我们使用json()方法将响应体中的data字段转换为 JSON 格式，并使用['data']['src']取出了src属性，即audio_url的值，并将其存储在audio_url变量中。

保存数据

music_content = requests.get(audio_url, headers=headers).contentwith open('music//' + f'{title}' + '.mp3', mode='wb') as filename:filename.write(music_content)print(title, '保存成功')

接下来，我们请求这个网页，保存二进制到本地。with open()语句用于自动关闭文件，确保文件在使用完毕后被正确关闭。在这个例子中，我们使用with open()语句打开一个名为music//+title+ .mp3的文件，并将其保存到变量filename 中。

然后，我们使用write()方法将音频内容写入文件中。

全部代码

import osimport reimport requestsfilename = 'music//'if not os.path.exists(filename):os.mkdir(filename)url = 'https://www.ximalaya.com/album/37453303'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',}res = requests.get(url,headers=headers)seoTrackList = re.findall('"seoTrackList":\[(.*" />

`总结`

这是一个关于如何下载音乐并保存到手机的Python代码实战。我们首先确定我们的目标网址，然后使用requests.get()函数向该网址发送一个 GET 请求，并将请求头和响应体作为参数传递给函数。

在请求成功后，我们使用json()方法将响应体中的data字段转换为 JSON 格式，并使用['data']['src']取出了src属性，即audio_url的值，并将其存储在audio_url变量中。

我们请求网页，保存二进制，就可以保存了。

【Python实战】Python采集情感音频

前言

环境使用

模块使用

模块介绍

代码实现

发送请求

获取数据

解析数据

保存数据

全部代码

`总结`

`最新关注`

`热文推荐`

`【Docker】Docker容器与虚拟机的对比、三要素、架构和镜像加速器的详细讲解`

`C++ 右值引用与一级指针`

`【Java面试宝典】常用类中的方法重写|equals方法与逻辑运算符==的区别`

`Python实现京东茅台抢购脚本, 原来这么简单`

`编写C语言程序，模拟实现首次/最佳/最坏适应算法的内存块分配和回收，要求每次分配和回收后显示出空闲分区和已分配分区的情况。假设初始状态下，可用的内存空间为640KB。（江西师范大学软件学院操作系统）`

`kubernetes-1.18.8-UOS-龙芯mips64le架构适配`

【Python实战】Python采集情感音频

前言

环境使用

模块使用

模块介绍

代码实现

发送请求

获取数据

解析数据

保存数据

全部代码

总结

相关文章

最新关注

热文推荐

`总结`

`相关文章`

`最新关注`

`热文推荐`