python强大,主要是因为包多,且不说第三方包,单是标准库就已让人望而生畏。
如果从第一篇整理标准库的博客算起,如今已有三个年头。在整理标准库的过程中,查阅了大量资料和官方文档,很多中文资料都有一个共同的特点——机翻风格严重。对于一些不常用,但有助于理解python运行机制的模块,不仅中文资料乏善可陈,连英文资料都很稀缺,所以又不得不翻阅源码,这个工作还是十分耗时的。
文章目录
- 快速入门
- 数学、数据结构与函数式
- 系统、路径、文件读写
- 并发、效率与混合编程
- 字符串、编码、日期时间
- 配置文件和压缩解压
- GUI编程Tkinter
- 其他
快速入门
首先,对于尚未入门的朋友,这里准备了四篇快速入门的文档
- 1小时快速入门Python
- 如何用两个晚上教会妹纸Python
- 写给Matlab用户的Python急速入门手册
- 从Python新手到高手的90行代码
数学、数据结构与函数式
在入门之后,就应该迅速累积代码量了,这里建议从数学模块开始,下面六个模块涵盖了基础计算模块math
;复数计算模块cmath
;基础统计模块statistics
;伪随机数生成模块random
;分数表达模块fractions
;精确计算模块decimal
。此外,Python内置了针对列表的二分、搜索算法,包括三个相关模块:有序列表查找 bisect
、堆算法 heapq
、紧凑的数组类型 array
。
- Python内置的6个数学模块
- Python排序搜索算法
python号称函数式语言,而下面的模块则是助力Python成为函数式语言的三大神器,其中运算符函数化可以提供括号风格的书写格式;functools
可以加速Python的龟速循环与递归;itertools
可以避免迭代对象对内存的大量占用。
- 运算符函数化operator模块:
- 高手分界线functools
- 高手专用itertools
系统、路径、文件读写
这部分内容中,使用最频繁的就是文件读写: 文件读写函数open
os模块
复现了操作系统的部分功能,提供了包括路径操作、进程管理等一些列功能。其中的os.path
针对不同操作系统的文件组织方式,提供了相同的API,实现了跨平台
- 调用操作系统 os模块
- 路径处理之os.path
- 路径匹配 glob
- 高阶文件操作 shutil
- 系统错误码
- 系统设置 sys
- 用platform模块获取系统信息
- Python数据的标准存储Pickle
并发、效率与混合编程
对多线程和多进程的友好支持,挽救了Python的速度
- 多线程:Python多线程详解 定时任务sched
- 多进程:进程通信 进程池
此外,这篇用了cuda之后速度起飞,尽管主要目的是介绍显卡计算,但测试了多线程和多进程的对比,有助于理解Python的并发逻辑,值得一看。
如果想进一步提高Python的速度,可以利用Python的胶水语言的特色,通过Python和C的混合编程,达到开发速度和运行速度的双赢,走上人生巅峰
- Windows系统中python和C混合编程
字符串、编码、日期时间
字符串最核心的问题就是格式化与搜索,前者的功能由字符串本身实现,后者则需通过强大的正则表达式。pprint
针对字典、列表优化了输出方案,textwrap
解决了针对段落文本的格式化问题。
- python字符串
- 正则表达式 re
- 美化输出 pprint
- 段落格式化 textwrap
下面是Python标准库提供的四种编码模块:
二进制转化 struct ASCII编解码 binascii base编码家族 unicode处理模块
密码也是一种编码方法,Python标准库提供了密码级别的随机数生成模块,以及哈希函数族模块。
secrets模块生成密码 哈希模块hashlib
与日期时间相关的模块,实际上提供的也是一种编码转换功能,即如何将一串时间戳转换为可读的数字,或者更进一步,转换为可读性更强的字符串。本文整理了如下三个与日期时间相关的模块,其中time
模块相对来说使用更频繁一些,除了获取系统时间之外,还提供了sleep
这种暂停线程的系统功能。
- time模块
- 日历打印 calendar
- 时区变换 zoneinfo
配置文件和压缩解压
python提供了一些基本的文件类型处理模块,列表如下
- csv:常用的数据格式
- json:网上最流行的信息传输文件
- toml:可读性超强的配置文件
- ini文件:windows最常用的配置文件
- html
此外,Python标准库中提供了一系列的压缩解压模块
- 压缩和解压模块zlib
- bz2压缩算法 lzma压缩算法
- 处理gz文件的gzip 处理zip文件的zipfile
图像类型识别模块imghdr和音频文件识别模块sndhdr已被新版本的Python弃用,官方文档推荐了filetype,可以根据内容推测超过60种文件类型。
GUI编程Tkinter
Python标准库内置Tkinter,可进行简单的GUI编程
- GUI初步布局绑定变量绑定事件消息框
- 扫雷小游戏强行表白神器
其他
- 版本转换2to3 将python2的代码批量转换为python3代码
- 深拷贝和浅拷贝 涉及到Python的运行逻辑,了解这一点,不仅可以避免一些不必要的bug,对优化代码也有一定的作用。
- 套接字通信:socket 可提供低级别的网络服务,认识IP协议,便从这里开始
- urllib统计博客阅读量 urllib可通过url来获取对应的网页,爬虫可从这里开始
以及三个用于测试、调试的模块:
- 用timeit测试函数运行时间
- 单元测试模块:TestCase
- 日志记录模块:logging
最后,本文总结了下面几个基本的音频处理和色彩转换模块
- 音频数据处理:audioop
- 播放音乐:winsound
- 色彩模式转换模块:colorsys
- wav格式处理