1、os 模块

OS 模块(operating system),意为操作系统,是 python 处理文件系统的常用模块,因为 python 是跨平台的,所以使用 os 模块,不用担心操作系统使用什么模块,os 模块会帮你选择正确的模块并调用。

OS 模块中关于文件/ 目录常用函数的使用方法:

函数名使用方法
getcwd()返回当前工作目录
chdir()改变工作目录
listdir(path=‘.’)列举指定目录中的文件名(‘.’ 表示当前目录,‘…’ 表示上一级目录)
mkdir()创建目录(文件夹),如该目录存在,抛出 FileExistsError 异常
makedirs()创建多层目录,如果存在,抛出异常
remove()删除文件
rmdir(path)删除单层目录,如果该目录非空则抛出异常
removedirs(path)删除多层目录,遇到非空抛出异常
rename(old,new)将文件 old 重命名为 new
system(command)运行系统的 shell 命令

1.1、getcwd()

获取当前工作目录:

>>> import os>>> os.getcwd()'C:\\Users\\hj\\AppData\\Local\\Programs\\Python\\Python36-32'

1.2、chdir(path)

改变当前工作目录,如切换到 E 盘(需要注意的是,windows 系统的文件路径是双反斜杠:\)

# 改变目录时,可以先查看当前工作目录,再改变,最后查看是否修改成功>>> os.getcwd()'C:\\Users\\hj\\AppData\\Local\\Programs\\Python\\Python36-32'>>> os.chdir('E:\\')>>> os.getcwd()'E:\\'

1.3、listdir(path=‘.’)

可以帮助知道当前工作目录下有哪些文件和子目录,它会帮你列举出来,path 参数用于指定列举的目录,默认值为 ‘.’ ,代表当前目录,也可以使用 ‘…’ ,代表上一层目录:

# 我的 D 盘目录下有个 pics 的文件夹,文件夹中有个 a 文件夹和 test.txt的文件,而 a 文件夹中有个 b 文件夹和test_0的文件>>> os.chdir('D:\\pics\\a\\')>>> os.getcwd()'D:\\pics\\a'>>> os.listdir() # 当前目录下的子目录和文件['b', 'test_0.txt']>>> os.listdir(path='..')# 上一级目录下的子目录和文件['a', 'test.txt']

1.4、mkdir(path)

创建单层目录(即一个文件夹),如果该目录存在,则抛出 FileExistsError 的异常:

>>> os.mkdir('new_file')>>> os.listdir()['b', 'new_file', 'test_0.txt']>>> os.mkdir('b')Traceback (most recent call last):File "", line 1, in <module>os.mkdir('b')FileExistsError: [WinError 183] 当文件已存在时,无法创建该文件。: 'b'

1.5、makedirs(path)

创建多层目录:

os.makedirs('a\\b\\c')# 表示创建了个 a 目录,里面包含 b 目录,b 目录里包含 c 目录

1.6、删除目录和文件

用于删除指定的文件,不能删除目录:

# 当前工作目录为 D:\\file,file 目录下有 文件夹a 和 d 以及 文件 test.txt,a目录下有b,b下有c>>> os.getcwd()'D:\\file'>>> os.listdir()['a', 'd' ,'test.txt']>>> os.remove('test.txt') # 删除文件 test.txt>>> os.rmdir('d') # 删除 文件夹 d>>> os.removedirs('a\\b\\c')# 删除多层目录 a\\b\\c>>> os.listdir() # file 文件为空[]

1.7、rename(old,new)

重命名文件或文件夹

>>> os.listdir()['a', 'test.txt']>>> os.rename('a', 'b')# 重命名文件夹>>> os.rename('test.txt', 'test_0.txt')# 重命名文件>>> os.listdir()['b', 'test_0.txt']

1.8、system(command)

每种系统都会提供一些小工具,system()函数可以使用这些工具:

# calc 是 windows 系统的自带计算器>>> os.system('calc')

1.9、walk(top)

walk()函数,可以遍历 top 参数指定路径下的所有子目录,并将结果返回一个三元组(路径,[包含目录],[包含文件]):

# 目录结构为,b 目录下有 目录c 和文件 test.txt,目录c 下有 文件 test_0.txt,没有文件夹>>> for i in os.walk('b'):print(i)('b', ['c'], ['test.txt']) # b 目录下有 目录c 和文件 test.txt('b\\c', [], ['test_0.txt'])# 目录c 下有 文件 test_0.txt,没有文件夹

2、os.path 模块

os.path 模块中关于路径常用函数使用方法

函数名使用方法
basename(path)去掉目录路径,单独返回文件名
dirname(path)去掉文件名,单独返回目录路径
join(path1[,path2[,…]])将 path1 和 path 2 各部分组合成一个路径名
split(path)分割文件名和路径,返回(f_path,f_name)元组
splitext(path)分离文件名与拓展名,返回(f_path,f_name)元组
getsize(file)返回指定文件的尺寸,单位是字节
getatime(file)返回指定文件最近的访问时间
getctime(file)返回指定文件的创建时间
getmtime(file)返回指定文件的最新修改时间
以下函数返回 True 或 False
exists(path)判断指定路径(目录或文件)是否存在
isabs(path)判断指定路径是否为绝对路径
isdir(path)判断指定路径是否存在且是一个目录
isfile(path)判断指定路径是否存在且是一个文件
islink(path)判断指定路径是否存在且是一个符号链接
ismount(path)判断指定路径是否存在且是一个挂载点
samefile(path1,path2)判断path1 和 path2 两个路径是否指向同一个文件

2.1、basename(path)和dirname(path)

分别用于获得文件名和路径名:

>>> os.path.dirname('file\\b\\test.txt') # 获得路径名'file\\b'>>> os.path.basename('file\\b\\test.txt')# 获得文件名'test.txt'

2.2、join(path1[,path2[,…]])

join()函数跟 BIF 的那个 join()函数不同,它是用于将路径名和文件名组合成一个完整的路径:

>>> os.path.join('C:\\', 'csv', 'test.csv')'C:\\csv\\test.csv'

2.3、split(path)和splitext(path)

  • split(path)函数:

将 path 分隔成目录和文件名的二元组(如果完全使用目录,那么它会将最后一个目录作为文件名分离,且不会判断文件或者目录存在)。

>>> path = 'C:\Python27\Lib\site-packages\myLibrary'>>> os.path.split(path)('C:\\Python27\\Lib\\site-packages', 'myLibrary')>>> os.path.split('a\\b\\test.txt')('a\\b', 'test.txt')
  • splitext(path):

将 path 中的文件分割成文件名和拓展名的二元组。

>>> path = 'C:\Python27\Lib\site-packages\myLibrary'>>> os.path.splitext(path)('C:\\Python27\\Lib\\site-packages\\myLibrary', '')>>> os.path.splitext('a\\b\\text.txt')('a\\b\\text', '.txt')

2.4、getsize(file)

用于获取文件的尺寸,返回值以字节为单位:

# 注意,是获取文件的尺寸,而且文件必须存在>>> os.getcwd()'D:\\file'>>> os.listdir()['b', 'test_0.txt']>>> os.path.getsize('test_0.txt')4

2.5、获取文件的最近访问、创建和修改时间

getatime(file)、getctime(file)和 getmtime(file),分别用于获得文件的最近访问时间、创建时间和修改时间,返回值为浮点型的秒数,可用 time 模块的 gmtime()或 localtime()函数换算。

  1. getatime(file):获得文件的最近访问时间。
import time>>> temp = time.localtime(os.path.getatime('test_0.txt'))>>> print('test_0.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))test_0.txt 被访问的时间是: 18 Dec 2017 17: 05: 44
  1. getctime(file):获得文件的创建时间。
>>> temp = time.localtime(os.path.getctime('test_0.txt'))>>> print('test_0.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))test_0.txt 被访问的时间是: 18 Dec 2017 17: 05: 44
  1. getmtime(file):获得文件的修改时间
>>> temp = time.localtime(os.path.getmtime('test_0.txt'))>>> print('test_0.txt 被访问的时间是:', time.strftime('%d %b %Y %H: %M: %S', temp))test_0.txt 被访问的时间是: 19 Dec 2017 17: 09: 47

2.6、判断

>>> os.path.exists('test_0.txt') # 判断目录或文件是否存在True>>> os.path.isabs('D:\\file\\test_0.txt') # 判断指定路径是否为绝对路径True>>> os.path.isdir('D:\\file\\test_0.txt') # 判断指定路径是否为目录False>>> os.path.isdir('D:\\file\\b')True>>> os.path.isfile('D:\\file\\test_0.txt') # 判断指定路径是否为文件True>>> os.path.islink('D:\\file\\b')# 判断指定路径是否存在一个符号链接False>>> os.path.ismount('D:\\file\\b') # 判断指定路径是否存在一个挂载点False>>> os.path.samefile('D:\\file\\b', 'D:\\file\\')# 判断 path1 和 path2 两个路径是否指向同一文件False

3、pickle 模块

在保存文本时,都是以字符串的形式存放,如果要取出数字,那么必须现将字符串转换为数字,然而要保存的数据像列表、字典甚至是类的实例这些更复杂的数据类型时,普通的文件操作就变得不那么好用了。

pickle 模块可以将任何 python 对象都转换为二进制形式存储,这个过程称为 pickling(泡菜);从二进制转换为对象的过程称为 unpickling。

# 将文件 my_list 存储到 my_list_path 中,后缀名随意,不过最好为(.pkl 或 .pickle)import picklemy_list = [123, 3.14, '你好', [456,78]]my_list_path = 'C:\\Users\\hj\\Desktop\\2\\my_list.pkl'with open(my_list_path, 'wb') as f: # 以二进制形式保存pickle.dump(my_list, f) # 存放

在电脑路径 my_list_path 中会创建一个 my_list.pkl 的文件,以记事本形式打开,显示为乱码(二进制)。

# 使用时,以二进制模式把文件打开,再以 load 把数据加载出来import picklemy_list_path = 'C:\\Users\\hj\\Desktop\\2\\my_list.pkl'with open(my_list_path, 'rb') as f: # b 是以二进制形式my_list = pickle.load(f)print(my_list)--------------------------------[123, 3.14, '你好', [456, 78]]

4、time 模块

4.1、python 中时间的表现形式

在 python 中与时间有关的模块有:time、datetime以及 calendar,学会计算时间,对程序的调优非常重要,可以在程序中打时间戳,来具体判断程序中哪一块耗时最多,从而找到程序调优的重心处。

  1. python 中,通常有这几种方式表示时间:时间戳、格式化的时间字符串、元组(struct_time 共九种元素),由于 time 模块主要是调用 C 库实现的,所有在不同平台可能会有所不同。
  2. 时间戳(timestamp)的方式:时间戳表示是从 1970年1月1号 00:00 开始到现在按秒计算的偏移量,查看 type(time.time() )的返回值类型,可以看出是 float类型,返回时间戳的函数主要有 time()、clock()。
  3. UTC(世界协调时),格林威治天文时间,即世界标准时间,中国为 UTC + 8,DST 夏令时。
  4. 元组方式:struct_time 元组共有 9 个元素,返回 struct_time 的函数主要有 gmtime()、localtime()、strptime()。
>>> import time>>> ls = time.localtime()>>> lstime.struct_time(tm_year=2017, tm_mon=12, tm_mday=19, tm_hour=22, tm_min=17, tm_sec=50, tm_wday=1, tm_yday=353, tm_isdst=0)
  • tm_year :年
  • tm_mon :月(1-12)
  • tm_mday :日(1-31)
  • tm_hour :时(0-23)
  • tm_min :分(0-59)
  • tm_sec :秒(0-59)
  • tm_wday :星期几(0-6,0表示周日)
  • tm_yday :一年中的第几天(1-366)
  • tm_isdst :是否是夏令时(默认为-1)
# 因为它是元组,那么它就遵循元组的特性,索引、切片等>>> ls[0]2017>>> ls.tm_year2017

4.2、time 模块中常用函数

4.2.1、time.time()

返回当前时间的时间戳

>>> time.time()1513865956.2554889# 对时间戳取整>>> int(time.time())1513865973

4.2.2、time.localtime([secs])

将一个时间戳转换为当前时区的 struct_time,即数据数组格式的时间

sec:转换为 time.struct_time 类型的对象的秒数

如果 secs 为提供,则以当前时间为准(即默认调用 time.time())

# 为给定参数>>> time.localtime()time.struct_time(tm_year=2017, tm_mon=12, tm_mday=21, tm_hour=22, tm_min=25, tm_sec=18, tm_wday=3, tm_yday=355, tm_isdst=0)# 给定参数>>> time.localtime(1440337405.85)time.struct_time(tm_year=2015, tm_mon=8, tm_mday=23, tm_hour=21, tm_min=43, tm_sec=25, tm_wday=6, tm_yday=235, tm_isdst=0)

4.2.3、time.gmtime([secs])

将一个时间戳转换为UTC时区的struct_time
time.gmtime() 函数将一个时间戳转换为UTC时区(0时区)的struct_time,可选的参数sec表示从1970-1-1 00:00:00以来的秒数。其默认值为time.time(),函数返回time.struct_time类型的对象。(struct_time是在time模块中定义的表示时间的对象)。
如果secs参数未提供,则以当前时间为准。

>>> import time>>> time.gmtime()time.struct_time(tm_year=2017, tm_mon=12, tm_mday=22, tm_hour=1, tm_min=48, tm_sec=3, tm_wday=4, tm_yday=356, tm_isdst=0)>>> time.gmtime(1440337405.85)time.struct_time(tm_year=2015, tm_mon=8, tm_mday=23, tm_hour=13, tm_min=43, tm_sec=25, tm_wday=6, tm_yday=235, tm_isdst=0)

4.2.4、time.mktime(t)

将一个 struct_time 转换为时间戳

time.mktime() 函数执行与gmtime(), localtime()相反的操作,它接收struct_time对象作为参数,返回用秒数表示时间的浮点数。
如果输入的值不是一个合法的时间,将触发 OverflowError 或 ValueError

# t 结构化的时间或完整的 9位元组元素>>> time.mktime(time.localtime())1513907454.0

4.2.5、time.sleep(secs)

线程推迟指定的时间运行,线程睡眠指定时间,单位为秒

# 睡眠 10 秒time.sleep(10)

4.2.6、time.clock()

这个函数, 函数以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比time.time()更有用。在不同的系统上含义不同。在 UNIX 系统上,它返回的是“进程时间”,它是用秒表示的浮点数(时间戳)。而在Windows中,第一次调用,返回的是进程运行时实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。

  • (1)在第一次调用的时候,返回的是程序运行的实际时间;
  • (2)第二次之后的调用,返回的是自第一次调用后,到这次调用的时间间隔在win32系统下,这个函数返回的是真实时间(wall time),而在Unix/Linux下返回的是CPU时间
importtimedef procedure():time.sleep(3)time1 = time.clock()procedure()print(time.clock() - time1, 'seconds process time!')time2 = time.time()procedure()print(time.time() - time2, 'seconds wall time!')------------------------------------------------------------------3.0008666269000823 seconds process time!3.0008370876312256 seconds wall time!

4.2.7、time.asctime([t])

把一个表示时间的元组或者 struct_time 表示为 ‘Sun Aug 23 14:31:59 2015’ 这种形式,如果没有参数给定,那么将会使用 time.local() 作为参数传入。

>>> time.asctime(time.gmtime())'Fri Dec 22 02:20:36 2017'

4.2.8、time.ctime([secs])

将一个时间戳(按秒计算的浮点数)转换为 time.asctime()的形式,如果未指定参数,将会默认使用 time.time(),作用相当于 time.asctime(time.localtime(secs)。

# sec 要转换为字符串时间的秒数>>> time.ctime(1440338541.0)'Sun Aug 23 22:02:21 2015'>>> time.ctime()'Fri Dec 22 10:23:32 2017'

4.2.9、time.strftime(format [, t])

返回字符串表示的当地时间。
把一个代表时间的元组或者struct_time(如由time.localtime()和time.gmtime()返回)转化为格式化的时间字符串,格式由参数format决定。如果未指定,将传入time.localtime()。如果元组中任何一个元素越界,就会抛出ValueError的异常。函数返回的是一个可读表示的本地时间的字符串。

  • format :格式化字符串
  • t:可选参数是一个 struct_time 对象

时间字符串支持的格式符号:(区分大小写)

%a本地星期名称的简写(如星期四为Thu)%A本地星期名称的全称(如星期四为Thursday)%b本地月份名称的简写(如八月份为agu)%B本地月份名称的全称(如八月份为august) %c本地相应的日期和时间的字符串表示(如:15/08/27 10:20:06%d一个月中的第几天(01 - 31%f微妙(范围0.999999%H一天中的第几个小时(24小时制,00 - 23%I第几个小时(12小时制,0 - 11%j一年中的第几天(001 - 366%m月份(01 - 12%M分钟数(00 - 59%p本地am或者pm的相应符%S秒(00 - 61%U一年中的星期数。(00 - 53星期天是一个星期的开始。)第一个星期天之前的所有天数都放在第0周。 %w一个星期中的第几天(0 - 60是星期天)%W和%U基本相同,不同的是%W以星期一为一个星期的开始。%x本地相应日期字符串(如15/08/01%X本地相应时间字符串(如08:08:10%y去掉世纪的年份(00 - 99)两个数字表示的年份 %Y完整的年份(4个数字表示年份)%z与UTC时间的间隔(如果是本地时间,返回空字符串)%Z时区的名字(如果是本地时间,返回空字符串) %%%’字符
>>> import time>>> ls = time.localtime()>>> lstime.struct_time(tm_year=2017, tm_mon=12, tm_mday=22, tm_hour=10, tm_min=29, tm_sec=24, tm_wday=4, tm_yday=356, tm_isdst=0)>>> time.strftime('%Y-%m-%d%H:%M:%S', ls)'2017-12-2210:29:24'
importtimefrom datetime import datetime# 获取当前时间的时分秒print(time.strftime('%H:%M:%S'))10:33:36print(time.strftime('%y-%m-%d')) # 获取当前时间的年月日 t = datetime.now() # 格式符实例print(t)print(t.strftime('%a'))# 当前时间的星期简写print(t.strftime('%A'))# 当前时间的星期全写print(t.strftime('%B'))# 当前时间的月份全写----------------------17-12-222017-12-22 10:42:49.912259FriFridayDecember

4.2.10、time.striptime(string [,format])

将格式字符串转换成 struct_time

该函数是time.strftime()函数的逆操作。time strptime() 函数根据指定的格式把一个时间字符串解析为时间元组。所以函数返回的是struct_time对象。

>>> stime = "2015-08-24 13:01:30"# 创建一个时间字符串变量 stime# 通过strptime()函数将 stime转换为 struct_time形式>>> formattime = time.strptime(stime,"%Y-%m-%d %H:%M:%S")>>> formattimetime.struct_time(tm_year=2015, tm_mon=8, tm_mday=24, tm_hour=13, tm_min=1, tm_sec=30, tm_wday=0, tm_yday=236, tm_isdst=-1)
# 遍历返回的时间元组序列>>> for i in formattime:print(i, end=' ')2015 8 24 13 1 30 0 236 -1 

注意在使用strptime()函数将一个指定格式的时间字符串转化成元组时,参数format的格式必须和string的格式保持一致,如果string中日期间使用“-”分隔,format中也必须使用“-”分隔,时间中使用冒号“:”分隔,后面也必须使用冒号分隔,否则会报格式不匹配的错误。