前言

在Python中,文件文本操作是非常重要的,主要有以下几个原因:

  1. 数据持久性:当你需要长期存储数据,如用户的个人信息、交易记录或数据库元数据等,将数据保存在文件中是一种常见的方法。文件系统提供了持久性和可扩展性,允许你随着时间的推移添加更多的数据。
  2. 可读性和可维护性:以文本形式保存数据便于阅读和修改。这对于人类可读的日志文件、配置文件等尤其重要。
  3. 跨平台兼容性:文本文件可以在不同的操作系统和平台上轻松共享和传输。它们不需要特定的软件或硬件支持,因此非常适合在分布式系统或网络环境中使用。
  4. 灵活性:文本文件可以轻松地通过各种工具和语言进行编辑和处理,这为数据分析和处理提供了很大的灵活性。
  5. 性能优化:对于非常大的数据集,将数据存储在文件中可能比直接在内存中处理更为高效。通过读取和写入文件,你可以一次处理一个数据块,而不是一次性加载整个数据集。
  6. 自动化脚本:通过编写脚本自动执行文件操作,可以大大提高工作效率和减少人为错误。例如,批量重命名、自动备份等任务都可以通过Python脚本来实现。

正文

操作文本文件

python中使用open()函数打开文件,例如:

file = open("filename.txt", "r")# "r"表示读取模式

当然, 除了“r”这种模式,还有许多其他的模式,下面请看表格

文本文件打开模式
模式解释
r打开文件并读取数据
w打开文件并写入数据
a打开文件并添加数据
x独占创建模式。如果文件不存在,会创建一个新文件。如果文件已经存在,操作会失败
r+ / w+打开文件,并读取和写入数据
a+打开文件,并添加和读取数据

打开文件后也要关闭文件哦

file = open("filename.txt", "r")file.close()

对比一下r+、w+、a+,看例子:

r+和w+的效果都是一样的,运行一个:

#文件的输入输出file = open("filename.txt", "r+")file.write("Hello, World!")file.close()

这里每次写入“hello world”都会覆盖之前的内容,所以无论运行几次都只有一个数据。

a+:

#文件的输入输出file = open("filename.txt", "a+")file.write("Hello, World!")file.close()

“a+”是在之前的基础上再次写入数据,所以每次运行的话,之前的信息都会保留。这里我运行了三次,也就是写入了三次的“hello world”。

从文件中读取内容:

通过file.read()函数,可以将文件中的全部内容输出出来 ,如下:

file = open("filename.txt", "r")read1=file.read()print(read1)

读取文件中前20个字符:

file = open("filename.txt", "r")read1=file.read(20)print(read1)print(len(read1))

这里呢,”W”前有一个空格键,之后再加上一个换行字符,正好20个字符。

还有一个可以一行一行读出数据的方法:

file = open("filename.txt", "r")read1=file.readlines()print(read1)print(len(read1))

它将六行数据算作六个字符串,放入到一个列表中。

我们也可以除掉后面的\n字符:line.strip()它是一个字符串方法,用于去除字符串两端的空白字符(例如空格、制表符、换行符等)。

file = open("filename.txt", "r")read1=file.readlines()for line in read1:print(line.strip())print(len(read1))

操作二进制文件

二进制文件是一种计算机文件,其中包含的数据或程序指令以二进制形式编写。在计算机科学中,数据不仅包括字符,还有数字、颜色、音频、视频等。由于计算机内部只能处理二进制数据(即0和1),因此所有其他类型的数据都必须以二进制形式存储。

二进制文件有很多种类型,包括图片、音频、视频、可执行程序等。这些文件通常不能被文本编辑器直接打开或阅读,但可以使用特定的软件或程序来读取和编辑。

模式解释
rb打开二进制文件并读取数据
wb打开二进制文件并写入数据
ab打开二进制文件并添加数据
rb+打开二进制文件,并读取和写入数据
wb+打开二进制文件,并读取和写入数据
ab+打开二进制文件,并添加和读取数据

打开一幅图片试试看:

file = open("test1.png", "rb+")read1=file.readlines()print(read1)

二进制文件的写入:

import structfile = open("test1.bat", "wb")data=struct.pack('iii',5,2,3)

二进制读取:

import struct# 以二进制模式打开名为"test1.dat"的文件file = open("test1.dat","rb")# 使用struct模块的calcsize方法来计算一个整数(在这里是"i")所占的字节大小size = struct.calcsize("i")# 从文件中读取size字节的数据bytes_read = file.read(size)# 当读取的数据不为空时,循环执行以下操作while bytes_read:# 使用struct模块的unpack方法将读取的字节数据转换为整数value = struct.unpack("i",bytes_read)# 取转换后的整数列表中的第一个值(因为可能存在多个整数,但这里只取第一个)value = value[0]# 打印这个整数值,并在其后添加一个空格print(value, end=" ")# 再次从文件中读取size字节的数据bytes_read = file.read(size)# 关闭文件file.close()