Python openpyxl使用教程

openpyxl是Python下的Excel库，它能够很容易的对Excel数据进行读取、写入以及样式的设置，能够帮助我们实现大量的、重复的Excel操作，提高我们的办公效率，实现Excel办公自动化。

安装方法：pip install openpyxl
中文文档：https://www.osgeo.cn/openpyxl/index.html#usage-examples
工作簿、工作表、单元格之间的关系：
- 一个工作簿(workbook)由多个工作表(worksheet)组成；
- 一个工作表有多个单元格(cell)组成；
- 通过行(row)和列(column)可以定位到单元格。

新建并写入文件

Workbook()：新建excel文件，新建文件时默认有一个名为Sheet工作表

# coding=utf-8from openpyxl import Workbookwb = Workbook() # 新建工作簿ws = wb.active # 获取工作表ws.append(['姓名', '学号', '年龄']) # 追加一行数据ws.append(['张三', "1101", 17]) # 追加一行数据ws.append(['李四', "1102", 18]) # 追加一行数据wb.save(r'测试1.xlsx') # 保存到指定路径，保存的文件必须不能处于打开状态，因为文件打开后文件只读

打开并读取文件

load_workbook(path)：加载指定路径的excel文件

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx') # 获取已存在的工作簿ws = wb.active # 获取工作表for row in ws.values: # 输出所有数据print(row)

工作簿对象

wb.active ：获取第一张工作表对象
wb[sheet_name] ：获取指定名称的工作表对象
wb.sheetnames ：获取所有工作表名称
wb.worksheets：获取所有工作表对象，wb.worksheets[0]可以根据索引获取工作表，0代表第一个
wb.create_sheet(sheet_name,index=“end”)：创建并返回一个工作表对象，默认位置最后，0代表第一个
wb.copy_worksheet(sheet)：在当前工作簿复制指定的工作表并返回复制后的工作表对象
wb.remove(sheet)：删除指定的工作表
ws.save(path)：保存到指定路径path的Excel文件中，若文件不存在会新建，若文件存在会覆盖

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r"测试1.xlsx")"""获取工作表"""active_sheet = wb.active# 获取第一个工作表print(active_sheet) # 输出工作表：by_name_sheet = wb["Sheet"]# 根据工作表名称获取工作表by_index_sheet = wb.worksheets[0] # 根据工作表索引获取工作表"""获取所有工作表"""print("获取所有",wb.sheetnames)"""新建工作表"""New_Sheet = wb.create_sheet("New")# 在最后新建工作表First_Sheet = wb.create_sheet("First",index=0)# 在开头新建工作表print("新建后",wb.sheetnames)"""复制工作表"""Copy_Sheet = wb.copy_worksheet(active_sheet)# 复制第一个工作表Copy_Sheet.title = "Copy"print("复制后",wb.sheetnames)"""删除工作表"""wb.remove(First_Sheet)# 根据指定的工作表对象删除工作表wb.remove(New_Sheet)print("删除后",wb.sheetnames)wb.save(r"测试2.xlsx")

工作表对象

ws.title：获取或设置工作表名
ws.max_row：工作表最大行数
ws.max_column：工作表最大列数
ws.append(list)：表格末尾追加数据
ws.merge_cells(‘A2:D2’)：合并单元格
ws.unmerge_cells(‘A2:D2’)：解除合并单元格。

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx') # 获取已存在的工作簿ws = wb.activeprint("工作表名",ws.title)ws.title = "学生信息表"print("修改后工作表名",ws.title)print("最大行数",ws.max_row)print("最大列数",ws.max_column)ws.append(["王五","1103",17])print("最大行数",ws.max_row)wb.save(r"测试3.xlsx")

单元格读取

ws[‘A1’]：根据坐标获取单个单元格对象
ws.cell(row, column, value=None)：根据行列获取单个单元格对象
ws[1]：获取第一行所有单元格对象，ws[“1”]也可
ws[“A”]：获取第A列所有单元格对象
ws[“A”:“B”]：获取A到B列所有单元格对象，ws[“A:B”]也可
ws[1:2]：获取1到2行所有单元格对象，ws[“1:2”]也可
ws[“A1”:“B2”]：获取A1到B2范围所有单元格对象，ws[“A1:B2”]也可。

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx')ws = wb.activeA1 = ws["A1"] # 根据坐标获取单个单元格print("第一行第一列",ws.cell(1,1))# 根据行列获取单个单元格print("第一行",ws[1])print("第A列",ws["A"])print("A到B列",ws["A":"B"])print("1到2行",ws["1":"2"])print("A1到B2范围",ws["A1":"B2"])

ws.values：获取所有单元格数据的可迭代对象，可以通过for循环迭代或通过list(ws.values)转换为数据列表

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx') # 获取已存在的工作簿ws = wb.active# 获取工作表for row in ws.values: # for循环迭代print(row)print(list(ws.values))# 转换为数据列表

ws.rows：获取所有数据以行的格式组成的可迭代对象
ws.columns：获取所有数据以列的格式组成的可迭代对象

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx')ws = wb.activefor row in ws.rows:# 以行的形式迭代print(row)print("-"*55)for col in ws.columns:# 以列的形式迭代print(col)

ws.iter_rows(min_row=None, max_row=None, min_col=None, max_col=None)：获取指定边界范围并以行的格式组成的可迭代对象，默认所有行
ws.iter_cols(min_col=None, max_col=None, min_row=None, max_row=None)：获取指定边界范围并以列的格式组成的可迭代对象，默认所有列

# coding=utf-8from openpyxl import load_workbookwb = load_workbook(r'测试1.xlsx')ws = wb.activefor row in ws.iter_rows(max_row=2,max_col=2):# 指定边界范围并以行的形式可迭代print(row)print("-"*35)for column in ws.iter_cols(max_row=2,max_col=2):# 指定边界范围并以行的形式可迭代print(column)

单元格对象

cell.value ：获取或设置值
cell.column ：数字列标
cell.column_letter ：字母列标
cell.row ：行号
cell.coordinate ：坐标，例如’A1’
cell.data_type ：数据类型， ’s‘ = string字符串,‘n’ = number数值，会根据单元格值自动判断
cell.number_format ：单元格格式，默认”General“常规，详见excel自定义数据类型

# coding=utf-8from openpyxl import Workbookwb = Workbook() # 新建工作簿ws = wb.active"""获取与设置单元格值的两种方式"""cell1 = ws.cell(1,1)# 先获取第一行第一列的单元格对象cell1.value = 18# 再设置单元格对象的值print("值",cell1.value)print("数字列标",cell1.column)print("字母列标",cell1.column_letter)print("行号",cell1.row)print("坐标",cell1.coordinate)cell2 = ws.cell(2,1,17) # 直接在获取单元格的时候设置值"""使用公式和不适用公式"""cell3 = ws.cell(3,1,"=A1+A2") # 直接输入公式具有计算功能cell4 = ws.cell(4,1,"=A1+A2")cell4.data_type = 's' # 指定单元格数据类型为文本可以避免公式被计算"""设置格式和不设置格式"""cell5 = ws.cell(5,1,3.1415) # 默认常规格式cell6 = ws.cell(6,1,3.1415)cell6.number_format = "0.00" # 设置格式为保留两位小数wb.save(r'测试4.xlsx') # 保存到指定路径

单元格样式

cell.font ：获取或设置单元格Font对象（字体名称，字体大小，是否加粗，字体颜色等）
cell.border ：获取或设置单元格边框
cell.alignment ：获取或设置单元格水平/垂直对齐方式
cell.fill：获取或设置单元格填充颜色

from openpyxl import Workbookfrom openpyxl.styles import Font, Border, Side, Alignment,PatternFillfrom copy import copywb = Workbook()ws = wb.active"""获取单元格并设置单元格值为 姓名 """cell = ws.cell(1,1,"姓名")"""设置单元格文字样式"""cell.font = Font(bold=True, # 加粗 italic=True, # 倾斜 name="楷体", # 字体 size=13, # 文字大小 color="FF0000" # 字体颜色为红色 )"""复制单元格样式"""cell2 = ws.cell(1,2,"学号")cell2.font = copy(cell.font)"""设置单元格边框为黑色边框"""cell.border = Border(bottom=Side(style='thin', color='000000'), right=Side(style='thin', color='000000'), left=Side(style='thin', color='000000'), top=Side(style='thin', color='000000'))"""设置单元格对齐方式为水平垂直居中"""cell.alignment = Alignment(horizontal='center',vertical='center')"""设置单元格底纹颜色为黄色"""cell.fill = PatternFill(fill_type='solid', start_color='FFFF00')"""白色：FFFFFF，黑色：000000，红色：FF0000，黄色：FFFF00绿色：00FF00，蓝色：0000FF，橙色：FF9900，灰色：C0C0C0常见颜色代码表：https://www.osgeo.cn/openpyxl/styles.html#indexed-colours"""wb.save(r"测试5.xlsx")

列宽与行高

ws.row_dimensions[行号]：获取行对象（非行数据，包括行的相关属性、行高等）
ws.column_dimensions[字母列标]：获取列对象（非行数据，包括行的相关属性、列宽等）
get_column_letter(index)：根据列的索引返回字母
column_index_from_string(string)：根据字母返回列的索引
row.height：获取或设置行高
column.width：获取或设置列宽

from openpyxl import Workbookfrom openpyxl.utils import get_column_letter,column_index_from_stringwb = Workbook()ws = wb.active"""行"""row = ws.row_dimensions[1]# 获取第一行行对象print("行号",row.index)row.height = 20 # 设置行高print("行高",row.height)"""列"""column = ws.column_dimensions["A"] # 根据字母列标获取第一列列对象column = ws.column_dimensions[get_column_letter(1)]# 根据数字列标获取第一列列对象print("字母列标",column.index)print("数字列标",column_index_from_string(column.index))column.width = 15# 设置列宽print("列宽",column.width)wb.save(r'测试6.xlsx')

如何根据输入内容计算其在excel的列宽是多少？

利用GBK编码方式，非汉字字符占1个长度，汉字字符占2个长度

from openpyxl import Workbookfrom openpyxl.utils import get_column_letter,column_index_from_stringwb = Workbook()ws = wb.activecolumn = ws.column_dimensions[get_column_letter(1)]# 根据数字列标获取第一列列对象value = "我爱中国ILoveChain"# 4*2+10*1+1=19column.width = len(str(value).encode("GBK"))+1# 根据内容设置列宽,+1既可以补充误差又可以让两边留有一定的空白，美观print("列宽",column.width)# 输出：19ws.cell(1,1,value)wb.save(r'测试6.xlsx')

插入和删除行和列

插入和删除行、列均使用数字指定

ws.insert_rows(row_index,amount=1)：在第row_index行上方插入amount列，默认插入1列
ws.insert_cols(col_index,amount=1)：在第col_index列左侧插入amount列，默认插入1列
ws.delete_rows(row_index,amount=1)：从row_index行开始向下删除amount行，默认删除1行
ws.delete_cols(col_index,amount=1)：从col_index列开始向右删除amount行，默认删除1列

from openpyxl import Workbook,load_workbookwb = load_workbook("测试1.xlsx")ws = wb.activews.insert_rows(1,2) # 在第一行前插入两行delete_col_index = [1,3]# 删除1、3两列"""为避免删除多列时前面列对后面列产生影响，采取从后面列往前面列删的策略,行同理"""delete_col_index.sort(reverse=True) # 从大到小排序for col_index in delete_col_index:ws.delete_cols(col_index)wb.save(r'测试7.xlsx')

综合写入实践

写入后的效果如下：

# coding=utf-8from openpyxl import Workbookfrom openpyxl.styles import Font, Border, Side, Alignment, PatternFillwb = Workbook()ws = wb.active"""设置全局样式"""border = Border(bottom=Side(style='thin', color='000000'),right=Side(style='thin', color='000000'),left=Side(style='thin', color='000000'),top=Side(style='thin', color='000000'))alignment = Alignment(horizontal='center', vertical='center')row_index = 1 # 写入的行索引，每写入一行后+1"""写入标题"""title = ['姓名', '学号', '分数']for index,item in enumerate(title):cell = ws.cell(row_index,index+1,item)cell.border = bordercell.alignment = alignmentcell.font = Font(bold=True)row_index += 1data = [['张三', "1101", 17],['李四', "3412", 18],['王五', "1103", 16]]"""写入正文"""for row in data:for index,item in enumerate(row):cell = ws.cell(row_index, index + 1, item)cell.border = bordercell.alignment = alignmentrow_index += 1"""写入结果"""result = ["", "合计", 17+18+16]for index,item in enumerate(result):cell = ws.cell(row_index,index+1,item)cell.border = bordercell.alignment = alignmentcell.fill = PatternFill(fill_type='solid', start_color="FFFF00")wb.save(r"学生信息表.xlsx")

合并表格

# coding=utf-8from openpyxl import Workbook,load_workbookimport osdir_path = "学生名单"# 要合并文件的文件夹地址"""读取文件夹下的所有excel文件"""files = []for file in os.listdir(dir_path): # 获取当前目录下的所有文件files.append(os.path.join(dir_path,file)) # 获取文件夹+文件名的完整路径"""以第一个文件为基本表"""merge_excel = load_workbook(files[0])merge_sheet = merge_excel.active"""遍历剩余文件，追加到基本表"""for file in files[1:]:wb = load_workbook(file)ws = wb.activefor row in list(ws.values)[1:]:# 从第二行开始读取每一行并追加到基本表merge_sheet.append(row)merge_excel.save("高一学生汇总.xlsx")

拆分表格

# coding=utf-8from openpyxl import Workbook,load_workbookimport osfile_path = "高一学生汇总.xlsx" # 要拆分的文件地址split_dir = "拆分结果"# 拆分文件后保存的文件夹group_item = "班级" # 拆分的依据字段"""打开拆分的excel文件并读取标题"""wb = load_workbook(file_path)ws = wb.activetitle = []for cell in ws[1]:title.append(cell.value)"""开始分组，分组结果保存到字典，键为班级名，值为班级学生列表"""group_result = {}# 存储分组结果group_index = title.index(group_item) # 获取拆分依据字段的索引for row in list(ws.values)[1:]:class_name = row[group_index] # 获取分组依据数据，即班级名if class_name in group_result:# 如果分组存在就追加，不存在就新建group_result[class_name].append(row)else:group_result[class_name] = [row]"""创建输出文件夹"""if not os.path.exists(split_dir): # 如果不存在文件夹就新建os.mkdir(split_dir)os.chdir(split_dir) # 进入拆分文件夹"""打印并输出分组后的数据"""for class_name,students in group_result.items():new_wb = Workbook() # 新建excelnew_ws = new_wb.activenew_ws.append(title)# 追加标题for student in students:new_ws.append(student)# 讲分组数组追加到新excel中new_wb.save("{}.xlsx".format(class_name))

作业提交情况检测

# encoding: utf-8import osfrom openpyxl import Workbook, load_workbookexcel_path = r"学生名单/高一1班.xlsx"# excel文件路径job_path = r"作业" # 作业文件夹路径"""获取姓名列表"""wb = load_workbook(excel_path)ws = wb.activenames = []for cell in ws["C"][1:]:# 获取第C列第2行开始的数据names.append(cell.value)"""获取作业列表"""os.chdir(job_path)# 切换到作业目录files = []# 获取文件列表for file in os.listdir():files.append(os.path.splitext(file)[0])"""作业检测"""yes,no = [],[]for name in names: # 逐个姓名判断if name in files: # 判断姓名是否在文件列表中yes.append(name)# 如果在，添加到已完成名单else:no.append(name) # 否则，添加到未完成名单print("已完成人数：{}，已完成名单：{}".format(len(yes),yes))print("未完成人数：{}，未完成名单：{}".format(len(no),no))