今天给大家分享Python处理Word的第三方库:Python-Docx。

什么是Python-Docx?

Python-Docx是用于创建和更新Microsoft Word(.docx)文件的Python库。

日常需要经常处理Word文档,用Python的免费第三方包:Python-Docx处理docx十分方便。

而且这个包和pandas包结合使用,可以在word插入excel表格,节省了很多复制、粘贴、调整表格样式的时间,真的很方便!

但是要注意:Python-Docx只能处理docx、docx、docx文件!

下面给大家介绍一下如何使用Python-Docx吧,抛砖引玉~

安装

  • 由于 python-docx 已经提交给 PyPI 仓库,所以可以使用 pip 安装,如下:

pipinstallpython-docx
  • 如果同时安装了 python2 和 python3 那么 pip 可能不能用,可以使用 pip3 来安装,如下:

pip3installpython-docx

文档下载

Python-Docx的官网提供了使用文档:该文档说明了如何使用Python-Docx的所有功能,并包含完整的API参考。在下载中包含的示例中也很好地展示了Python-Docx的功能。

图片

使用演示

这里直接用代码给大家演示,如何生成上图所示的文档,内容包含:

  1. 导入python-docx库

  2. 新建wrod文档、一级、二级、三级标题、自然段

  3. 设置字体格式

  4. 在指定位置添加图片

  5. 在指定位置添加表格

  6. 文档另存为

以下代码可以左右滑动,也可以直接复制粘贴哟~!

#1、导入python-docx库fromdocximportDocumentfromdocx.sharedimportInchesdocument=Document()document.add_heading('DocumentTitle',0)#2、新建wrod文档、一级、二级、三级标题、自然段p=document.add_paragraph('Aplainparagraphhavingsome')#3、设置字体格式p.add_run('bold').bold=Truep.add_run('andsome')p.add_run('italic.').italic=Truedocument.add_heading('Heading,level1',level=1)document.add_paragraph('Intensequote',style='IntenseQuote')document.add_paragraph('firstiteminunorderedlist',style='ListBullet')document.add_paragraph('firstiteminorderedlist',style='ListNumber')#4、在指定位置添加图片document.add_picture('monty-truth.png',width=Inches(1.25))records=((3,'101','Spam'),(7,'422','Eggs'),(4,'631','Spam,spam,eggs,andspam'))#5、在指定位置添加表格table=document.add_table(rows=1,cols=3)hdr_cells=table.rows[0].cellshdr_cells[0].text='Qty'hdr_cells[1].text='Id'hdr_cells[2].text='Desc'forqty,id,descinrecords:row_cells=table.add_row().cellsrow_cells[0].text=str(qty)row_cells[1].text=idrow_cells[2].text=descdocument.add_page_break()#6、文档另存为document.save('demo.docx')

其他资源

可以在Python-Docx的GitHub页面上找到更多示例代码。

https://github.com/python-openxml/python-docx

更多精彩教程欢迎B站搜索“千锋教育”

千锋教育Python全套视频教程,轻松掌握Excel、Word、PPT、邮件、爬虫、office办公自动化(宋如宁主讲)