而pdf则是用来保存一些内容已经确定好的数据,因为pdf是无法直接修改内容的,所以也会经常将pdf转为图片来保存。本文就将会来介绍一下pdf转图片的方法,往下看看吧。
1.pdf转图片的话主要实现所需要的模块叫做PyMuPDF,它就是用来操作pdf文件的,通过pip工具下载安装即可。除了这个模块之外还需要用到os模块,它是用来读取pdf文件并在转为图片后将其保存起来的,示例如下:
import datetimeimport osimport fitz# 这个就是PyMuPDF模块
2.那么为了保证这个功能能够重复的使用,所以需要用函数将主要实现的代码保存起来。并且函数的参数需要是读取pdf的文件路径和保存图片的文件路径,示例如下:
def pyMuPDF_fitz(pdfPath, imagePath):pdfDoc = fitz.open(pdfPath)
3.函数创建好之后并且使用fitz.open()方法打开一个pdf文件生成文件对象,接下来就需要去使用for循环将pdf文件的内容给读取出来。然后在循环之中去设置一下图片的分辨率和dpi等参数,在循环之中实际上是将pdf文件内容写入到一个图片对象中,代码如下:
for pg in range(pdfDoc.pageCount):page = pdfDoc[pg]rotate = int(0)zoom_x = 1.33333333zoom_y = 1.33333333mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pix = page.getPixmap(matrix=mat, alpha=False)
4.图片内容写入并且生成完之后就要使用os模块去判断一下保存图片的文件路径是否存在了,如果不存在则创建一个来保存,示例如下:
if not os.path.exists(imagePath): os.makedirs(imagePath) pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)
5.最后在_mian_方法中调用这个函数,这样就可以作为模块去使用了,代码如下:
if __name__ == "__main__":pdfPath = 'demo1.pdf'imagePath = './imgs'pyMuPDF_fitz(pdfPath, imagePath)
以上就是关于“Python怎么将pdf转为图片?Python如何实现pdf文件转图片”的全部内容了,希望对你有所帮助。
import datetimeimport osimport fitz# fitz就是pip install PyMuPDFdef pyMuPDF_fitz(pdfPath, imagePath):startTime_pdf2img = datetime.datetime.now()# 开始时间print("imagePath=" + imagePath)pdfDoc = fitz.open(pdfPath)for pg in range(pdfDoc.pageCount):page = pdfDoc[pg]rotate = int(0)# 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。# 此处若是不做设置,默认图片大小为:792X612, dpi=96zoom_x = 1.33333333# (1.33333333-->1056x816) (2-->1584x1224)zoom_y = 1.33333333mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pix = page.getPixmap(matrix=mat, alpha=False)if not os.path.exists(imagePath):# 判断存放图片的文件夹是否存在os.makedirs(imagePath)# 若图片文件夹不存在就创建pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)# 将图片写入指定的文件夹内endTime_pdf2img = datetime.datetime.now()# 结束时间print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)if __name__ == "__main__":# 1、PDF地址pdfPath = 'demo1.pdf'# 2、需要储存图片的目录imagePath = './imgs'pyMuPDF_fitz(pdfPath, imagePath)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END