使用python将pdf文件转换为word文件| pdf2docx安装快速使用
一、pdf2docx介绍
二、pdf2docx的安装
pip install pdf2docx

这个报错是因为在安装pdf2docx这个库的时候他会捆绑下载安装其他的一些库,然后安装到PyMuPDF这个库的时候它会自动下载该模块的最高版本,可是在这个库的最高版本里面并没有支持py3.6.5版本解释器的安装包,所以就会在这里出现报错。要解决该报错只需要去到https://pypi.org/project/PyMuPDF/1.19.3/#files
这个网站下载对应电脑系统的.whl版本(其实也就是降版本下载)并且进行本地安装,再安装pdf2docx这个库即可。
三、pdf2docx快速使用
from pdf2docx import Converter
pdf_file = './xxxx.pdf'
docx_file = './xxxx.docx'
cv = Converter(pdf_file)
cv.convert(docx_file, start=0, end=5)
cv.close()
其中的pdf_file
是pdf文件,docx_file
是word文件,start
是pdf转换的起始页,end
是结束页。这里如果不传start
和end
的话默认就是从第一页转换到最后一页。也可以通过pages方法确定转换页数,方法为:cv.convert(docx_file, pages=[1, 3, 5])
效果展示:
效果还是可以的🙊
方法二:
直接使用命令行进行全部页面转换,代码如下:
$ pdf2docx convert test.pdf test.docx
同样的也可以使用start方法和end方法。