Python实现PDF文件操作指南

DAY9-Python操作pdf文档

一、PYPDF的使用

先导操作

#导入pypdf2中需要的包
from PyPDF2 import PdfReader, PdfWriter
1.pdf文件读操作
1)创建reader读取 pdf文件
#对象 = PdfReader('文件夹名/文件名')
reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')

2)获取pdf总的页数

num = reader.getNumPages()
print(num)

3)获取pdf中指定的页面(页数从0开始)
p1 = reader.getPage(0)
p2 = reader.getPage(1)
2.pdf写操作
1)创建一个空的pdf文档
writer = PdfWriter()
  • ①添加指定页到空pdf中
  • 
    writer.addPage(p1)
    writer.addPage(p2)
    
    
  • ②添加空白页操作–>添加到最后一页
  • Writer.addBlankPage()
    
  • ③插入指定页到空pdf—>添加在中间
  • 
    writer.insertPage(p1, 2)
    
    2)保存操作–重要!!!🔍
    #存成新文件名
    writer.write('files/new.pdf')
    

    二、PYPDF添加水印

    #导入第三方库
    from PyPDF2 import PdfWriter, PdfReader
    import os
    
    # 补充:获取文件夹中所有的文件的名字: os.listdir(文件夹地址)
    #result = os.listdir('files')
    
    1.准备水印页面
    reader1 = PdfReader('files/water.pdf')
    water = reader1.getPage(0)
    
    2.准备需要添加水印的文件
    reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
    page = reader2.getPage(0)
    
    3.添加水印
    page.mergePage(water)
    
    4.将加完水印的页面添加到空的pdf中
    
    writer = PdfWriter()
    writer.addPage(page)
    
    writer.write('files/水印1.pdf')
    
    

    练习:

    给pdf文件的每一页都添加上水印

     练习:给pdf文件的每一页都添加上水印
    water = PdfReader('files/water.pdf').getPage(0)
    reader = PdfReader('files/MySQL.pdf')
    writer = PdfWriter()
    
    for x in range(reader.getNumPages()):
        page = reader.getPage(x)
        page.mergePage(water)
        writer.addPage(page)
    
    writer.write('files/mysql(水印).pdf')
    

    三、PYPDF创建水印

    导库

    #用来创建画布--类似于常见的空白pdf文件
    from reportlab.pdfgen.canvas import Canvas
    #用来对字体进行注册
    from reportlab.pdfbase.pdfmetrics import registerFont
    from reportlab.pdfbase.ttfonts import TTFont
    
    1.创建一个空白文件(画布)
    # 1.创建一个空白文件(画布)
    # 在指定的位置新建空白的pdf文件:Canvas(文件路径)
    file = Canvas('files/MyWater.pdf')
    
    
    2.添加文字
  • 1)注册字体
  • registerFont(TTFont('f1', 'files/font1.ttf'))
    registerFont(TTFont('f2', 'files/font2.ttf'))
    
  • 2)设置字体的名字和字体大小
  • file.setFont('f2', 40)
    
  • 3)设置字体颜色
  • 
    # r、g、b:三个数值的范围都在0~1之间
    # 透明的的范围也在0~1之间选择
    # 透明度的值可以为空 alpha=None
    # file.setFillColorRGB(r/255,g/255,b/255,alpha=None)
    file.setFillColorRGB(139/255, 69/255, 19/255, 0.7)
    
  • 4)旋转
  • file.rotate(45)
    
    # 文件对象.drawString(x坐标, y坐标, )
    file.drawString(200, 100, '你好世界!')
    
    file.rotate(-45)
    file.setFont('f1', 12)
    file.setFillColorRGB(180/255, 180/255, 180/255, 0.7)
    file.drawString(100, 0, 'hello world!')
    
    
    3.渲染图片
    
    # 文件对象.drawImage(图片地址, x坐标, y坐标, mask='auto')
    file.drawImage('files/car.png', 0, 0, mask='auto')
    
    # 保存
    file.save()
    
    
    物联沃分享整理
    物联沃-IOTWORD物联网 » Python实现PDF文件操作指南

    发表回复