Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

 pip install PyPDF2 
import PyPDF2

def funSplitPdf():
    pdf_file = open(
        '/path/fileName.pdf', 'rb')
    pdf_reader = PyPDF2.PdfReader(pdf_file)
    size = len(pdf_reader.pages)
    for i in range(size):
        out_pdf = PyPDF2.PdfWriter()
        out_pdf.add_page(pdf_reader.pages[i])
        out_pdf_file = open(
            '/path/fileName-'+str(i)+'.pdf',
            'wb')
        out_pdf.write(out_pdf_file)
        out_pdf.close()
if __name__ == '__main__':
    funSplitPdf()

pdf转word

安装:

 pip install pdf2docx 
import pdf2docx

def funPdf2Word():
    pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

pip install  PyMuPDF
import fitz

def funPdf2Png():
    pdf_file = fitz.open('/path/fileName.pdf')
    for i in range(pdf_file.page_count):
        pdf = pdf_file[i]
        zoom_x = 1.3  # 水平方向
        zoom_y = 1.3  # 垂直方向
        mat = fitz.Matrix(zoom_x, zoom_y)
        pix = pdf.get_pixmap(matrix=mat)
        pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)
    pdf_file.close()

相关推荐

  1. Python3进行pdf文件分割word

    2024-01-26 06:06:01       48 阅读
  2. Python实现pdf文件word文件

    2024-01-26 06:06:01       57 阅读
  3. Linux下实现Word文件PDF

    2024-01-26 06:06:01       60 阅读
  4. docx、excel、wordpdf文件

    2024-01-26 06:06:01       43 阅读
  5. 利用aspose进行wordpdf、打印pdf

    2024-01-26 06:06:01       73 阅读
  6. Python】pptx文件pdf

    2024-01-26 06:06:01       57 阅读
  7. python文件docxpdf

    2024-01-26 06:06:01       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-26 06:06:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-26 06:06:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-26 06:06:01       82 阅读
  4. Python语言-面向对象

    2024-01-26 06:06:01       91 阅读

热门阅读

  1. 开源CRM客户管理系统-FeelCRM

    2024-01-26 06:06:01       50 阅读
  2. Centos7.6之禅道开源版17.6.1安装记录

    2024-01-26 06:06:01       49 阅读
  3. Fastbee开源物联网项目RoadMap

    2024-01-26 06:06:01       49 阅读
  4. Go(四)gin框架

    2024-01-26 06:06:01       49 阅读
  5. Android eglSwapBuffers和onrender的先后顺序

    2024-01-26 06:06:01       60 阅读
  6. 《开始使用PyQT》 第01章 PyQT入门 01 PyQT框架概述

    2024-01-26 06:06:01       50 阅读
  7. 【学习笔记】CF1349F2 Slime and Sequences (Hard Version)

    2024-01-26 06:06:01       58 阅读
  8. python实用:日志模块设计、备份、控制台输出

    2024-01-26 06:06:01       60 阅读
  9. 用golang实现一个定时任务

    2024-01-26 06:06:01       64 阅读