Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

# -*- coding: utf-8 -*-

import os
import PyPDF2

def merge_pdfs(folder_path):
    # 获取文件夹名称
    folder_name = os.path.basename(folder_path)
    
    # 搜索文件夹内的所有PDF文件
    pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
    
    # 按名称排序文件,确保顺序
    pdf_files.sort()

    # 创建一个PDF文件合并器对象
    pdf_merger = PyPDF2.PdfMerger()

    # 遍历所有PDF文件并将它们添加到合并器中
    for pdf_file in pdf_files:
        file_path = os.path.join(folder_path, pdf_file)
        pdf_merger.append(file_path)

    # 合并后的PDF文件保存路径
    output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")

    # 写入合并后的PDF文件
    with open(output_path, 'wb') as output_file:
        pdf_merger.write(output_file)

    # 关闭合并器
    pdf_merger.close()

    print(f"PDFs merged into '{output_path}'")
# 设置源文件夹路径
source_dir = r''

# 确保目标文件夹存在
if not os.path.exists(source_dir):
    print(f"文件夹 {source_dir} 不存在")
    exit()
# 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
# 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
dir_1=os.listdir(source_dir)
for path1 in dir_1:
    if not os.path.isfile(source_dir+f'\{path1}'):
        dir_2=os.listdir(source_dir+f'\{path1}')
        for path2 in dir_2:
            if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                folder_path = deal_dir
                merge_pdfs(folder_path)

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-20 11:16:10       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-20 11:16:10       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-20 11:16:10       82 阅读
  4. Python语言-面向对象

    2024-04-20 11:16:10       91 阅读

热门阅读

  1. 【数据挖掘】课程大纲

    2024-04-20 11:16:10       36 阅读
  2. docker commit镜像时报错

    2024-04-20 11:16:10       39 阅读
  3. 阅读llama源码笔记_1

    2024-04-20 11:16:10       34 阅读
  4. 用Python代码实现数据集的批量处理(一)

    2024-04-20 11:16:10       41 阅读
  5. 安卓接收后台数据转模型int默认为double

    2024-04-20 11:16:10       35 阅读
  6. nginx

    nginx

    2024-04-20 11:16:10      33 阅读