我有两个文件夹,其中包含一组不同的 pdf。我知道第一个文件夹中具有特定名称的 PDF 需要与第二个文件夹中具有特定名称的 PDF 合并。例如,第一个文件夹中的“PID-01.pdf”需要与第二个文件夹中的“FNN-PID-01.pdf”组合,第一个文件夹中的“PID-02.pdf”需要与“ FNN-PID-02.pdf”来自第二个文件夹,我有两个文件夹等等。我正在使用 python 模块 PyPDF2。谁能举一个使用 PyPDF2 的例子
您说“合并”的意思是“合并”吗?
如果是这样的话,
假设 folder1 包含"PID-01.pdf"并且 folder2 包含"FNN-PID-01.pdf"。
import os
from PyPDF2 import PdfFileMerger, PdfFileReader
folder1 = "/your/path/to/folder1/"
folder2 = "/your/path/to/folder2/"
merged_folder = "/your/path/to/merged/folder/"
f1_files = os.listdir(folder1) # ['PID-01.pdf','PID-02.pdf'...etc]
f2_files = os.listdir(folder2) # ['FNN-PID-01.pdf','FNN-PID-02.pdf'...etc]
def pdf_merger(f1,f2):
merger = PdfFileMerger()
f1_content = PdfFileReader(file(os.path.join(merged_folder,f1), 'rb'))
f2_content = PdfFileReader(file(os.path.join(merged_folder,f2), 'rb'))
merger.append(f1_content)
merger.append(f2_content)
out = os.path.join(merged_folder,f"merged-{f1}")
merger.write(out)
#below code will iterate each file in folder1 and checks if those
#folder2 filename string "FNN-PID-01.pdf" contains substring "PID-01.pdf"
#if matchs, the 2 matching files are merged and saved to merged_folder
for file1 in f1_files :
for file2 in f2_files:
if file1 in file2:
pdf_merger(file1,file2)
您可以只迭代文件并使用正则表达式编写自己的匹配模式以进行高级使用。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句