gpt4 book ai didi

python - 如何使用 python 删除 pdf 的所有其他页面?

转载 作者:行者123 更新时间:2023-12-02 03:02:25 28 4
gpt4 key购买 nike

我下载了一个 pdf 文件,其中所有其他页面都是空白,我想删除空白页。我可以在 pdf 工具(Adobe Acrobat、Preview.app、PDFPen 等)中手动执行此操作,但由于它有数百页,我希望执行更自动化的操作。有没有办法在 python 中做到这一点?

最佳答案

一种方法是使用 pypdf,因此首先在您的终端中执行

pip 安装 pypdf4

然后创建一个与此类似的 .py 脚本文件:

# pdf_strip_every_other_page.py

from PyPDF4 import PdfFileReader, PdfFileWriter

number_of_pages = 500
output_writer = PdfFileWriter()
with open("/path/to/original.pdf", "rb") as inputfile:
pdfOne = PdfFileReader(inputfile)

for i in list(range(0, number_of_pages)):
if i % 2 == 0:
page = pdfOne.getPage(i)
output_writer.addPage(page)

with open("/path/to/output.pdf", "wb") as outfile:
output_writer.write(outfile)

注意:您需要将路径更改为适合您的场景的路径。

显然这个脚本相当粗糙,可以改进,但希望将其分享给其他想要快速处理这种情况的人。

关于python - 如何使用 python 删除 pdf 的所有其他页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59740768/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com