gpt4 book ai didi

python - 使用Python提取PDF的特定页面并保存

转载 作者:行者123 更新时间:2023-12-01 09:12:10 27 4
gpt4 key购买 nike

我有一些来源,并尝试编写代码来提取一些页面并创建 pdf 文件。我有一个如下所示的列表

information = [(filename1,startpage1,endpage1), (filename2, startpage2, endpage2), ...,(filename19,startpage19,endpage19)].

这是我的代码。

from PyPDF2 import PdfFileReader, PdfFileWriter

reader = PdfFileReader("example.pdf")

for page in range(reader.getNumPages() - 1):
writer = PdfFileWriter()
start = information[page][1]
end = information[page][2]
while start < end:
writer.addPage(reader.getPage(start))
start += 1
output_filename = "{}_{}_page_{}.pdf".format(
information[page][0], information[page][1], information[page][2]
)
with open(output_filename, "wb") as out:
writer.write(out)

但是输出很奇怪..有些里面什么都没有,有些里面只有一页。我该如何纠正这个问题?

最佳答案

我已经解决了这个问题。这是等号(开始<=结束)。

for page in range(len(information)):
pdf_writer = PyPDF2.PdfFileWriter()
start = information[page][1]
end = information[page][2]
while start<=end:
pdf_writer.addPage(pdfReader.getPage(start-1))
start+=1
if not os.path.exists(savepath):
os.makedirs(savepath)
output_filename = '{}_{}_page_{}.pdf'.format(information[page][0],information[page][1], information[page][2])
with open(output_filename,'wb') as out:
pdf_writer.write(out)

关于python - 使用Python提取PDF的特定页面并保存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51567750/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com