gpt4 book ai didi

python-3.x - 外部参照表不是零索引的。对象的 ID 号将被更正。不会继续

转载 作者:行者123 更新时间:2023-12-04 12:51:05 26 4
gpt4 key购买 nike

我正在尝试打开 pdf 以获取页数。我正在使用 PyPDF2。

这是我的代码:

def pdfPageReader(fileName):
try:
pdf_file = open(fileName, 'rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file, strict=True)
number_of_pages = read_pdf.getNumPages()
print(str(fileName) + " = " + str(number_of_pages))
pdf_file.close()
return number_of_pages
except:
return "1"

但后来我遇到了这个错误:

PdfReadWarning: Xref table not zero-indexed. ID numbers for objects will be corrected. [pdf.py:1736]



我尝试使用strict=True和strict=False,当它为True时,它显示此消息,什么也没有,我等了30分钟,但什么也没发生。当它为 False 时,它​​什么也不显示,就是这样,什么都不做,如果我在终端(cmd,windows 10)上按 ctrl+c 然后它取消打开并继续(我在一批 pdf 文件中运行它)。批次中只有 1 个遇到了这个问题。

我的问题是,我该如何解决这个问题,或者我如何跳过这个,或者我如何取消它并继续处理其他 pdf 文件?

最佳答案

如果有人遇到了类似的问题,甚至导致程序崩溃并显示此错误消息

文件“C:\Programy\Anaconda3\lib\site-packages\PyPDF2\pdf.py”,第 1604 行,在 getObject 中
% (indirectReference.idnum,indirectReference.generation, idnum, generation))
PyPDF2.utils.PdfReadError: 预期对象 ID (14 0) 与实际 (13 0) 不匹配;外部参照表不是零索引的。

它帮助我为我的 pdf 阅读器添加了等于 False 的严格参数
pdf_reader = PdfFileReader(input_file,strict=False)

关于python-3.x - 外部参照表不是零索引的。对象的 ID 号将被更正。不会继续,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49939085/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com