gpt4 book ai didi

python pdfminer - KeyError 'AcroForm'

转载 作者:行者123 更新时间:2023-12-05 07:38:32 28 4
gpt4 key购买 nike

我有一个获取附件文件名的脚本,如果扩展名表示 pdf 文件,它会通过以下代码运行它。但是我收到了下面的 KeyError。我找不到有关如何更正或排除故障的任何信息。我之前已经通过这个脚本成功地运行了 PDF 表单,不知道为什么它没有按预期运行。

 if ext == '.PDF' or ext == '.pdf':
item_field_list = []
item_number = str(random.randint(1000000, 9999999))
#try:
with tempfile.NamedTemporaryFile() as tmp:
verify_item = 0
tmp.write(part.get_payload(decode=True))
parser = PDFParser(tmp)
doc = PDFDocument(parser)
fields = resolve1(doc.catalog['AcroForm'])['Fields']

这是回溯:

Traceback (most recent call last):
File "distributionitemimport.py", line 87, in <module>
fields = resolve1(doc.catalog['AcroForm'])['Fields']
KeyError: 'AcroForm'

当我执行 print(doc.catalog) 时,我得到以下信息:

{'MarkInfo': {'Marked': True}, 'Lang': b'en-US', 'Type': /'Catalog', 'StructTree
Root': <PDFObjRef:162>, 'Pages': <PDFObjRef:2>}

最佳答案

问题是在您的 pdf 集合中有一些 pdf 没有 AcroForm。首先,删除所有没有 AcroForm 的 pdf

我建议创建一个新文件夹并放置一个包含 AcroForm 的 pdf 并检查您的代码。它会起作用

关于python pdfminer - KeyError 'AcroForm',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47821633/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com