gpt4 book ai didi

python-3.x - 错误 : cannot import name 'PDFDocument' from 'pdfminer.pdfparser'

转载 作者:行者123 更新时间:2023-12-03 16:23:40 33 4
gpt4 key购买 nike

我需要从 pdf 文件中提取文本,并成功使用了 pdfminer.six,提取了文本段落和表格。但是现在我收到与该行相关的错误

from pdfminer.pdfparser import PDFParser, PDFDocument: 

导入错误:无法从 'pdfminer.pdfparser' 导入名称 'PDFDocument' (C:\Users[username]\Anaconda3\lib\site-packages\pdfminer\pdfparser.py)

我正在使用 Anaconda Jupyter。 python 3.7.3。打包pdfminer.six-20181108

我使用的代码基于此:
How to read pdf file using pdfminer3k?

根据下面给出的建议,我多次尝试卸载并重新安装 Anaconda 和 pdfminer.six 以及其他软件包:
https://github.com/pdfminer/pdfminer.six/issues/196
一周前它突然起作用了,但现在我再次出错。

由于我在 Win10 上工作,因此我也尝试使用 Linux Ubuntu,如下所述:
https://medium.com/hugo-ferreiras-blog/using-windows-subsystem-for-linux-for-data-science-9a8e68d7610c

同样的错误。

然后,基于下面的网页,我认为值得尝试拆分 PDFparser、PDFDocument:

from pdfminer.pdfparser import PDFParser, PDFDocument


from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage

https://loctv.wordpress.com/2017/02/07/fix-importerror-cannot-import-name-pdfdocument-when-using-slate/
..
但这在稍后的代码中产生了新的错误。

我的代码的开头是这样的:
```
path = [name and path of file]
fp = open(path, 'rb')
from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams, LTTextBox, LTTextLine
```

我希望能够运行代码并从 pdf 文件中提取文本,但代码因与 PDFDocument pdfminer.pdfparser 相关的错误而停止

任何关于我应该做什么的建议都非常感谢!可能与 pdfminer.six 的安装方式有关吗?

最佳答案

我得到了 Notodden Serit 的帮助。改变这个:

from pdfminer.pdfparser import PDFParser, PDFDocument

到:
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage

并添加解析器
doc = PDFDocument()

到:
doc = PDFDocument(parser)

进而:
for page in doc.get_pages():

到:
for page in PDFPage.create_pages(doc):

关于python-3.x - 错误 : cannot import name 'PDFDocument' from 'pdfminer.pdfparser' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56023686/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com