gpt4 book ai didi

python - Python 中的 PDFminer

转载 作者:行者123 更新时间:2023-12-01 05:40:03 26 4
gpt4 key购买 nike

我下载了pdfminer,命令行方法工作得很好,但我希望能够同时转换多个pdf文档,所以我尝试使用pdfminer作为库,我找到了这个os stackoverflow,但我不能让它工作..

from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO



def convert_pdf(path):

rsrcmgr = PDFResourceManager()
retstr = StringIO()
codec = 'utf-8'
laparams = LAParams()
device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)

fp = file(path, 'rb')
process_pdf(rsrcmgr, device, fp)
fp.close()
device.close()

str = retstr.getvalue()
retstr.close()
print str


convert_pdf("/Users/gorkemyurtseven/Desktop/casino.pdf")

当我运行它时,我得到:

Traceback (most recent call last):
File "pdfminer.py", line 1, in <module>
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
File "/Users/gorkemyurtseven/Desktop/pdfminer.py", line 1, in <module>
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
ImportError: No module named pdfinterp

最佳答案

您似乎正在将脚本 pdfminer 称为模块,并且在尝试导入同名模块时它会变得疯狂。

另一个原因可能是 pdfminer 模块安装不正确或者它不是您的 python 发行版的正确版本。

关于python - Python 中的 PDFminer,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17819176/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com