gpt4 book ai didi

python - 使用 python pdftables 从 pdf 中获取表数据时获取 NotImplementedError 文件

转载 作者:行者123 更新时间:2023-11-30 22:31:53 26 4
gpt4 key购买 nike

我正在使用 Python pdftables 从 pdf 中获取表数据,并且按照 git 中给出的说明进行操作

https://github.com/drj11/pdftables

但是当我运行代码时

filepath = 'tests.pdf'
fileobj = open(filepath,'rb')
from pdftables.pdf_document import PDFDocument
doc = PDFDocument.from_fileobj(fileobj)

我收到这样的错误

       File "<stdin>", line 1, in <module>
File "pdftables/pdf_document.py", line 53, in from_fileobj
raise NotImplementedError

谁能帮我解决这个问题

最佳答案

如果你看file实现from_fileobj函数你可以看到以下注释:

# TODO(pwaller): For now, put fh into a temporary file and call
# .from_path. Future: when we have a working stream input function for
# poppler, use that.

如果我理解正确,您应该使用 from_path 函数,因为 from_fileobj 尚未实现。对于您当前的代码来说这很容易:

filepath = 'tests.pdf'
from pdftables.pdf_document import PDFDocument
doc = PDFDocument.from_path(filepath)

关于python - 使用 python pdftables 从 pdf 中获取表数据时获取 NotImplementedError 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45671865/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com