gpt4 book ai didi

python - 使用 pdfminer 获取章节的起始页码。

转载 作者:太空宇宙 更新时间:2023-11-04 05:22:15 24 4
gpt4 key购买 nike

是否有任何方法可以使用 pdfminer 或任何其他适用于 python 的包来获取 pdf 中特定部分的页码。我需要获取 pdf 索引部分的页码。

最佳答案

我知道这是一篇旧帖子,但我一直遇到同样的问题。产生一些有希望的结果的唯一解决方案是:

from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfparser import PDFParser

def pdf_pages(file):
parser = PDFParser(open(file, "rb"))
document = PDFDocument(parser)
for pages, pdfObjects in enumerate(PDFPage.create_pages(document)):
print(pages+1, pdfObjects)

希望这对您有所帮助。

谢谢

关于python - 使用 pdfminer 获取章节的起始页码。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39876280/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com