gpt4 book ai didi

Python从受密码保护的pdf中获取页数

转载 作者:太空狗 更新时间:2023-10-30 01:32:05 24 4
gpt4 key购买 nike

我一直在尝试找出一种方法来使用 python3 从受密码保护的 pdf 中获取页数。到目前为止,我已经尝试过模块 pypdf2 和 pdfminer2。两者都失败了,因为文件未解密。

#!/usr/bin/python3
from PyPDF2 import PdfFileReader
pdfFile = PdfFileReader(open("document.pdf", "rb"))
print(pdfFile.numPages)

这段代码会产生一个错误:

PyPDF2.utils.PdfReadError: File has not been decrypted

有没有办法不用解密就可以得到页数?

最佳答案

您可以使用pdfrw

例子,

a.pdfb.pdf 是相同的 pdf。区别在于 b.pdf密码保护的 pdfa.pdf 是简单的 pdf 没有任何保护 并且没有页数为 30

>>> from pdfrw import PdfReader
>>> print len(PdfReader('b.pdf').pages)
30
>>> print len(PdfReader('a.pdf').pages)
30

安装使用以下命令

pip install pdfrw

详细 PDFRW

关于Python从受密码保护的pdf中获取页数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45808955/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com