Python从受密码保护的pdf获取页面数

伯迪

我一直在试图找到一种方法,可以使用python3从受密码保护的pdf中获取页数。到目前为止,我已经尝试了pypdf2和pdfminer2模块。两者均失败,因为未解密文件。

#!/usr/bin/python3
from PyPDF2 import PdfFileReader
pdfFile = PdfFileReader(open("document.pdf", "rb"))
print(pdfFile.numPages)

此代码将产生错误

PyPDF2.utils.PdfReadError: File has not been decrypted

有没有一种方法可以获取不解密的页数?

卡尔兹

您可以使用pdfrw

例如

a.pdfb.pdf是相同的pdf。区别在于b.pdf受密码保护的pdf,a.pdf没有任何保护的简单pdf 并且页面数均为30

>>> from pdfrw import PdfReader
>>> print len(PdfReader('b.pdf').pages)
30
>>> print len(PdfReader('a.pdf').pages)
30

对于安装使用以下命令

pip install pdfrw

有关详细的PDFRW

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章