我一直在试图找到一种方法,可以使用python3从受密码保护的pdf中获取页数。到目前为止,我已经尝试了pypdf2和pdfminer2模块。两者均失败,因为未解密文件。
#!/usr/bin/python3
from PyPDF2 import PdfFileReader
pdfFile = PdfFileReader(open("document.pdf", "rb"))
print(pdfFile.numPages)
此代码将产生错误:
PyPDF2.utils.PdfReadError: File has not been decrypted
有没有一种方法可以获取不解密的页数?
您可以使用pdfrw
例如,
a.pdf和b.pdf是相同的pdf。区别在于b.pdf是受密码保护的pdf,而a.pdf是没有任何保护的简单pdf ,并且页面数均为30
>>> from pdfrw import PdfReader
>>> print len(PdfReader('b.pdf').pages)
30
>>> print len(PdfReader('a.pdf').pages)
30
对于安装使用以下命令
pip install pdfrw
有关详细的PDFRW
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句