在Python中读取PDF属性/元数据

Khaleel 发表于 Python

97

Khaleel：

如何使用Python读取存储在PDF文件中的属性/元数据（如标题，作者，主题和关键字）？

假名：

试试pdfminer：

from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument

fp = open('diveintopython.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)

print(doc.info)  # The "Info" metadata

这是输出：

>>> [{'CreationDate': 'D:20040520151901-0500',
  'Creator': 'DocBook XSL Stylesheets V1.52.2',
  'Keywords': 'Python, Dive Into Python, tutorial, object-oriented, programming, documentation, book, free',
  'Producer': 'htmldoc 1.8.23 Copyright 1997-2002 Easy Software Products, All Rights Reserved.',
  'Title': 'Dive Into Python'}]

有关更多信息，请看本教程：一个轻量级的XMP解析器，用于在Python中提取PDF元数据。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-08-18

我来说两句

0 条评论

登录后参与评论

相关文章

在Python中读取PDF属性/元数据

在Python中读取tiff图片元数据

在python中读取TDMS文件的元数据

在 PDF/A 文档中读取和写入 xml 元数据

使用iTextSharp读取/修改PDF元数据，而不会在pdf属性上向用户显示任何数据

读取PDF元数据并写入CSV的脚本

如何从PDF读取PieceInfo每页元数据

在Python服务器中读取gRPC元数据

读取Doctrine实体属性的元数据

在Python中从PDF元数据中提取关键字

如何使用Python和h5py读取HDF5属性（元数据）

如何从JavaScript中的MP3文件读取元数据属性？

在 Python 中从数据库读取对象属性

在C＃中读取视频元数据

读取时删除图像中的元数据？

在目标c中读取视频元数据

如何读取扩展文件属性/文件元数据

编辑PDF文件中的OCR元数据

在 Python 中解析来自 ADO.Net 数据服务 XML 的元数据属性

从Shell脚本中的属性文件读取数据

python从文件中读取数据

Python：从文件中读取数据

在python 3.6中提取xlsx工作簿文件元数据/属性

在python中读取许多pdf文件

Python rawkit如何从RAW文件读取元数据值？

python-如何从文件获取模仿类型，读取元数据

从Pandoc markdown文件中读取YAML元数据

在Windows中读取/写入各种音频文件元数据

在Qt插件类中读取自己的元数据

TOP 榜单

文章

热门标签

归档