使用Java从文档中提取嵌入式文件

阿尔文

我正在使用poi库处理MS文件。为了提取docx,xl​​sx和pptx的嵌入式ole对象,我使用方法:PackagePart pp = src.getAllEmbedds()但是对于doc,xls和ppt等MS文件的旧格式,没有这种方法。因此,我正在使用提取器:POITextExtractor[] embeddedExtractors = ExtractorFactory.getEmbededDocsTextExtractors(oleTextExtractor);但这只能提取文本,而不能提取整个文件。有人可以帮助我提取doc,ppt和xls文件吗?

用户1134181

OLE2文件包括大多数的Microsoft Office文件,如XLSDOCPPT以及MFC序列化API基于文件格式。Office OpenXML FormatMicrosoft Office 20072008中发现的基于新标准的XML文件格式这包括XLSXDOCXPPTX

对于每个MS Office应用程序,都有一个组件模块,该模块尝试为OLE2OOXML文档格式提供通用的高级Java api

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用Spring Boot的MongoDB嵌入式文档

使用iTextSharp(C#)从PDF中提取嵌入式XML

在MongoDB中使用变量作为文件名时,可以在嵌入式文档上使用'$ set'吗?

从嵌入式文档Mongo Java获得价值

从嵌入式Google地图中提取标记坐标

如何在mongoDB中的嵌入式文档中提取特定元素

使用BeautifulSoup提取带有嵌入式链接的文本

如何从嵌入式字典/列表中提取所有值

从h2o.word2vec对象中提取每个单词的嵌入式vecor

从html中的嵌入式脚本标签中提取数据

使用Presto查询MongoDB嵌入式/嵌套文档的数组

从Google表格中提取嵌入式图片并重新插入为链接

我需要使用Python / BeautifulSoup从网页中提取嵌入式.xlsx链接的帮助

如何从Wix刻录安装程序中提取嵌入式有效负载?

使用ffmpeg从具有嵌入式封面的文件中提取视频封面/缩略图

使用Java在Excel中读取嵌入式pdf文件

如何从SVG文件中提取嵌入式图像?

在JSOUP中提取到嵌入式资源的链接的最有效方法

无需完全解析即可提取嵌入式PDF文件

提取嵌入式initramfs

未使用日期的嵌入式文档索引

如何从具有嵌入式null的字符数组中提取std :: string

使用Java在MongoDB中的嵌入式文档中索引和搜索“数组”

何时使用嵌入式文档MongoDB

如何使用HTML中的嵌入式Java应用程序进行本地文件系统访问

在Django,Python中使用MongoEngine查询嵌入式文档

使用python(pymongo)在mongodb中编辑嵌入式文档

使用JSON访问mongodb的嵌入式文档

如何从三星的Motion Photo jpeg文件中提取嵌入式视频

TOP 榜单

  1. 1

    来自Microsoft Office加载项taskpane.js的MySQL驱动程序模块的空引用

  2. 2

    使用AWS Cognito和React的仅限Facebook / Google的登录名(无用户名/密码)

  3. 3

    创建Windows Phone 8应用并将其连接到数据库的最佳方法(最好是SQL Server)

  4. 4

    为什么Java中的System.out.println()打印到控制台?

  5. 5

    卷曲函数无法解析来自bash中变量的代理

  6. 6

    是什么在Android的consumer-rules.pro和proguard-rules.pro之间的区别?

  7. 7

    设置与Apache POI Excel表散点图标记图标的颜色

  8. 8

    将Qt Pyside2与asyncio await语法一起使用?

  9. 9

    崇高的文字+蟒蛇的蟒蛇

  10. 10

    任务':app:minifyReleaseWithR8'.java.lang.NullPointerException的执行失败(无错误消息)

  11. 11

    OpenJDK的和AdoptOpenJDK的区别

  12. 12

    大型数据集缓存到Spark内存中时,“超出了GC开销限制”(通过sparklyr和RStudio)

  13. 13

    “执行测试CMAKE_HAVE_LIBC_PTHREAD”失败实际上是什么意思?

  14. 14

    使用Core 2.2中的Identity,如何在关闭浏览器15分钟后保持会话活动?

  15. 15

    React中的ForwardRefExoticComponent和ForwardRefRenderFunction有什么区别?

  16. 16

    猫鼬查找结果,然后将字段替换为findOne

  17. 17

    如何降级Google Colab的Torch版本

  18. 18

    Keras提前停止回调错误,val_loss指标不可用

  19. 19

    如何避免VSCode中的“导入路径不能以.ts扩展名结尾”错误?

  20. 20

    Nuxt.JS:如何在页面中获取路由URL参数

  21. 21

    是否有为什么会AccessibilityManager.sInstance导致内存泄漏的一个原因?

热门标签

归档