如何使用 WordToHtmlConverter 和 HWPFDocument 限制页面输出?

爵士乐

我正在将 Word/.doc 文件转换为 HTML,我希望能够获得页面的子集。是否可以限制输出范围?我愿意从原始文件中创建一个新的 HWPFDocument,其中只有页面的子集,或者在转换后限制那里的长度。

File localFile = ...
FileInputStream fis = new FileInputStream(localFile);
HWPFDocument wordDoc = new HWPFDocument(fis);
Document newDoc = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(newDoc);
wordToHtmlConverter.processDocument(wordDoc);

StringWriter stringWriter = new StringWriter();

Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
transformer.setOutputProperty(OutputKeys.METHOD, "html");
transformer.transform(
    new DOMSource(wordToHtmlConverter.getDocument()),
                    new StreamResult(stringWriter));

String htmlString = stringWriter.toString();

BufferedWriter out = new BufferedWriter(new OutputStreamWriter(
    new FileOutputStream(htmlFile), "UTF-8"));
out.write(htmlString);
out.close();
杰马克墨菲

不是 POI。HWPF 格式中没有页面的概念。页面是作为消费者的人工制品。在消费者呈现页面之前没有页面,并且每个客户端呈现页面的方式可能略有不同,即使在不同版本的 Word 之间也是如此。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

有没有办法使用HWPFDocument显示换行符,订单列表

与和休眠限制,如何使用?

如何限制HTML页面的高度和宽度?

使用Nginx限制OctoberCMS中的.htm页面和部分

如何通过使用react和typescript键入url来限制用户访问特定页面?

如何使用随机和限制联合选择

PHP表单使用If语句获取和发布输出以在同一页面上输出结果

如何在WooCommerce中限制单个产品页面上产品标签的输出

如何使用 xrandr 检测和配置输出?

如何使用颜色区分命令和输出

如何使用 PhantomJS 和 Selenium 浏览页面

如何使用html和CSS更改页面?

如何使用BeautifulSoup和Python抓取页面?

如何限制瑞克路由输出到URI Pattern和Controller#action列?

如何在shell脚本和命令行中将输出限制为'n'个字符

如何限制可裁剪区域的宽度和高度以输出相同尺寸的图像?

使用json和下划线时通过模板限制输出

在WooCommerce感谢页面中显示优惠券使用次数和限制

如何从 Facebook API 输出中提取 Facebook 页面喜欢和个人资料图片

使用Ajax从实时PHP和Python输出更新页面内容

如何在Laravel中的get()之后使用限制和偏移

如何使用 QDoubleSpinBox 和 QLineEdit 限制 QDoubleSpinBox 的值?

VueJs如何使用限制器和范围进行分页?

如何限制节点进程的CPU和内存使用率

R和GNU并行-如何限制使用的内核数

如何在CoreData中使用NSPredicate进行排序和限制?

如何使用限制和某种分数选择随机行?

如果还使用了限制,如何转换和返回通用组成?

如何在服务层使用Mongoose跳过和限制功能?