如何将 XML Word 文档转换为 DOCX?

马津

我得到了一系列文件夹,其中包含大量 .xml 格式的 Word 文档。它们每个都包含一些 VBA 代码,但所有这些代码都已经运行,所以我不需要保留它。

我需要打印每个文件夹中的所有文件,但由于网络上 XML 文件的限制,我不能简单地从 Windows 资源管理器中批量打印它们,因此我需要将它们转换为 .docx(或 .doc)第一的。

我该怎么做呢?我使用 python-docx 尝试了一个简单的 python 脚本:

import os
from docx import Document
folderPath=<folderpath>
fileNamesList=os.listdir(folderPath)
for xmlFileName in fileNamesList:
    currentDoc=Document(os.path.join(folderPath,xmlFileName))
    docxFileName=xmlFileName.replace('.xml','.docx')
    currentDoc.save(os.path.join(folderPath,docxFileName))
    currentDoc.close()

这给出:

docx.opc.exceptions.PackageNotFoundError: Package not found at <first file name>.xml

我猜这是因为 python-docx 并不打算打开 .xml 文件,但这是一个非常缺乏教育的猜测。四处寻找这个错误,我能找到的只是它没有正确安装(据我所知)或使用 .doc 文件而不是 .docx 的问题。

我只是错误地使用了 python-docx 吗?如果没有,我应该使用更合适的软件包或技术吗?

微不足道的

目前尚不清楚这些.xml文件是什么类型的文件,但我怀疑它们是我认为在 Word 2003 中使用的一种过渡格式,它是基于 XML 的,但不是自 Word 2007 以来 Word 文档中使用的开放打包约定 (OPC) 格式.

python-docx现在或以后都不会读取这些内容,因此您需要将它们转换为.docx格式或直接解析 XML。

如果我有可用的 Windows,我想我会使用 VBA 编写一个简短的转换脚本,然后.docx使用python-pptx. 我将首先查看 Word 是否可以加载.xml文件并从那里开始。

您也许可以找到一个实用程序来进行批量转换,但我在快速搜索中没有找到任何实用程序。

如果您只对一次性打印感兴趣,并且 Word 将加载文件,那么没有转换步骤的 VBA 脚本可能是一个不错的选择。python-docx不打印.docx文件,只读取和写入它们。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章