如何扫描和删除(或恢复)文件夹中损坏的Word文档?

玉米片24

我有一个快要用完的旧硬盘驱动器,无法使用TestDisk恢复文件,因此我改用PhotoRec扫描HDD以恢复所有可以恢复的文件。

最后,我得到了许多似乎已损坏的Word文档(.doc文件)。打开它们时,会出现以下窗口:

有什么方法可以扫描Word文档的目录,以便仅得到有效的(未损坏的)Word文档?这样可以避免我单独打开和检查每个文档。

更新:

这些.doc文件中每个文件的前32个字节的数据都是相同的...

D0 CF 11 E0 A1 B1 1A E1 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 3E 00 03 00 FE FF 09 00

文件签名D0 CF 11 E0 A1 B1 1A E1告诉我,这些是Microsoft Office文档。我试图打开具有以下扩展名的文件之一:DOC,DOT,PPS,PPT,XLA,XLS,WIZ。在每种情况下,都会产生一个错误。

维纳亚克

您可以使用Antiword尝试读取DOC文件。您可以从此处获取Windows版本

C:\antiword\使用命令提示符将“ Antiword”解压缩到该文件夹​​并导航到该文件夹​​。
然后,您可以使用以下命令:

反词PATH_TO_DOC_FILES \ *。doc> tmpfile.txt

Antiword将输出DOC能够读取文件的纯文本内容,tmpfile.txt然后可以对所需文件进行排序并删除损坏的文件。

Antiword的输出可能类似于以下内容:

:::::::::::::::: 
Document 1.doc 
::::::::::::::::: 
                                Sample Document 1

这是一个示例Word文档。

:::::::::::::::: 
Document 2.doc 
::::::::::::::::: 
                                Sample Document 2

这是另一个示例Word文档。

::::::::::::::
舞弊Document.doc 
:::::::::::::: 

::::::::::::::
另一个损坏文献。 doc 
:::::::::::::::

然后,您可以使用grep或进行一些正则表达式匹配来查找损坏的文档的名称并将其删除。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从共享的Google云端硬盘文件夹中恢复已删除的文档?

如何更改用于使用Windows传真和扫描功能扫描的文档的默认文件夹?

如何删除损坏的文件夹?

如何从“索引”选项中删除“文档和图片”文件夹?

删除损坏的文件夹

如何使用 Alfresco Rest API 上传文档中的文件夹和子文件夹?

在文件夹中创建 Google Sheets 文档(无需移动和删除旧文档)

删除tomcat中的temp和work文件夹会损坏我的安装

无法在Windows 10中删除损坏的文件夹

使用VBA在文件夹中的所有文档中查找和替换MS Word文本

如何恢复已删除的.git / modules文件夹

恢复Git存储库中已删除的文件夹

如何使用python显示文件夹中Word文档的文件名?

我在Ubuntu中删除了一个文件夹,该如何恢复呢?

如何删除文件夹中的文件

如何从文件夹中删除文件

如何访问损坏的硬盘中的文件和文件夹?

使用C#合并文件夹中的Word文档

如何替换文件夹中Word文档中所有出现的字符串

如何从Thunderbird文件夹中的所有邮件创建Word文档?

在 git 上恢复文件夹删除。

如何在Java中扫描文件夹?

如何修复Encfs加密文件夹中的损坏权限

如何使用Powershell从文件夹的根目录中仅删除子文件夹和子文件夹的内容,而不删除单个文件

如何从 GIT 中删除文件夹?

如何删除Jenkinsfile中的文件夹?

如何从Powershell中删除文件夹?

如何从跟踪中删除文件夹

如何在 Ubuntu 中恢复我的 var 文件夹