如何使用 Unix 从文件中删除未使用的 html 代码

卡蒂克阿迪加

我们有一个 HTML 源代码,它将使用 informatica 工作流进行处理。在这两者之间,我们有一个 Unix 脚本来转换文件。

我们在过去一周在 informatica 中收到一个错误,说格式无效,因为该文件有未使用的 html 引用(0-8,14-31 等)

例子:

� -    Unused
 -    Unused
 -    Unused
 - Ÿ Unused

来源

我们需要在 Unix 中处理它并在处理之前从 HTML 文件中删除上述字符。

我试过使用 sed 命令

sed -e 's/\&\([^\amp;|^\apos;|^\quot;|^\lt;|^\gt;]\)/\&\1/g'

但它没有达到目的。此外,由于我们有太多未使用的引用,因此也不能对其进行硬编码。

你能告诉我如何继续吗?

斯万特

这是通过将编码字符视为字符串的工作(bash)解决方案。不清楚您的来源是否已编码,但是否有效:

sed 's/'`for n in {00..08} {11..12} {14..31} {127..159}; do echo -n "&#"$n";\|"; done`'//g'

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用python替换HTML文件中的HTML代码?

如何使用Java代码切换Unix超级用户?

如何在python代码中使用unix的“ uniq -c”命令?

如何使用PHP将HTML代码显示为HTML代码

如何在IntelliJ IDEA中删除未使用的代码?

尝试使用调用php代码的html按钮从文件夹中删除图像?

如何使用JavaScript附加HTML代码?

如何使用JavaScript获取HTML源代码?

如何使HTML代码作为变量并使用它?

如何使用python更改html行代码

如何混合使用PHP和HTML代码?

如何使用 PHP 减少 html 代码的重复?

如何使用 HTML 代码中未显示的 Selenium 在弹出菜单中获取隐藏数据

如何注释掉HTML中的删除代码

使用 Javascript 从响应中删除 HTML 代码块

如何在HTML Datetime属性中使用UNIX时间?

如何在html代码中使用json文件

如何在多个文件中使用基本的html代码结构

如何使用目录文件生成 HTML href 代码

使用javascript删除任何特定的html代码

如何使用swift代码删除USER PROFILE中的文件

保存文件时禁用vscode清除/删除未使用的代码

如何使用 Javascript 删除 html 代码中特殊标签前后的标签?

如何在linux / unix中删除标签#index.html#文件?

如何使用 PHP 在电子邮件中嵌入 HTML 代码

如何使用Javascript或jQuery在div中呈现html代码

如何使用XSL代码在HTML表中显示图像?

如何使用Java代码从HTML中获取文本?

如何使用 BeautifulSoup 从这个 HTML 代码中获取文本?