我一直在搜索,浏览stackoverflow RegEx解决方案,直到我眼花bug乱。
我有一个第三方解决方案正在提供“制表符分隔的文本文件”,但是我确定生成此文件的任何内容都嵌入了双引号(甚至没有转义双引号)-我想知道是否有可能清除这些错误用RegEx从文件中删除(我在导入之前在文件上使用了FNR)。
每一行数据包含14列,以制表符分隔,按预期在每个字段两边加上双引号。所有缺陷都发生在字段2或字段10(不是第一字段或最后一个字段)中,因为它们是培训课程-一些讲师使用的名称本身中带有双引号的名称-并且此第三方报告不会逃避它们。我希望在正确的引号之前和之后都包含制表符-并过滤所有内部错误的双引号或使用\“对其进行正确转义。
"......" "ADC000000" "Being the "Best" you can be" "2F8A776C" "...."
"......" "BBC555555" ""Golden Opportunity"" "8F4C3DEE" "...."
期望的输出
"......" "ADC000000" "Being the \"Best\" you can be" "2F8A776C" "...."
"......" "BBC555555" "\"Golden Opportunity\"" "8F4C3DEE" "...."
或(以最简单且最快的速度为准,文件中包含220,000行,并且只有16-50个错误)
"......" "ADC000000" "Being the Best you can be" "2F8A776C" "...."
"......" "BBC555555" "Golden Opportunity" "8F4C3DEE" "...."
对此表示冗长,我们深表歉意。但是我希望这个问题尽可能清楚。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句