正则表达式匹配字符串中的特定单词，但不包括索引版本

Davies-Barnard 发表于 Dev

戴维斯-巴纳德

我敢肯定，如果有解决方案，那么它就在某个地方，但我找不到。我一直遵循Python正则表达式来匹配特定的单词，并且在第一个方面取得了成功，但现在在第二个方面苦苦挣扎。

我继承了一种可怕的文件格式，其中每个测试结果都单独显示。每个记录只能将其限制为12个字符，因此某些结果会分成几行，例如SITE，SITE1和SITE2。我正在尝试将文件解析为字典，以便可以对其进行更多分析，最终生成格式化的报告。

上面的链接/下面的代码允许我匹配每个SITE并将它们连接在一起，但是这给我正确匹配INS，INS 1和INS 2带来了问题。是的，空间是故意的-它是我必须处理的。INS是测试结果，而INS 1是通过测试的极限。

是否有匹配的正则表达式

SITE> SITE True，但SITE> SITE1 false

和

INS> INS True，但是INS至INS 1否？

这是python代码。

import re    
lines = ['SITE start', 'SITE1 more', 'SITE2 end','INS value1', 'INS 1 value2']
headings = ['SITE','SITE1',"SITE2", "INS", "INS 1"]
for line in lines:
    for heading in headings:
        headregex = r"\b" + heading + r"\b"
        match = re.search(headregex,heading)
        if match:
            print "Found " + heading + " " + line
        else:
            print "Not Found " + heading + " " + line

这是一些虚拟数据：

TEST MODE 131 AUTO SITE startaddy SITE1 middle addy SITE2 end addy USER DB VISUAL CHECK P BOND RANGE 25A EARTH 0.09 OHM P LIMIT 0.10 OHM INS 500 V INS 1 >299 MEG P ... TEST MODE 231 AUTO SITE startaddy SITE1 middle addy SITE2 end addy USER DB VISUAL CHECK P INS 500 V INS 2 >299 MEG P ...

很抱歉使用可怕的格式-它是从我正在处理的内容中复制并粘贴的！

维克多·史翠比维

问题是INS模式在INSinINS 1或INS 2etc中找到部分匹配项。

在提取替代项的情况下，习惯上使用以最长值开头的替代项（例如INS \d+|INS），但是在这种情况下，您希望获取所有正则表达式匹配项的列表，仅排除一些重叠的标题匹配项。

为此，有一种方法可以通过将所有标题项视为正则表达式来排除该匹配项，并定义INS模式INS(?! \d)以确保INS在其后跟空格和数字时不匹配。

参见Python演示：

import re    
lines = ['SITE start', 'SITE1 more', 'SITE2 end','INS value1', 'INS 1 value2']
headings = ['SITE','SITE1',"SITE2", r"INS(?! \d)", "INS 1"]
headings=sorted(headings, key=lambda x: len(x), reverse=True)
for line in lines:
    print("----")
    for heading in headings:
        headregex = r"\b{}\b".format(heading)
        match = re.search(headregex,heading)
        if match:
            print "Found " + heading + " " + line
        else:
            print "Not Found " + heading + " " + line

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-19

我来说两句

0 条评论

登录后参与评论

上一篇：有无序集合的Python数据类型吗？

TOP 榜单

文章

正则表达式匹配字符串中的特定单词，但不包括索引版本

正则表达式匹配字符串中的特定单词，但不包括索引版本

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序