它与网站上的内容维度有关。此链接检查器工具支持 Python 正则表达式。使用链接检查器,我只想获取有关一个内容维度的信息。
我想匹配除字符串之外的所有字符串de_de
(对于--no-follow-url
选项)。
https://www.example.com/int_en
https://www.example.com/int_de
https://www.example.com/de_de ##should not match or all others should match
https://www.example.com/be_de
https://www.example.com/fr_fr
https://www.example.com/gb_en
https://www.example.com/us_en
https://www.example.com/ch_de
https://www.example.com/ch_it
https://www.example.com/shop
我被困在这些方法之间:
https:\/\/www.example.com\/\bde\_de
https:\/\/www.example.com\/[^de]{2,3}[^de]
https:\/\/www.example.com\/[a-z]{2,3}\_[^d][^e]
https:\/\/www.example.com\/([a-z]{2,3}\_)(?!^de$)
https:\/\/www.example.com\/[a-z]{2,3}\_
https:\/\/www.example.com\/(?!^de\_de$)
如何使用负前瞻来匹配带有特殊字符(下划线)的字符串?我可以用类似的东西去吗
(?!^de_de$)
我是正则表达式的新手,感谢任何帮助或输入。
你可以试试:
https:\/\/www.example.com\/.+?(?<!de_de)\b
这匹配:
https://www.example.com/shop
但不是:
https://www.example.com/de_de
Pythex 链接在这里
说明:这里我们使用了(?<!de_de)
应用于单词边界 ( \b
)的负向后视。这意味着我们必须找到前面没有“de_de”的词边界。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句