我需要有关正则表达式的帮助,以过滤大量网址,例如:
/page-to-search-for/id/any-string
问题在于该列表还包含带有子页面的网址,例如
/page-to-search-for/id/any-string/registration-form
这些页面需要从结果中排除。
因此,正则表达式需要像:
/page-to-search-for\/(\d+)\/(\w+)(\/?(?!registration-form))
不幸的是,最后一部分无法正常工作。
希望有人可以帮助我吗?
谢谢!
似乎您想阻止在any-string之后,registration-form
在字符串位置末尾的所有URL 。
您可以使用
some-page\/(\d+)\/([^\/]+)(?:\/(?!registration-form$).*)?$
请参阅regex演示。
我建议替换\w
为[^\/]+
(以匹配任何子部分,除以外的1个字符/
),(?:\/(?!registration-form$).*)?$
将匹配:
(?:\/(?!registration-form$).*)?$
-1或0(可选)的序列:
\/
-斜线(?!registration-form$)
-不跟registration-form
在字符串($
)的末尾.*
-任何0+个字符$
-字符串结尾。本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句