我试图理解正则表达式:
我只需要匹配text_01和text_02并过滤掉标签。
<span>text_01<b>text_02</b>
我试过这样做:
(?<=<span>)(([^>]+)<b>)(.+?)(?=</b>)
但它捕获了 3 个组,并且完整匹配包含一个标签。
text_01<b>text_02
您能否就我需要如何构建一个完全匹配只包含文本而没有标签的正则表达式提出建议?
使用正则表达式解析 HTML 会变得非常复杂。一般来说,不建议练习,最好为此使用解析器(使用任何语言的一些库)。
但是对于您确定文本内容没有<
或没有的情况>
,并且这些<
并且>
没有嵌套,您可以使用这个:
这仅匹配后跟一对<
and 的文本>
。
如果足以测试文本后跟<
,则可以简单地:
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句