我有以下HTML代码:
<div class="tags">
<a href="/tag:SD_Card_Holder">SD_Card_Holder</a>
,
<a href="/tag:Thumb_Drive">thumb_drive</a>
</div>
<a>
在这种情况下,我只需要带标签中的内容:SD_Card_Holder
和thumb_drive
。
我的regex
是以下内容:
(?s)class="tags">[^<]*?<a href="\/tag:(.*?)">(.*?)<\/a><\/div>
我得到的结果是:
SD_Card_Holder
SD_Card_Holder, thumb_drive
第二个是第一次出现,我需要避免这种情况。
如何避免这种情况?
众所周知,除非您确定要使用哪种html,否则不应该使用正则表达式来解析xhtml。但是,如果要使用正则表达式,可以使用如下正则表达式:
<a.*?:(.*?)">
比赛信息
MATCH 1
1. [33-47] `SD_Card_Holder`
MATCH 2
1. [84-95] `Thumb_Drive`
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句