下面是我希望解析的 html 文件的结构
<tr data-mod-primary="true">
<td>'some text'
<tr>
<td>'some text'
<tr>
<td>'some text'
<tr data-mod-primary="true">
<td>'some text'
我有兴趣只解析下面的文本<tr data-mod-primary="true">
而忽略其他<tr>
的
我通过了所有<tr>
文本,.xpath('//tr/td/text()')
但这不是我想要的。在研究了一段时间后,我尝试了以下代码:
.xpath('//tr[contains(@data-mod-primary="true",None)]/td/text()')
但这也让我得到了<tr>
与结果基本相同的文本.xpath('//tr/td/text()')
任何帮助表示赞赏。谢谢你。
您可以使用@attr=value
提取特定的 tr 标签:
//tr[@data-mod-primary='true']/td/text()
或者,如果您使用contains
,它将类似于:
//tr[contains(@data-mod-primary, 'true')]/td/text()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句