使用 lxml 和 xpath 解析 python 中的选择性表行

西拉·S。

下面是我希望解析的 html 文件的结构

<tr data-mod-primary="true">
    <td>'some text'
<tr>
    <td>'some text'
<tr>
    <td>'some text'
<tr data-mod-primary="true">
    <td>'some text'

我有兴趣只解析下面的文本<tr data-mod-primary="true">而忽略其他<tr>

我通过了所有<tr>文本,.xpath('//tr/td/text()')但这不是我想要的。在研究了一段时间后,我尝试了以下代码:

.xpath('//tr[contains(@data-mod-primary="true",None)]/td/text()')

但这也让我得到了<tr>与结果基本相同的文本.xpath('//tr/td/text()')

任何帮助表示赞赏。谢谢你。

西多姆

您可以使用@attr=value提取特定的 tr 标签:

//tr[@data-mod-primary='true']/td/text()

或者,如果您使用contains,它将类似于:

//tr[contains(@data-mod-primary, 'true')]/td/text()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章