在xpath中获取文本值而不包含脚本

hadesfv

您好,我是Web抓取和X PATH的新手,我在ID中有以下x路径(我在scrapy(Python框架)中使用)main,如何修改xpath以不收集“脚本”和“样式”?

my_list=response.xpath('//*[@id="main"]//text()').extract()

在网上搜索后,我发现我可以使用|一个以上的x路径(在我的情况下特定于每个标签),但这效率不高,因为文本可以在任何标签span,li,h2中...

即我想提取id = main中的所有文本,而不是从脚本或样式标签中提取所有文本

精神递归

使用该name()函数获取节点的名称,并使用该not()函数指定您不想包括的节点

//*[@id='main']/descendant-or-self::*[not(name()='script') and not(name()='style')]//text()

descendant-or-self确保直接//*[@id='main']包含的任何文本节点也被包含在内。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

FitNesse - 检查变量是否不包含脚本表中的文本

Xpath,在Google表格中获取包含文本和图像的表格

xpath:如何查找不包含文本的节点?

使用XPath string()从bash脚本中的XML获取属性值

如何获取xpath的文本值?

在 DOM XPath 中获取数据属性链接的文本值

使用XPath从孙子获取文本并包含功能

获取指向包含某些文本的标签的xpath

从Soapui Groovy脚本中的XML获取文本值

scrapy 和 xpath:获取子元素中的文本,如果父元素包含文本

如何修复搜索框中不断变化的 xPath(不包含文本)

当文本框包含浮点值时如何在MFC中获取文本框的值

Xpath在链接文本中获取文本

文本中包含'和/时的Xpath语法

如果列中不包含特定值/文本,则突出显示该列中的单元格

获取包含换行符的文本的值

如何在xpath中链接包含和不包含的内容?

查找列中是否包含特定文本。如果是这样,获取包含文本的单元格右侧的值

Flutter - 如何仅获取 Cloud Firestore 中列表中不包含的特定值的文档?

Xpath 不包含

检查列表中是否包含xpath值

Xpath:获取包含其他标签的标签内的文本

Xpath获取除<script>之外的任何包含子文本的标签

如何在xpath中获取具有特定文本值的节点?

AngularJS:获取查询字符串值,链接中不包含哈希

尝试从xml字符串中获取xml节点值时,序列不包含任何元素

xPath:如何从表中获取“标题”文本?

在 python 3.6 中 - 使用 xpath 获取文本

Xpath - 带有包含文本值的表格的多个嵌套 div