无法使用xpath解析某些html元素中的某些信息

MITHU 发表于 Dev

三菱

我创建了一个xpath表达式来定位元素，以便可以在scrapy中使用xpath从某些html元素中提取某些信息。无论如何我都无法达到。

HTML元素：

<div class="rates">
                <label>
                  Rates :
                </label>
                  R 3500
                  <br class="hidden-md hidden-lg">
              </div>

我希望从中提取R 3500出来。

我尝试过：

from scrapy import Selector

html = """
<div class="rates">
                <label>
                  Rates :
                </label>
                  R 3500
                  <br class="hidden-md hidden-lg">
              </div>
"""
sel = Selector(text=html)
rate = sel.xpath("//*[@class='rates']/label/following::*").get()
print(rate)

运行上面的脚本后，这就是我想要的，<br class="hidden-md hidden-lg">而我希望得到R 3500。

.tail如果选择我可以使用lxml。但是，当我抓狂时，找不到任何类似的东西。

如何使用xpath从html元素中提取该比率？

罗曼·佩列赫雷斯特

要将文本节点作为节点following-sibling之后的label节点：

...
sel = Selector(text=html)
rate = sel.xpath("//*[@class='rates']/label/following-sibling::text()").get().strip()
print(rate)

输出：

R 3500

另外："//*[@class='rates']/label/following::text()"应该也可以。

https://www.w3.org/TR/1999/REC-xpath-19991116#axes

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-16

我来说两句

0 条评论

登录后参与评论

上一篇：Laravel Scheduler在Dreamhost VPS中不起作用

无法使用条件语句解析某些信息

使用硒解析某些“ html元素”中的文本

无法使用搜索关键字解析网页中的某些信息

无法从某些元素正确解析名称

无法使用 xpath 从某些内容中获取名称

解析某些HTML元素的属性数据

排除 xPath c# 中的某些元素

如何从HTML网页中获取某些信息？

无法解析iframe中的某些链接

无法解析网页中的某些文本

Eclipse中无法解析某些JavaFX导入

无法在Android Studio中解析某些符号

锚元素的XPath是否不在某些父元素中？

使用xpath查找具有某些特定文本的xml元素，或使用lxml在python中查找

使用xpath时避免在类中使用某些元素

无法从TFS中的某些WorkItem字段中检索信息

Jsoup如何解析包含某些属性的html元素？

无法使用Ajax重写某些html内容

使用 jquery 删除 iframe 中的某些元素

无法使用Jsoup HTML解析器Java实现某些功能

为什么在某些窗口尺寸以下的HTML中无法显示伪元素

PHP Simple HTML Dom无法解析某些链接

打开更多链接，然后解析php中的某些元素

仅使用NSXMLParser解析某些标记内的元素

使用 xml.etree.ElementTree 解析某些元素的问题

流星无法解析某些模块

无法解析某些内容的链接

SAXParser无法解析某些字符

避免使用带有HTML数据的JS函数中的某些HTML元素

TOP 榜单

文章

无法使用xpath解析某些html元素中的某些信息

无法使用xpath解析某些html元素中的某些信息

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

隐藏发件人没有短信PHP

在Windows 7中无法删除文件（2）

HttpClient中的角度变化检测

Java Eclipse中的错误13，如何解决？

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

java io ioexception无法解析服务器地址解析器的响应

jOOQ：在特定表中查找约束

Flexbox CSS 对齐属性环境惰性？

共享图像将路径放入地址

加载Microsoft Visual菜单时出现问题

Powerpoint-条形长度错误的堆积条形图

应用发明者仅从列表中选择一个随机项一次

在Angular2中的输入值之前添加加号“ +”

检查errno！= EINTR：这是什么意思？

ClickHouse 创建临时表

ggplot：对齐多个分面图-所有大小不同的分面

Azure VM启动/停止日志

是否可以通过编程方式对很多动画进行重新着色？