通过使用XPath创建的响应进行解析

用户7322345

我想使用Scrapy从HTML格式正确的站点中提取一些数据。使用XPath，我可以提取项目列表，但不能使用XPath从列表中的元素中提取额外数据

所有XPath已使用XPather进行了测试。我已经使用包含网页的本地文件测试了该问题，同样的问题。

开始：

# Get the webpage
fetch("https://www.someurl.com")

# The following gives me the expected items from the HTML
products = response.xpath("//*[@id='product-list-146620']/div/div")

这些项目是这样的：

<div data-pageindex="1" data-guid="13157582" class="col ">
  <div class="item item-card item-card--static">
    <div class="item-card__inner">
      <div class="item__image item__image--overlay">
        <a href="/www.something.anywhere?ref_gr=9801" class="ratio_custom" style="padding-bottom:100%">
        </a>
      </div>
      <div class="item__text-container">
        <div class="item__name">
          <a class="item__name-link" href="/c.aspx?ref_gr=9801">The text I want</a>
        </div>
      </div>
    </div>
  </div>
</div>

当使用以下Xpath提取“我想要的文本”时，我什么也没得到：

XPATH_PRODUCT_NAME = "/div/div/div/div/div[contains(@class,'item__name')]/a/text()"
products[0].xpath(XPATH_PRODUCT_NAME).extract()

输出为空，为什么？

昆杜克

试试下面的代码。

XPATH_PRODUCT_NAME = ".//div[@class='item__name']/a[@class='item__name-link']/text()"
products[0].xpath(XPATH_PRODUCT_NAME).extract()

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-13

我来说两句

0 条评论

登录后参与评论

上一篇：如何将字符串列表中的反向字符串与python中的原始字符串列表进行比较？

通过getUrl（）的HTML响应进行解析

即使使用babel-loader，模块解析也无法通过webpack进行响应

使用Xpath进行Scala XML解析

使用Async，HtmlAgilityPack和XPath进行解析

通过使用 xpath 的条件进行特定处理

RestAssured：无法使用Xpath解析所需值的响应

通过 SOAP 响应解析

通过使用IE11进行img响应失败

使用abbr元素通过CSS进行响应文本更改

PowerShell：通过 xpath 解析 xml 节点并创建输出字符串

使用SerDe通过Hive进行Nginx日志记录解析

使用WINDBg脚本通过Windows转储文件进行解析

如何通过解析类信息使用jQuery创建类

通过使用循环进行网页抓取来创建表格

如何通过使用数组进行比较来创建警报

通过代理进行DNS解析

通过.htaccess进行URL解析

通过XML子项进行解析

如何通过解析进行循环

通过.txt文件进行解析以创建制表符分隔的输出文件

关于使用Saxon使用默认名称空间对xml进行xpath解析

如何通过改造来解析JSON响应

如何通过python解析xml响应？

通过休息模板交换解析响应

如何在Amazon的API响应中通过'<Amazon :: Ecs :: Response：0x000001069911d0>'进行解析？

通过xpath用lxml解析html的问题

通过xpath解析xml值元素

如何使用替换器函数对来自UrlFetchApp的响应进行字符串化和解析？

使用 Python/GoogleMaps API 进行反向地理编码：如何解析响应

TOP 榜单

文章

通过使用XPath创建的响应进行解析

通过使用XPath创建的响应进行解析

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面