通过ID和分割属性值的一部分抓取查找元素

Flo 发表于 Dev

浮点数

我是Scrapy的新手，正在尝试创建一个CSS选择器，该选择器通过id的一部分查找元素，并拆分其value属性以获取第n个项目。到目前为止，我一直在使用简单的选择器，例如：

item['url'] = response.url # get url        
item['address'] = response.css('span.address::text').get().strip() # get address

但是，现在我要选择此元素（所有ID以开头的元素mger）并在其value属性中拆分值：

<input type="hidden" id="mger21110564343" name="mger21110564343" value="21110564343~1~50.37396877,5.90523487~2222GH">

我一直在研究此页面：https : //docs.scrapy.org/en/latest/topics/selectors.html#id1和Google，但仍不确定如何做到这一点。

通常，我会使用常规CSS选择器[id^=mger]。

我想要的伪代码，21110564343从value属性中获取价值：

response.css("[id^=mger]").attr('value').get().split("~")(0)

您的CSS应该可以工作，但选择器应如下所示：

selector.css('[id^=mger]::attr(value)').get()

使用scrapy时，您也可以使用xpath（实际上，css选择器会转换为xpath），因此您还可以使用：

response.xpath('//*[starts-with(@id, "mger")]/@value').get()

如果您没有获得信息，则可能意味着响应主体中实际上并不存在这些元素，您必须首先确认

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：在Xray中将黄瓜特征导出到.feature文件时缺少特征标题？

使用ID的一部分查找元素

通过href属性的一部分查找元素

List <String>通过字符串的一部分查找和替换值

通过数据属性和jQuery中ID的一部分获取元素

文档querySelectorAll查找元素的属性名称的一部分？

如何使用python在硒中按ID名称的一部分查找元素

如何在json文件中查找和替换值的一部分

通过CSS attr（）获取属性的第一部分/最后一部分

如何通过元素的交互获取 Id，元素是 .NET Framework 中 List<Element> 的一部分

javascript / jquery抓取URL的一部分

抓取线的一部分直到空白

抓取List <string>的一部分

如果 href 包含特定文本的一部分，则抓取 text() 值

正则表达式查找字符串的一部分和相关值

VSCode查找和替换-查找实例，其中搜索表达式的一部分与条件匹配，而一部分与条件不匹配

通过电子邮件地址的一部分查找 firebase 用户？

通过类名的一部分查找类

查找属于ID的SQL Server的逗号分隔列表的一部分的记录

如何通过键的一部分取消设置数组元素？

使用XQuery查找并替换xml值的一部分？

如何使用 JS 将 JS var 作为元素属性的一部分

在SQL中查找和替换或删除字符串的一部分

在Vim中仅查找和替换单个行的一部分

Unix-仅查找和打印文件名的一部分

Python提取json元素的一部分

如何删除元素的一部分？

如何保证属性是接口的一部分？

如何仅验证我通过获取请求获得的值的一部分？

属性“ Id”是对象键信息的一部分，无法修改。在INSERT上

TOP 榜单

文章

通过ID和分割属性值的一部分抓取查找元素

通过ID和分割属性值的一部分抓取查找元素

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID