通过ID和分割属性值的一部分抓取查找元素

浮点数

我是Scrapy的新手,正在尝试创建一个CSS选择器,该选择器通过id的一部分查找元素,并拆分其value属性以获取第n个项目。到目前为止,我一直在使用简单的选择器,例如:

item['url'] = response.url # get url        
item['address'] = response.css('span.address::text').get().strip() # get address

但是,现在我要选择此元素(所有ID以开头的元素mger)并在其value属性中拆分值

<input type="hidden" id="mger21110564343" name="mger21110564343" value="21110564343~1~50.37396877,5.90523487~2222GH">

我一直在研究此页面:https : //docs.scrapy.org/en/latest/topics/selectors.html#id1和Google,但仍不确定如何做到这一点。

通常,我会使用常规CSS选择器[id^=mger]

我想要的伪代码,21110564343value属性中获取价值

response.css("[id^=mger]").attr('value').get().split("~")(0)
LR

您的CSS应该可以工作,但选择器应如下所示:

selector.css('[id^=mger]::attr(value)').get()

使用scrapy时,您也可以使用xpath(实际上,css选择器会转换为xpath),因此您还可以使用:

response.xpath('//*[starts-with(@id, "mger")]/@value').get()

如果您没有获得信息,则可能意味着响应主体中实际上并不存在这些元素,您必须首先确认

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用ID的一部分查找元素

通过href属性的一部分查找元素

List <String>通过字符串的一部分查找和替换值

通过数据属性和jQuery中ID的一部分获取元素

文档querySelectorAll查找元素的属性名称的一部分?

如何使用python在硒中按ID名称的一部分查找元素

如何在json文件中查找和替换值的一部分

通过CSS attr()获取属性的第一部分/最后一部分

如何通过元素的交互获取 Id,元素是 .NET Framework 中 List<Element> 的一部分

javascript / jquery抓取URL的一部分

抓取线的一部分直到空白

抓取List <string>的一部分

如果 href 包含特定文本的一部分,则抓取 text() 值

正则表达式查找字符串的一部分和相关值

VSCode查找和替换-查找实例,其中搜索表达式的一部分与条件匹配,而一部分与条件不匹配

通过电子邮件地址的一部分查找 firebase 用户?

通过类名的一部分查找类

查找属于ID的SQL Server的逗号分隔列表的一部分的记录

如何通过键的一部分取消设置数组元素?

使用XQuery查找并替换xml值的一部分?

如何使用 JS 将 JS var 作为元素属性的一部分

在SQL中查找和替换或删除字符串的一部分

在Vim中仅查找和替换单个行的一部分

Unix-仅查找和打印文件名的一部分

Python提取json元素的一部分

如何删除元素的一部分?

如何保证属性是接口的一部分?

如何仅验证我通过获取请求获得的值的一部分?

属性“ Id”是对象键信息的一部分,无法修改。在INSERT上