我正在使用Scrapy库对网页进行爬网。
但是我有一个问题。我不知道如何定位data
属性。
我有一个data
属性链接,href
如下所示:
<a data-item-name="detail-page-link" href="this-is-some-link">
我想要的是的价值href
。如果上a
过课,我可以这样做:
response.css('.some-class::attr(href)')
但是问题是我不知道如何定位data-item-name
属性。
有什么建议吗?
使用scrapycss
选择器,您可以执行以下操作:
response.css('a[data-item-name="detail-page-link"]::attr(href)').extract()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句