我坚持要在span标签内获取所有数据。我的代码只给我span标签中每个a()中的每个第一个值,而忽略其他值。在我的示例中:(注意,我在这里减少了span的内容,但是里面很多)
<span class="block-niveaux-sponsors"> <a href="http://www.keolis.com/" id="a47-logo-part-keolis" target="_blank"> <img src="images/visuels_footer/footer/part_keolis.201910210940.jpg"/> </a> <div class="clearfix"></div> </span> <span class="block-niveaux-sponsors"> <a href="http://www.cg47.fr/" id="a47-logo-part-cg47" target="_blank"> <img src="images/visuels_footer/footer/part_cg47.201910210940.jpg"/> </a> <div class="clearfix"></div> </span> <span class="block-niveaux-sponsors"> <a href="http://www.errea.it/fr/" id="a47-logo-part-errea" target="_blank"> <img src="images/visuels_footer/footer/part_errea.201910210940.jpg"/> </a> <div class="clearfix"></div> </span>
我的代码是:
page = urlopen(lien_suagen)
soup = bs(page, 'html.parser')
title_box_agen = soup.find_all('div', attrs={'id':'autres'})
for tag in title_box_agen:
for each_row in tag.find_all('span'):
links = each_row.find('a', href=True)
title = links.get('id')
print(title)
这只给我第一个ID值。我要所有身份证。
你应该试试:
page = urlopen(lien_suagen)
soup = bs(page, 'html.parser')
title_box_agen = soup.find_all('div', attrs={'id':'autres'})
for tag in title_box_agen:
for each_row in tag.find_all('span'):
links = each_row.find_all('a', href=True)
for link in links:
title = link.get('id')
print(title)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句