我想从第一个div标签中抓取文本,该文本又在另一个div标签下
HTML代码如下所示:
<div class="main">
<div>The text I want to extract</div>
<div>The text I dont want to extract</div>
</div>
我使用的代码是:
result = requests.get(url1, headers=headers)
soup1 = BeautifulSoup(result.text,"lxml")
name=soup1.find_all('div',attrs={'class': 'main'})
for div in name:
print(div.get_text(strip=True).encode("utf-8"))
谢谢!
在您的名称变量中,您将获得所有具有名为“ main”的类的div,然后在您的for循环中,您当前正在循环遍历收集的div,但是您需要访问这些div(class:main)内的div。循环像:
for div in name:
innerDivs= div.find_all("div")
for idiv in innerDivs:
print(idiv.get_text(strip=True).encode("utf-8"))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句