我想从每个外部div的第一个内部div获取文本
<body>
<div class="outer">
<div class="inner">text1</div>
<div class="inner">text2</div>
<div class="inner">text3</div>
</div>
<div class="outer">
<div class="inner">text4</div>
</div>
<div class="outer">
<div class="inner">text5</div>
<div class="inner">text6</div>
</div>
</body>
这意味着检索text1,text4,text5
我已经尝试过如下所示的代码:
outers = soup.select('body > .outer')
for outer in outers:
inners = outer.select_one('.inner')
for inner in inners:
print(inner.text)
但无法正常工作
可能是这样,
soup = BeautifulSoup(text, 'html.parser')
for outer in soup.find_all('div', class_='outer'):
inners = outer.find('div', class_='inner')
for inner in inners:
print(inner)
# Output as:
# text1
# text4
# text5
或者您可以使用这种方式,
soup = BeautifulSoup(text, 'html.parser')
for outer in soup.find_all('div', class_='outer'):
inners = outer.find('div', class_='inner')
print(inners.get_text())
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句