如何从主div标签下的第一个sub div标签中抓取文本

是的

我想从第一个div标签中抓取文本,该文本又在另一个div标签下

HTML代码如下所示:

<div class="main">
 <div>The text I want to extract</div>
 <div>The text I dont want to extract</div>
</div>

我使用的代码是:

result = requests.get(url1, headers=headers)


soup1 = BeautifulSoup(result.text,"lxml")
name=soup1.find_all('div',attrs={'class': 'main'})
for div in name:
    print(div.get_text(strip=True).encode("utf-8"))

谢谢!

SM阿布·塔赫尔Asif

在您的名称变量中,您将获得所有具有名为“ main”的类的div,然后在您的for循环中,您当前正在循环遍历收集的div,但是您需要访问这些div(class:main)内的div。循环像:

for div in name:
    innerDivs= div.find_all("div")
        for idiv in innerDivs:
            print(idiv.get_text(strip=True).encode("utf-8"))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用 selenium 和 python 抓取 div 标签内的标签标签中的文本值?

无法在标签标记中循环div并获取第一个孩子的文本内容

如何将未知宽度的 div 标签(包含文本)与另一个 div 标签下的右侧对齐

第一个 ul 标签下的所有 li 标签

Python网络抓取并获取其类的第一个div标签的内容

如何在 div 中取消报废第一个 x 个 p 标签并打印其余的标签?

如何在div标签下抓取多个图片标签

我如何检索 Selenium 中 div 标签下的文本

如何使用CSS在div中选择第一个标签?

如何获取列表中的第一个标签?

在jQuery中从DIV抓取文本

a:第一个孩子重写了父<div>中的所有<a>标签?

如何在 CS 中获取网格内第一个标签的文本?

如何使内容 li 标签在第一个文本中对齐

仅在段落中的文本之前出现,才如何删除第一个br标签?

从 <dl> 标签中抓取 HTML 文本

如何获得第一个span标签?

BeautifulSoup抓取每个<li>中的第一个标题标签

刮除引号中div标签下的文本

如何关闭新标签并返回到Robot Framework中的第一个标签?

当相同的标签在xml中相互重叠时如何删除第一个标签

CSS:选择带有标签itemprop的第一个div

将CSS应用于div的第一个标签

使用webdriver关闭除第一个标签/主标签之外的所有打开的标签

如何只获取 div 中的第一个文本块?

在类下的 br 标签下抓取文本

无法抓取上述 div 中的文本

在Highcharts中隐藏第一个yAxis标签

有没有办法将两个或多个连续 div 标签中的第一个转换为 span 标签