如何获取具有包含特定文本的类或ID的抓取DIV

用户名

我从网站上刮了一些HTML

<div>
 <div id="content1">
 </div>
 <div id="content3">
 </div>
 <div id="content22">
 </div>
</div>

我如何迭代所有以ID开头的ID的DIV content

马丁·彼得斯(Martijn Pieters)

最简单的方法是使用CSS选择器

soup.select('div[id^=content]')

^=语法指定该id属性值应该开始content

使用作为参数传递给的正则表达式过滤器,您可以获得相同的结果idelement.find_all()

import re

soup.find_all('div', id=re.compile('^content'))

演示:

>>> from bs4 import BeautifulSoup
>>> sample = '''\
... <div>
...  <div id="content1">
...  </div>
...  <div id="content3">
...  </div>
...  <div id="content22">
...  </div>
... </div>
... '''
>>> soup = BeautifulSoup(sample)
>>> soup.select('div[id^=content]')
[<div id="content1">
</div>, <div id="content3">
</div>, <div id="content22">
</div>]
>>> soup.find_all('div', id=re.compile('^content'))
[<div id="content1">
</div>, <div id="content3">
</div>, <div id="content22">
</div>]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何查找具有非唯一ID /类的div,该div包含具有特定文本的div,然后获取该div下的所有<td>和<tr>标记

如何查找具有非唯一ID /类的div,该div包含具有特定文本的div,然后获取该div下的所有<td>和<tr>标记

获取具有特定类的所有div的div ID

仅当上面 div 中的类中有特定文本时,我如何抓取 div 的内容

如何获取具有特定类的 div 数组?

如何从具有空类值的 div 中抓取文本

为具有包含特定文本的子元素的特定类选择一个 div

如何获取具有特定类的元素的 id 列表

检查具有特定类的div是否包含文本或为空

如何获取属于div类的特定文本

如何从具有不同ID名称的段落中抓取文本?

在具有特定类的 div 中使用 preg_match_all 锚文本获取

如何选择具有特定文本的div

如何显示具有特定类的 div

如何获取具有特定类的输入文本的所有值?

获取不包含具有特定类的元素的元素的索引?

如何从具有不同ID的重复父类中获取所有文本内容?

如何使用javascript / jquery获取具有特定文本的元素的类名称?

具有特定类的元素的 CSS/Xpath 选择器包含具有特定文本的元素

如何使用JQuery为具有特定类的所有div分配唯一ID

获取具有特定类的所有子元素的ID

jQuery,获取具有类名称和更改文本的div?

从具有特定ID的div开始获取嵌套的div内容

如何使用beautifulsoup获取没有任何类或id的特定ul元素li的文本和href

如何读取HTML json文件并获取具有特定ID或类的元素?

如何删除具有包含特定文本的TD的TR

仅获取具有两个特定类的 div

Python BeautifulSoup 无法从具有特定类的 div 获取数据

如何排除包含具有特定类的TD的TR