如何提取特定类名的文本,然后提取特定文本?

硕士生

我正在尝试使用Python中的BeautifulSoup收集Web数据。我专门尝试提取不同类型的汽车功能。例如,在下面粘贴的html代码中,我尝试将“远程启动”,“导航系统”和“加热方向盘”提取为“便捷”功能。有人可以让我知道如何为每个此类类别提取和存储功能吗?

在此处输入图片说明

内里克斯

这是一种实现方法:

import bs4
your_source_code = "<html>..."
soup = bs4.BeautifulSoup(your_source_code, "html.parser")

result = {}

for group in soup.find_all("div", {"class": "details-feature-list--normalized-features"}):
    result[group.find("h2", {"class": "cui-heading-2"}).text] = [itm.text for itm in group.find_all("li", {"class": "details-feature-list__item"})]

结果是一个像这样的字典:
{"Convenience": ["Remote Start", "Navigation System", "Heated Steering Wheel"]}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章