使用 BeautifulSoup 从 html 中抓取特定数据

我试图在以下链接中获得少数产品的最佳搜索结果位置

https://www.purplle.com/search?q=hair%20fall%20shamboo

我使用以下工具从页面 ++ 获取 html 详细信息

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.purplle.com/search?q=hair%20fall%20shamboo")
from bs4 import BeautifulSoup
soup = BeautifulSoup(driver.page_source, 'html.parser')
driver.quit()

++

现在我很困惑如何从此 html 获取产品名称和位置(以获得最佳搜索排名)。

我使用下面的方法来获取产品的详细信息,但输出也有很多不需要的东西。

详细信息 = 汤.find('div', attrs={'class': 'pr'})

知道如何解决这个问题吗?

SIM卡

我不知道你说的职位是什么意思。但是,以下脚本可以从该页面获取不同产品的标题及其位置(据称):

from selenium import webdriver
from bs4 import BeautifulSoup

driver = webdriver.Chrome()
driver.get("https://www.purplle.com/search?q=hair%20fall%20shamboo")

soup = BeautifulSoup(driver.page_source, 'html.parser')
for item in soup.find_all(class_="prd-lstng pr"):
    name = item.find_all(class_="pro-name el2")[0].text
    position = item.find_all(class_="mrl5 tx-std30")[0].text
    print(name,position)

driver.quit()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用 BeautifulSoup 抓取特定数据

使用 BeautifulSoup 抓取:从 HTML 页面抓取表格中的特定列

使用 BeautifulSoup 抓取 HTML

如何使用BeautifulSoup,Requests和Python从HTML的特定表中抓取数据?

python:无法使用BeautifulSoup从html获取特定数据

使用 Python 抓取 HTML 中的特定元素:BeautifulSoup4

如何使用 Python 和 BeautifulSoup 从 html 表中抓取数据?

如何使用BeautifulSoup在HTML中抓取链接

如何使用BeautifulSoup抓取HTML?

如何使用beautifulsoup从html标记的特定类中获取数据?

使用beautifulsoup抓取HTML网站ID的特定部分

使用BeautifulSoup和Selenium抓取特定的html标签

如何使用Python Selenium BeautifulSoup抓取表格html格式的数据?

使用 BeautifulSoup 抓取数据

使用 BeautifulSoup 从数据框中抓取数据

使用BeautifulSoup从html表中获取数据

我无法使用BeautifulSoup抓取HTML文本

使用Python和BeautifulSoup从HTML抓取数字

使用BeautifulSoup按Python中的元素抓取HTML

使用 BeautifulSoup 进行网页抓取,在 html 中找不到表格

使用BeautifulSoup从网页中抓取特定链接

使用beautifulSoup在元素中抓取数据

使用 BeautifulSoup 从 wiki 类别中抓取数据

使用beautifulsoup从脚本标签中抓取数据

从HTML,python,网络抓取中接收特定数据

如何使用BeautifulSoup从HTML提取特定模式

使用 BeautifulSoup 从 HTML 中提取特定的 url

从特定点使用 BeautifulSoup 浏览 html

使用 BeautifulSoup 从 html 获取特定文本