无法使用 BeautifulSoup 提取 span 元素

dmd7 发表于 Dev

21

dmd7

见下文。我正在使用 BeautifulSoup 尝试提取此值。我试过的：

pg = requests.get(websitelink)
soup = BeautifulSoup(pg.content, 'html.parser'
value = soup.find('span',{'class':'wall-header__item_count'}).text

我试过 find 和 find all，它返回一个 Nonetype。无论出于何种原因，使用这些方法都无法找到墙头项目计数，即使它出现在 HTML 中。我怎样才能得到这个值？谢谢！

安德烈·凯斯利

我假设您想获得总项目数。该数字存储在 .html 文件内的 HTML 页面中<script>。beautifulsoup没有看到它，但您可以使用re/ jsonmodules 来提取它：

import re
import json
import requests

url = "https://www.nike.com/w"
html_doc = requests.get(url).text

data = re.search(r"window\.INITIAL_REDUX_STATE=(\{.*\})", html_doc).group(1)
data = json.loads(data)

# uncomment this to print all data;
# print(json.dumps(data, indent=4))

print("Total items:", data["Wall"]["pageData"]["totalResources"])

打印（如果在我的国家）：

Total items: 5600

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-16

我来说两句

0 条评论

登录后参与评论

上一篇：解析来自 Firebase 的数据

相关文章

使用BeautifulSoup从Span类提取锚文本

使用BeautifulSoup提取标题

使用beautifulsoup提取网址

使用beautifulsoup提取没有类或id的元素

如何使用BeautifulSoup提取特定的dl，dt列表元素

BeautifulSoup返回空的span元素吗？

如何使用BeautifulSoup从嵌套在<ul>中的<li>中的<span>中提取文本？

无法通过BeautifulSoup从$ 0的DOM元素中提取内容

无法使用BeautifulSoup获取span属性的文本

如何使用BeautifulSoup提取表中的所有元素？

提取<span>元素文本

如何使用BeautifulSoup从'a'元素中提取文本？

使用BeautifulSoup提取元素中的文本

如何使用BeautifulSoup提取JSON脚本元素

使用BeautifulSoup提取数据

使用BeautifulSoup提取<span> WITH标签

使用BeautifulSoup提取特定的dl和dd列表元素

无法使用Beautifulsoup提取项目

使用beautifulsoup4提取标题标签元素

使用 BeautifulSoup 提取 span 元素中的文本

使用 BeautifulSoup 提取文本

使用 BeautifulSoup 提取表格

无法从 span 元素中的标签中提取 href

使用beautifulsoup提取元素时面临的问题

使用 findAll 从使用 Beautifulsoup 的 Span Tag 提取文本返回一个空列表

BeautifulSoup Web Scraping - 无法访问和提取元素

我需要使用 Beautifulsoup 从 H1 SPAN no class 中提取文本并删除括号

使用beautifulsoup从跨度中提取元素

使用 Beautifulsoup 從子元素中提取數據

TOP 榜单

文章

热门标签

归档