无法使用 BeautifulSoup 提取 span 元素

dmd7

见下文。我正在使用 BeautifulSoup 尝试提取此值。我试过的:

pg = requests.get(websitelink)
soup = BeautifulSoup(pg.content, 'html.parser'
value = soup.find('span',{'class':'wall-header__item_count'}).text

我试过 find 和 find all,它返回一个 Nonetype。无论出于何种原因,使用这些方法都无法找到墙头项目计数,即使它出现在 HTML 中。我怎样才能得到这个值?谢谢!

在此处输入图片说明

安德烈·凯斯利

我假设您想获得总项目数。该数字存储在 .html 文件内的 HTML 页面中<script>beautifulsoup没有看到它,但您可以使用re/ jsonmodules 来提取它:

import re
import json
import requests

url = "https://www.nike.com/w"
html_doc = requests.get(url).text

data = re.search(r"window\.INITIAL_REDUX_STATE=(\{.*\})", html_doc).group(1)
data = json.loads(data)

# uncomment this to print all data;
# print(json.dumps(data, indent=4))

print("Total items:", data["Wall"]["pageData"]["totalResources"])

打印(如果在我的国家):

Total items: 5600

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章