使用bs4搜索<span>时得到空结果

卢卡斯·舒尔茨(Lukas Scholz)

我想在我的Flask-App中使用bs4搜索特定范围。

我以前从未使用过bs4,所以我有点困惑为什么我的搜索没有任何结果。

from bs4 import BeautifulSoup

url = "https://www.mcfit.com/de/fitnessstudios/studiosuche/studiodetails/studio/berlin-lichtenberg/"
html_content = requests.get(url).text
soup = BeautifulSoup(html_content, "lxml")

spans = soup.find_all('span', {'class': 'sc-fzoXWK hnKkAN'})
print(spans)

“ sc-fzoXWK hnKkAN”类仅包含1个跨度。当我执行时,我只会得到一个[]结果。

伊斯玛

这些内容是使用javascript动态生成的,因此使用请求检索HTML只会检索静态内容,您可以将BeautifulSoup与Selenium之类的东西结合使用以实现所需的内容:

安装硒:

pip install selenium

然后使用Firefox引擎或任何其他支持javascript的内容检索内容:

from bs4 import BeautifulSoup
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('https://www.mcfit.com/de/fitnessstudios/studiosuche/studiodetails/studio/berlin-lichtenberg/')


html_content = driver.page_source
soup = BeautifulSoup(html_content, "lxml")

elems = soup.find_all('div', {'class': 'sc-fzoXWK hnKkAN'})
print(elems)

如果您使用的是Firefox,则您的脚本需要可以访问geckodriver,您可以从https://github.com/mozilla/geckodriver/releases下载该文件,并将其放入PATH(如果使用的是c:/ windows,操作系统),因此可以在任何地方使用。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

BS4 - 请求 Span 时返回“None”

如何使用bs4正确打印Google搜索结果?

Python 3 使用 bs4 提取 span 标签

如何使用bs4 / python从Wikipedia网站获取txt文件中单词的搜索结果?

使用bs4的Web抓取输出空结果

检索搜索结果selenium python bs4

bs4可用于在<span>标签内获取数据

使用BS4抓取数据给我意外的结果

使用bs4读取表格时如何删除斜线?

找不到带有BS4的Google搜索的结果-Python

如何使用BS4从多个<span>标签提取数据并将数据分组在一起?

如何使用python bs4解析HTML文档中唯一的第二个span标签

如何使用 python bs4 或任何其他库在 span 标签内抓取电话号码

Pyhthon bs4得到流浪文字

遍历CSV文件但得到重复的结果Python 3 / Selenium / BS4

Web抓取:使用bs4抓取数据时获取'\ n'标签

在bs4中使用.text时无法获取json

使用bs4从网站抓取图像时遇到问题

使用BS4进行爬取,但在解析时将HTML弄乱了

使用bs4用换行符替换<br>标签时出现问题

使用 bs4 python 抓取时不呈现完整的 HTML

尝试使用BS4从Trustpilot Web抓取日期时收到以下JSON错误-Python

使用bs4进行网络抓取时如何查找特定的类?

BS4:使用 Python 进行网页抓取时的属性错误

使用python bs4时如何从嵌套标签中获取信息?

Python-使用bs4搜索特定的“ var”

如何从beautifulsoap中的bs4结果集中获取价值?

BS4 replace_with结果不再在树中

打印“ find_all”的结果(使用bs4库)将返回一个空列表(但我要引用的类存在)