使用BeautifulSoup抓取网页

Lina Palencia 发表于 Dev

75

丽娜·帕伦西亚（Lina Palencia）

我正在尝试抓取此网站：https : //www.senate.gov/general/contact_information/senators_cfm.cfm

我的代码：

import requests
from bs4 import BeautifulSoup

URL = 'https://www.senate.gov/general/contact_information/senators_cfm.cfm'
page = requests.get(URL)

soup = BeautifulSoup(page.content, 'html.parser')

print(soup)

问题在于它实际上并没有前往该站点。我从汤汁中得到的HTML根本与正确网页中的HTML完全不同。

我不确定从这里去哪里！任何和所有帮助将不胜感激。

阿肖克·库玛（Ashok Kumar）

这对我有用

headers = {
        'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36',
    }
r = requests.get(URL,headers=headers)

在这里找到信息-https: //towardsdatascience.com/5-strategies-to-write-unblock-able-web-scrapers-in-python-5e40c147bdaf

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-24

我来说两句

0 条评论

登录后参与评论

上一篇：如何使用另一个集合中的信息过滤MongoDB集合？

相关文章

使用 BeautifulSoup 抓取网页

使用BeautifulSoup Python抓取网页

使用 Beautifulsoup 抓取 UEFA 网页

使用 BeautifulSoup 进行网页抓取 / Zomato 网页抓取

使用 BeautifulSoup FindAll 进行网页抓取

使用 Python BeautifulSoup 进行网页抓取

使用 BeautifulSoup 通过分页抓取网页

使用BeautifulSoup进行网页抓取时出错

使用 BeautifulSoup 抓取网页时出错

如何使用 BeautifulSoup 进行网页抓取

使用 Beautifulsoup 的 Python 网页抓取：lowes 商店

使用BeautifulSoup从网页中抓取特定链接

使用 BeautifulSoup 和 json 进行网页抓取

如何使用BeautifulSoup抓取缺少标签的网页

使用 BeautifulSoup 进行网页抓取 -- Python

使用 BeautifulSoup 抓取网页 Javascript 表

使用 BeautifulSoup 获取空列表的网页抓取

使用 beautifulsoup 进行网页抓取的问题

使用 BeautifulSoup 遍历 URL 以进行网页抓取

BeautifulSoup 网页抓取错误

Beautifulsoup 的网页抓取

BeautifulSoup 网页抓取

网页抓取 Python BeautifulSoup

网页抓取 - 从使用 BeautifulSoup 和 Python 的类中获取文本？

使用 BeautifulSoup 从网页中抓取代理 IP

使用BeautifulSoup进行网页抓取将不起作用

无法使用python和beautifulsoup抓取网页中的某些href

使用 Beautifulsoup 4 进行网页抓取 - 提取联系信息

使用 BeautifulSoup 提取抓取网页的 Script 标签所需的信息

TOP 榜单

文章

热门标签

归档