尝试使用 Python 3 抓取页面的错误请求

贾克斯

我正在尝试使用 python 3 抓取以下页面,但我不断收到HTTP Error 400: Bad Request. 我查看了之前建议使用的一些答案urllib.quote,因为它是 python 2,因此对我不起作用。此外,我按照另一篇文章的建议尝试了以下代码,但仍然无效。

url = requote_uri('http://www.txhighereddata.org/Interactive/CIP/CIPGroup.cfm?GroupCode=01')
with urllib.request.urlopen(url) as response:
  html = response.read()
周围

服务器拒绝来自非类人User-AgentHTTP 标头的查询

只需选择浏览器的 User-Agent 字符串并将其设置为查询的标头:

import urllib.request

url = 'http://www.txhighereddata.org/Interactive/CIP/CIPGroup.cfm?GroupCode=01'
headers={
    "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:61.0) Gecko/20100101 Firefox/61.0"
}

request = urllib.request.Request(url, headers=headers)
with urllib.request.urlopen(request) as response:
    html = response.read()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用python请求访问页面的问题

Python 3,使用请求(库)填写表单会返回相同页面的HTML,而无需输入参数

如何使用不变的网址抓取多个页面-Python 3

尝试使用brew安装Python3

尝试使用Python 3解析XML文件

使用请求 python 库抓取网页 - 关键错误

尝试在Windows上的Python 3中使用套接字时Winsock错误10014

尝试使用 reddit api 和 python 3 进行身份验证时出现 401 错误

我无法设置异常尝试,除了 OSError 错误:在使用 python3 的 Exscript 中超时

属性错误 - 使用 WebDriver 在 Python 中抓取页面...?

尝试使用pip安装“请求”包时发生Python错误

使用python和请求抓取</ html>标记下面的<script>标记

如何在抓取网页时增加python 3中的请求页面时间?

使用 Beautiful Soup 和 Python 抓取多个搜索页面的结果

如何使用python和beautifulsoup4循环抓取网站中多个页面的数据

尝试/使用Python请求模块的正确方法?

Python:尝试使用请求发布表单

使用Python请求模块时尝试/例外

SyntaxError 尝试使用 python 2.7 执行 python 3 代码

尝试在产品页面上抓取尺寸时出现 Python 超时错误

在 Python 3 中使用 Socket 获取 400 错误请求错误

动态加载页面的python web抓取

使用请求抓取动态页面

尝试在Python 3中使用Selenium获取文本

尝试使用 makedirs python 3 复制文件时出现 FileExistsError

尝试使用python 3加载JSON对象时出错

尝试在Python 3中使用C ++类时出错

尝试使用嵌套循环python 3制作形状

尝试在python3中使用全局字典