访问需要基本HTTP身份验证的网页

将要

我正在尝试对一个要求弹出凭据的网站进行网络抓取。

当网站需要HTTP身份验证时,会出现这种弹出窗口。

import requests 
r = requests.get('https://thewebsiteiwant.com', auth=('Myuser', 'Mypass'))
print(r.status_code) #This is now 401, however it used to be 200

我尝试过的事情:

  1. 使用requests.Session(),然后首先发布到登录页面。从技术上讲,有一个登录页面,但是在尝试直接访问该页面时,根本不会显示该页面。
  2. 从Chrome浏览器查看已保存的Cookie,并尝试在Python中重新创建它们。
  3. 将网络请求复制为cURL,然后使用cURL到Python转换器。
  4. 使用cookielib存储cookie。
  5. 将用户代理添加到请求中。

硒不适用于该项目。该程序将在无头RPi上运行。

MooingRawr

如果auth正常工作(手动输入),也许您可​​以尝试用dormain代替auth,这样程序就知道您要尝试登录的确切位置。这可以通过使用此处request_ntlm找到的模块来实现

您可以通过以下方式使用它:

from requests_ntlm import HttpNtlmAuth

以及您放置auth在的位置request.get()

auth=HttpNtlmAuth('DOMAIN HERE\\user','pass')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在python上使用基本身份验证访问网页

需要工具“剥离” HTTP基本身份验证

HTTP基本:访问被拒绝致命:身份验证失败

远程:HTTP基本:访问被拒绝致命:身份验证失败

Go,基本访问身份验证

访问基本身份验证凭据

Go中的基本HTTP身份验证

HTTP基本身份验证与密钥

django处理基本的HTTP身份验证

HTTP 基本身份验证注销

连接需要哪些 HTTP 标头使用基本身份验证抛出代理?

在Django测试框架中使用基本HTTP访问身份验证

通过具有基本身份验证的HTTP代理访问HTTPS

Selenium Webdriver:确定为警报的窗口(HTTP基本访问身份验证),如何登录(Python)

如何从需要HTTP身份验证才能访问的WSDL中创建代理服务?

访问Amazon S3时需要HTTP 407代理身份验证

Cakephp 3基本身份验证需要澄清

替代基本身份验证注销时需要?

如何从需要基本身份验证的URL获取src

在SharePoint中显示需要基本身份验证的图像

如何在Django中启用基本访问身份验证

具有基本访问身份验证的Jsoup连接

从基本身份验证访问用户名

如果需要基本身份验证,Visual Studio可以访问TeamCity符号服务器吗?

HTTPS URL的基本代理身份验证返回HTTP / 1.0 407必需的代理身份验证

无需用户身份验证的开发环境的 Symfony http 基本身份验证

基本身份验证的HTTP身份验证标头字符限制?

Serviceworker与HTTP基本身份验证冲突?

Flask AttributeError中的基本HTTP身份验证:“ NoneType”错误