如何使用python“网络抓取”包含弹出窗口的网站？

Kaleb 发表于 Dev

卡莱布

我正在尝试使用python Web抓取etherscan站点的特定部分，因为没有此功能的api。基本上转到此链接，然后需要按验证，然后弹出一个弹出窗口，您可以在此处看到。我需要抓取的是这部分0x0882477e7895bdc5cea7cb1552ed914ab157fe56，以防消息以图片中的消息开头。

我已经编写了下面的python脚本来启动此操作，但是我不知道如何与该站点进行进一步的交互，以使该弹出窗口成为前台并抓取信息。这可能吗？

from bs4 import BeautifulSoup
from requests import get

headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:60.0) Gecko/20100101 Firefox/60.0','X-Requested-With': 'XMLHttpRequest',}
url = "https://etherscan.io/proxyContractChecker?a=0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48"
response = get(url,headers=headers )
soup = BeautifulSoup(response.content,'html.parser')

谢谢

αԋɱҽԃαμєяιcαη

import requests
from bs4 import BeautifulSoup


def Main(url):
    with requests.Session() as req:
        r = req.get(url, headers={'User-Agent': 'Ahmed American :)'})
        soup = BeautifulSoup(r.content, 'html.parser')
        vs = soup.find("input", id="__VIEWSTATE").get("value")
        vsg = soup.find("input", id="__VIEWSTATEGENERATOR").get("value")
        ev = soup.find("input", id="__EVENTVALIDATION").get("value")
        data = {
            '__VIEWSTATE': vs,
            '__VIEWSTATEGENERATOR': vsg,
            '__EVENTVALIDATION': ev,
            'ctl00$ContentPlaceHolder1$txtContractAddress': '0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48',
            'ctl00$ContentPlaceHolder1$btnSubmit': "Verify"
        }
        r = req.post(
            "https://etherscan.io/proxyContractChecker?a=0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48", data=data, headers={'User-Agent': 'Ahmed American :)'})
        soup = BeautifulSoup(r.content, 'html.parser')
        token = soup.find(
            "div", class_="alert alert-success").text.split(" ")[-1]
        print(token)


Main("https://etherscan.io/proxyContractChecker")

输出：

0x0882477e7895bdc5cea7cb1552ed914ab157fe56

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-23

我来说两句

0 条评论

登录后参与评论

上一篇：使用Codeigniter zip库压缩时出现阿拉伯文件名问题

如何使用用户登录弹出窗口抓取网站

使用 Selenium 抓取各种网站时如何处理 cookie 弹出窗口？

在Selenium中，如何使用python在弹出窗口中登录网站？

使用Python抓取包含PowerBI图的网站

如何从该弹出窗口中抓取文字？[Python和Scrapy]

使用python硒从弹出窗口进行Web抓取

如何在生成表格的网站上使用Python进行网络抓取？

如何使用Selenium和Python绕过Tor网络设置确认弹出窗口

如何通过网络使用Python抓取图表？

如何使用python跟踪网络抓取进度

当网站阻止不抓取内容时，如何使用Python抓取？

如何使用python根据网站的标题抓取网站？

python selenium 网页抓取。如何在网络中断或抓取的网站缓慢时继续重试？

通过登录网站进行python网络抓取

如何首先启动我的网站弹出窗口

使用 Selenium 关闭网站上的弹出窗口

如何停用“网络断开”弹出窗口？

无法使用python抓取网站

使用 python 抓取网站 - BeautifulSoup

使用python抓取网站时如何获得标签的价值？

如何抓取需要先使用Python登录的网站

使用Python抓取网站（Futbin）时如何更改平台？

如何使用python从网站定期抓取RSS feed

如何使用Python 3登录网站并进行抓取

如何使用Python，Requests和Xpath抓取网站？

如何使用Selenium Python抓取网站中的:: before元素

如何抓取使用BankID进行Python登录的网站（BeautifulSoap，请求）？

如何使用 Jupyter Notebook 在 Python 中更慢地抓取网站？

如何使用Python抓取多语言网站

TOP 榜单

文章

如何使用python“网络抓取”包含弹出窗口的网站？

如何使用python“网络抓取”包含弹出窗口的网站？

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID