使用BeautifulSoup抓取网站时阅读页码

Md. Mahim Muntasir 发表于 Dev

41

博士 Mahim Muntasir

我正在尝试仅从URL链接中读取页号并将其放入变量。下面是我从网站上抓取的变量的打印输出

<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>

我需要将per_page =值放入变量中。

我试着只刮号码但没有运气

索汉·达斯（Sohan Das）

from bs4 import BeautifulSoup
page = '''<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>'''
soup = BeautifulSoup(page, 'html.parser')
x = soup.select('a')
per_page = (x[0]['href']).split('per_page=')[-1]
print('per_page:', per_page)

输出：

per_page: 46

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-11

我来说两句

0 条评论

登录后参与评论

上一篇：如何按保持特定顺序的大熊猫分组？

相关文章

需要使用xpath和beautifulsoup从网站抓取数据

使用BeautifulSoup网站抓取IMDb页面

python-使用BeautifulSoup抓取ajax网站的Web

无法使用BeautifulSoup4抓取网站

使用BeautifulSoup抓取网站后，如何分割单词和数字？

使用BeautifulSoup进行网页抓取时出错

使用BeautifulSoup抓取网站后缺少文本

使用BeautifulSoup抓取网站时显示符号

使用BeautifulSoup抓取Google时出现SyntaxError

使用Selenium和BeautifulSoup输入内容来抓取网站？

当网站阻止不抓取内容时，如何使用Python抓取？

使用beautifulsoup抓取HTML网站ID的特定部分

使用python中的BeautifulSoup从网站抓取报告

使用BeautifulSoup 4.8.2从网站抓取表格

抓取网站时BeautifulSoup无法显示所有数据

当我尝试使用BeautifulSoup从网站抓取时缺少文本

如何使用Beautifulsoup从网站上抓取产品价格？

如何使用BeautifulSoup从eCom网站上抓取<li>？

使用BeautifulSoup抓取特定网站

使用python 2.7和beautifulsoup 4进行网站抓取

使用 BeautifulSoup 抓取网站：TypeError: 'NoneType' 对象不可调用

使用 BeautifulSoup 抓取网页时出错

使用 BeautifulSoup 从网站抓取数据的问题

在python 3.6中使用beautifulsoup4抓取网站以获取产品信息时

无法使用beautifulsoup抓取日本网站

使用 beautifulsoup 抓取图像时出错

使用 python 抓取网站 - BeautifulSoup

使用 BeautifulSoup 或 Selenium 抓取网站时找不到数据

不使用beautifulsoup抓取网站数据

TOP 榜单

文章

热门标签

归档