BeautifulSoup 如何从网站(电晕)中提取数据?

摩他

我想以国家名称的形式保存每个国家的文章数量,文件中的文章数量,用于我从以下站点的研究工作。为此,我编写了这段代码,不幸的是它不起作用。

http://corona.sid.ir/

!pip install bs4
from bs4 import BeautifulSoup # this module helps in web scrapping.
import requests  # this module helps us to download a web page
url='http://corona.sid.ir/'
data  = requests.get(url).text 
soup = BeautifulSoup(data,"lxml")  # create a soup object using the variable 'data'
soup.find_all(attrs={"class":"value"})

结果= []

赤城88

您使用了错误的网址。尝试这个:

from bs4 import BeautifulSoup # this module helps in web scrapping.
import requests  # this module helps us to download a web page
import pandas as pd

url = 'http://corona.sid.ir/world.svg'
data  = requests.get(url).text 
soup = BeautifulSoup(data,"lxml")  # create a soup object using the variable 'data'
soup.find_all(attrs={"class":"value"})

rows = []
for each in soup.find_all(attrs={"class":"value"}):
    row = {}
    row['country'] = each.text.split(':')[0]
    row['count'] = each.text.split(':')[1].strip()
    rows.append(row)
    
df = pd.DataFrame(rows)

输出:

print(df)
                  country count
0                 Andorra    17
1    United Arab Emirates   987
2             Afghanistan    67
3                 Albania   143
4                 Armenia    49
..                    ...   ...
179                 Yemen    54
180               Mayotte     0
181          South Africa  1938
182                Zambia   127
183              Zimbabwe   120

[184 rows x 2 columns]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从带有请求和 BeautifulSoup4 的动态内容的网站中提取表格数据?

如何使用python beautifulsoup从网站中提取隐藏评论?

BeautifulSoup 如何用于从网站中提取“href”链接?

使用BeautifulSoup提取网站数据

使用Beautifulsoup从网站提取数据

如何在Python和beautifulsoup中从CDATA中提取数据?

如何使用beautifulsoup从多张表中提取数据?

使用BeautifulSoup将数据从网站表中提取的数据转换为数值

从beautifulsoup中提取特定数据输出

Python BeautifulSoup从标题中提取数据

BeautifulSoup 使用 unicode 从 <script> 中提取数据

使用 BeautifulSoup 从评论中提取表格数据

在beautifulsoup中提取链接

如何使用python中的BeautifulSoup包从网站中提取href内容

如何从 BeautifulSoup 对象中提取 JSON?

如何在Beautifulsoup中提取标签的子代?

如何使用beautifulsoup从html中提取文本?

如何从beautifulSoup中提取多个html标签?

如何使用BeautifulSoup从'a'元素中提取文本?

如何从BeautifulSoup中提取表值

如何从这个 BeautifulSoup 中提取数字?

Beautifulsoup 如何从特定类中提取文本

如何使用 BeautifulSoup 从 HTML 中提取链接?

使用BeautifulSoup(Python)从网站中提取特定信息

BeautifulSoup如何从HTML表格的特定列中提取数据。我的代码正在提取所有列

使用BeautifulSoup提取数据

无法从 BeautifulSoup 中提取文本

从清单BeautifulSoup中提取文本

从 yelp 中提取评论 - beautifulsoup