在python中抓取html表格

用户5994246

我想用这个代码刮一个 html 表

import requests
from bs4 import BeautifulSoup

page1 = requests.get("http://kworb.net/spotify/country/br_weekly.html")                                                  
soup = BeautifulSoup(page1.content, 'html.parser')
for tr in soup.findAll('tr'):
    tds =tr.find_all('td')
    print(tds[0].text)

它似乎有效：我能够在不同的 tds 列表中获取表格及其每一行。除了当我尝试获取每一行的第一列 (tds[0].text) 时，出现错误。

你能提供一些线索吗？

简单的

第一行有标题<th>而不是<td>所以你变空tds- 你必须检查大小tds

if len(tds) > 0:
    print(tds[0].text)

或更短

if tds:
    print(tds[0].text)

或者您可以使用跳过第一行 [1:]

for tr in soup.find_all('tr')[1:]:
   tds = tr.find_all('td')
   print(tds[0].text)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-21

我来说两句

0 条评论

登录后参与评论

从 HTML 表格中抓取数据

从 html 表格中抓取数据

从Python中的HTML抓取嵌入式Google表格

从 Python Beautifulsoup 中抓取表格

使用 python selenium 抓取 HTML 表格

VBA：从 HTML 表格中抓取信息

抓取 HTML 表格中的特殊图形字符

使用 BeautifulSoup 抓取：从 HTML 页面抓取表格中的特定列

Python beautifulsoup，抓取网站中的表格

如何将 HTML 表格抓取到 Google 表格中

在 R 中从 HTML 中抓取类似表格的索引

使用python抓取表格

使用 Python 抓取表格

从 .asp 中抓取表格

使用 Python 抓取 HTML 表格并处理隐藏行

如何使用Python Selenium BeautifulSoup抓取表格html格式的数据？

将 html 表格抓取到 R 数据框中

使用硒在本地html中为嵌套表抓取表格

使用 BeautifulSoup 进行网页抓取，在 html 中找不到表格

网络抓取，html表格分页

从python中的html表中抓取数据

从python中的bball参考中抓取表格数据

网页抓取/将数据转换为 Python 中的表格数据

使用 python selenium 抓取表格中的动态元素

尝试从 Python BS 中的网站抓取表格时出现 AttributeError

使用 Pandas 抓取 HTML：它可以用来抓取网页中的表格吗？

网页抓取：抓取表格中的网址

抓取时摆脱python中的html标签

如何从python中的img html抓取src

TOP 榜单

文章

在python中抓取html表格

在python中抓取html表格

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）