如何在 GITHUB 中获取 xlsx 文件的链接以作为 Pandas 数据框打开?

安东尼·乔伊

我刚刚上传了一个 xslx 文件到我在 github 中的数据集。但是我无法获得原始表格的链接以便填写pd.read_excel("address")

约翰尼

使用 BytesIO

import requests as rq
import pandas as pd
from io import BytesIO

url = "https://raw.githubusercontent.com/antony-joy/Data_sets/main/AirQualityUCI.xlsx"
data = rq.get(url).content
df = pd.read_excel(BytesIO(data))

Out[4]:
Out[37]:
           Date      Time  CO(GT)  PT08.S1(CO)  NMHC(GT)   C6H6(GT)  PT08.S2(NMHC)  NOx(GT)  PT08.S3(NOx)  NO2(GT)  PT08.S4(NO2)  PT08.S5(O3)       T         RH        AH
0    2004-03-10  18:00:00     2.6      1360.00       150  11.881723        1045.50    166.0       1056.25    113.0       1692.00      1267.50  13.600  48.875001  0.757754
1    2004-03-10  19:00:00     2.0      1292.25       112   9.397165         954.75    103.0       1173.75     92.0       1558.75       972.25  13.300  47.700000  0.725487
2    2004-03-10  20:00:00     2.2      1402.00        88   8.997817         939.25    131.0       1140.00    114.0       1554.50      1074.00  11.900  53.975000  0.750239
3    2004-03-10  21:00:00     2.2      1375.50        80   9.228796         948.25    172.0       1092.00    122.0       1583.75      1203.25  11.000  60.000000  0.786713
4    2004-03-10  22:00:00     1.6      1272.25        51   6.518224         835.50    131.0       1205.00    116.0       1490.00      1110.00  11.150  59.575001  0.788794
...         ...       ...     ...          ...       ...        ...            ...      ...           ...      ...           ...          ...     ...        ...       ...
9352 2005-04-04  10:00:00     3.1      1314.25      -200  13.529605        1101.25    471.7        538.50    189.8       1374.25      1728.50  21.850  29.250000  0.756824
9353 2005-04-04  11:00:00     2.4      1162.50      -200  11.355157        1027.00    353.3        603.75    179.2       1263.50      1269.00  24.325  23.725000  0.711864
9354 2005-04-04  12:00:00     2.4      1142.00      -200  12.374538        1062.50    293.0        603.25    174.7       1240.75      1092.00  26.900  18.350000  0.640649
9355 2005-04-04  13:00:00     2.1      1002.50      -200   9.547187         960.50    234.5        701.50    155.7       1041.00       769.75  28.325  13.550000  0.513866
9356 2005-04-04  14:00:00     2.2      1070.75      -200  11.932060        1047.25    265.2        654.00    167.7       1128.50       816.00  28.500  13.125000  0.502804

[9357 rows x 15 columns]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在R中下载.xlsx文件并将数据加载到数据框中?

如何在Roo中打开新的XLSX文件?

如何在 Polars 数据框中打开 excel 文件?

如何在Scala Spark中从Excel(xls,xlsx)文件构造数据框?

在 Pandas 数据框中打开文件内容时如何维护二进制数值

如何在 Pandas 数据框中读取嵌套的 json 文件?

如何在Pandas数据框的列中包含源文件

如何从网站下载xlsx文件以使用Pandas另存为数据框

如何在Perl中从XLSX读取数据

如何在.jar中包含.xlsx文件?

如何使用iPython中的pandas库读取.xlsx文件?

如何使用iPython中的pandas库读取.xlsx文件?

如何在Pandas中透视数据框?

如何在 github、php 中获取特定文件

如何在 Python 中从没有 Pandas 的文件中获取数据?

如何在CodeIgniter 3中使用PHPSpreadsheet从Excel(.xlsx和.xls)文件读取数据?

如何在Azure数据工厂中读取扩展名为.xlsx和.xls的文件?

如何将xlsx文件作为数据包含在R包中

如何从Python中的xlsx文件获取信息?

从pandas数据框中获取特定行作为系列

如何在github中重新打开问题?

scrapy-xlsx,如何在 xlsx 中制作可点击的链接?

如何在 Pandas 数据框中获取按 groupby 组合的行的值列表?

如何在pandas数据框中获取具有部分总和的列(按两列分组)

如何在 Pandas 中获取带有表 ID 的数据框?

如何在 python pandas 数据框中获取不同的值计数

如何在 Pandas 数据框中依次获取最高、次高等数字的索引和列?

如何在 Pandas 数据框中获取最后一行日期时间?

Python:如何语法从xlsx文件中抓取数据?