使用请求和熊猫获取远程Excel文件的标头

戴夫·科切

我有一个函数,它使用熊猫和请求将.CSV文件拉入熊猫数据帧并返回标头。效果很好,即

import pandas as pd
import requests

def getcsvheader(file):
    print('Getting file...')
    res = requests.get(file)
    df = pd.read_csv(io.StringIO(res.text))
    return(df.columns.tolist())

我想对excel文件做同样的事情,但是我不确定上面的第四行。如果我只是将read_csv更改为read_excel,则会收到类似以下的错误:

TypeError: unsupported operand type(s) for <<: 'str' and 'int'

显然,因为excel文件不会以文本形式读取,因此(io.StringIO(res.text))需要替换为某些东西,但是替换为什么?

还是有另一种方法可以做到这一点?(任何库组合都可以)。

Ben

熊猫可以使用URL并在本地表现出色。如果您只需要URL的标题行,这应该可以帮助您:

import pandas

URL="https://example.com/test.xlsx"

def get_excel_headers_from_url(URL)
    return pandas.read_excel(URL).columns.tolist()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章