我有一个函数,它使用熊猫和请求将.CSV文件拉入熊猫数据帧并返回标头。效果很好,即
import pandas as pd
import requests
def getcsvheader(file):
print('Getting file...')
res = requests.get(file)
df = pd.read_csv(io.StringIO(res.text))
return(df.columns.tolist())
我想对excel文件做同样的事情,但是我不确定上面的第四行。如果我只是将read_csv更改为read_excel,则会收到类似以下的错误:
TypeError: unsupported operand type(s) for <<: 'str' and 'int'
显然,因为excel文件不会以文本形式读取,因此(io.StringIO(res.text))需要替换为某些东西,但是替换为什么?
还是有另一种方法可以做到这一点?(任何库组合都可以)。
熊猫可以使用URL并在本地表现出色。如果您只需要URL的标题行,这应该可以帮助您:
import pandas
URL="https://example.com/test.xlsx"
def get_excel_headers_from_url(URL)
return pandas.read_excel(URL).columns.tolist()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句