因此,我正在读取xlsx文件,我需要选择3个特定的列,然后重命名它们,并将每列的前100行转移到新的xlsx文件中,并将其从原始文件中删除。
到目前为止,我的代码是从手动编辑的xlsx文件中读取的,在其中我重命名了列,选择其中的前100个(标题除外),等等:
df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)
print(df.head(5))
如预期的那样返回:
date value source
0 2018-05-01 1 xxxxxxx
1 2018-05-01 1 xxxxxxxxxxxxxxxxx
2 2018-05-02 1 xxxxxxxxxxxxxxxxx
3 2018-05-02 1 xxxxxxxxxxxxxxxxx
4 2018-05-03 1 xxxxxxxxxxxxxxxxxx
有没有一种方法可以使用熊猫自动读取和编辑xlsx文件?其他库?我是python的新手,在这里我真的迷路了:(
似乎您需要2个文件输出。一个带有前一百行,另一个带有其余行。这很简单pandas.DataFrame.iloc
:
import pandas as pd
df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])
df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句