使用熊猫读取和编辑Excel文件

加布里埃尔·费尔南德斯（Gabriel Fernandes）

因此，我正在读取xlsx文件，我需要选择3个特定的列，然后重命名它们，并将每列的前100行转移到新的xlsx文件中，并将其从原始文件中删除。

到目前为止，我的代码是从手动编辑的xlsx文件中读取的，在其中我重命名了列，选择其中的前100个（标题除外），等等：

df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)

print(df.head(5))

如预期的那样返回：

         date    value               source

0  2018-05-01      1                xxxxxxx
1  2018-05-01      1      xxxxxxxxxxxxxxxxx
2  2018-05-02      1      xxxxxxxxxxxxxxxxx
3  2018-05-02      1      xxxxxxxxxxxxxxxxx
4  2018-05-03      1     xxxxxxxxxxxxxxxxxx

有没有一种方法可以使用熊猫自动读取和编辑xlsx文件？其他库？我是python的新手，在这里我真的迷路了：(

似乎您需要2个文件输出。一个带有前一百行，另一个带有其余行。这很简单pandas.DataFrame.iloc：

import pandas as pd

df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])

df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。