我有一个表格,需要将其拆分为按第 1 列中的值分组的多个文件 - 序列。
+--------+--------+-------+
| serial | name | price |
+--------+--------+-------+
| 100-a | rdl | 123 |
| 100-b | gm1 | -120 |
| 100-b | gm1 | 123 |
| 180r | xxom | 12 |
| 182d | data11 | 11.50 |
+--------+--------+-------+
输出将是这样的:
100-a.xls
100-b.xls
180r.xls etc.etc.
并打开 100-b.xls 包含以下内容:
+--------+------+-------+
| serial | name | price |
+--------+------+-------+
| 100-b | gm1 | -120 |
| 100-b | gm1 | 123 |
+--------+------+-------+
我尝试使用 Pandas 通过使用以下代码来定义数据框:
import pandas as pd
#from itertools import groupby
df = pd.read_excel('myExcelFile.xlsx')
我成功获取了数据框,但我不知道接下来要做什么。我尝试在 Stackoverflow 上关注这个类似的问题,但情况有点不同。下一步是什么?
这不是 groupby 而是过滤器。
您需要遵循 2 个步骤:
这样的事情应该可以解决问题-
for x in list(df.serial.unique()) :
df[df.serial == x].to_excel("{}.xlsx".format(x))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句