连接数据帧列表并包含原始数据帧名称作为键

python_noob_5

我有创建具有相同结构的数据框列表的代码。我的愿望是将所有这些数据帧附加在一起,但向新数据帧添加一列,以标识该行最初来自哪个数据帧。

我很容易地附加了数据框列表:

import pandas as pd
df_rosters = pd.concat(list_of_rosters)

但是,我无法弄清楚如何添加具有原始数据框名称或索引的列。我发现了一堆建议使用这个keys论点的例子但每个示例都有硬编码的密钥。我的列表的大小在不断变化,所以我需要弄清楚如何动态添加键。

提前致谢!

亨利·埃克

让我们assign为列表中的每个 DataFrame 设置一个指示器列。(名称可以与 DataFrame 列表一起压缩或由类似的东西创建enumerate):

enumerate

pd.concat(d.assign(df_name=f'{i:02d}') for i, d in enumerate(list_of_rosters))

   0  1 df_name
0  4  7      00
1  7  1      00
2  9  5      00
0  8  1      01
1  1  8      01
2  2  6      01

或与zip

pd.concat(d.assign(df_name=name)
          for name, d in zip(['name1', 'name2'], list_of_rosters))

   0  1 df_name
0  4  7   name1
1  7  1   name1
2  9  5   name1
0  8  1   name2
1  1  8   name2
2  2  6   name2

设置:

import numpy as np
import pandas as pd

np.random.seed(5)
list_of_rosters = [
    pd.DataFrame(np.random.randint(1, 10, (3, 2))),
    pd.DataFrame(np.random.randint(1, 10, (3, 2)))
]

list_of_rosters

[   0  1
0  4  7
1  7  1
2  9  5,    
    0  1
0  8  1
1  1  8
2  2  6]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章