将Pandas MultiIndex DataFrame转换为嵌套字典

时钟从机

我有一个熊猫多索引数据框，我试图将其输出为嵌套字典。

# create the dataset
data = {'clump_thickness': {(0, 0): 274.0, (0, 1): 19.0, (1, 0): 67.0, (1, 1): 12.0, (2, 0): 83.0, (2, 1): 45.0, (3, 0): 16.0, (3, 1): 40.0, (4, 0): 4.0, (4, 1): 54.0, (5, 0): 0.0, (5, 1): 69.0, (6, 0): 0.0, (6, 1): 0.0, (7, 0): 0.0, (7, 1): 0.0, (8, 0): 0.0, (8, 1): 0.0, (9, 0): 0.0, (9, 1): 0.0}}
df = pd.DataFrame(data)
df.head()
#      clump_thickness
# 0 0            274.0
#   1             19.0
# 1 0             67.0
#   1             12.0
# 2 0             83.0

df是要作为嵌套字典输出的数据框。我正在寻找的输出形式为-

{"0":
{
  "0":274,
  "1":19
},
"1":{
  "0":67,
  "1":12
},
"2":{
  "0":83,
  "1":45
},
"3":{
  "0":16,
  "1":40
},
"4":{
  "0":4,
  "1":54
},
"5":{
  "0":0,
  "1":69
}
}

在这里，第一个索引形成最外面的字典的键。对于每个键，我们都存储了一个词典，该词典的键是第二个索引中的值。

当我这样做时df.to_dict()，而不是嵌套，multiindex作为元组返回。我该如何实现？

耶斯列尔

对我来说：

d = {l: df.xs(l)['clump_thickness'].to_dict() for l in df.index.levels[0]}

另一个类似于DataFrame的解决方案，其中MultiIndex可以用于dict，但对于Series以下项则是必需的过滤器列：

d = df.groupby(level=0).apply(lambda df: df.xs(df.name).clump_thickness.to_dict()).to_dict()

print (d)

{0: {0: 274.0, 1: 19.0},
 1: {0: 67.0, 1: 12.0},
 2: {0: 83.0, 1: 45.0},
 3: {0: 16.0, 1: 40.0},
 4: {0: 4.0, 1: 54.0},
 5: {0: 0.0, 1: 69.0},
 6: {0: 0.0, 1: 0.0},
 7: {0: 0.0, 1: 0.0},
 8: {0: 0.0, 1: 0.0},
 9: {0: 0.0, 1: 0.0}}

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。