我正在研究Tianic 数据集。我正在根据他们的头衔检查幸存者的频率以及每个头衔出现的频率。
train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean().sort_values(by='Survived',ascending=False)
和
train.Title.value_counts(normalize=True)
有没有可能将两个组合在一起,结果我看到一张桌子?我想有以下作为我的决赛桌:
我不确定如何以我想要的方式一起使用聚合函数 count 和 mean 。如果您需要更多信息,请告诉我。
您可以执行reindex
并将其分配回来
#df1=train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean().sort_values(by='Survived',ascending=False)
#s=train.Title.value_counts(normalize=True)
df1['Title Freq']=s.reindex(df1.Title).tolist()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句