如何在熊猫数据框中结合均值和计数值频率?

我正在研究Tianic 数据集我正在根据他们的头衔检查幸存者的频率以及每个头衔出现的频率。

train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean().sort_values(by='Survived',ascending=False)

在此处输入图片说明

train.Title.value_counts(normalize=True)

在此处输入图片说明

有没有可能将两个组合在一起,结果我看到一张桌子?我想有以下作为我的决赛桌:

在此处输入图片说明

我不确定如何以我想要的方式一起使用聚合函数 count 和 mean 。如果您需要更多信息,请告诉我。

贝尼

您可以执行reindex并将其分配回来

#df1=train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean().sort_values(by='Survived',ascending=False)
#s=train.Title.value_counts(normalize=True)

df1['Title Freq']=s.reindex(df1.Title).tolist()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在熊猫数据框中的时间戳之间计数值

如何在熊猫数据框中只取整数值

优化大熊猫数据框中的计数值

如何在熊猫数据框中修改混合数据类型列中的数值?

结合熊猫数据框的假人和计数

如何在pandas数据框列中获得以逗号分隔的值的频率计数?

如何在熊猫数据框中找到列的ngram频率?

如何在值的频率上分割熊猫数据框

如何在熊猫数据框中聚合然后扩展频率值

如何计算熊猫数据框中列值更改的频率

如何根据熊猫数据框中的频率创建wordcloud

如何计算熊猫数据框中列值更改的频率?

如何在熊猫数据框中删除日期和时间?

如何在熊猫中复制和移动数据框

如何在熊猫数据框中复制和修改行?

如何在熊猫数据框中的滚动窗口内找到均值差异?

如何在熊猫数据框中捕获连字符分隔数字的均值?

如何替换熊猫数据框中的非整数值?

如何根据特定列中的数值爆炸熊猫数据框

PySpark合并数据框和计数值

如何在熊猫数据框中的每列中包含NaN计数的列上应用函数?

如何获取熊猫数据框中列表的平均值

每列的熊猫数据框计数值和新索引的总和

将熊猫数据框列中的单词按另一列分组以获得频率/计数

如何在熊猫数据框中进行多级计数?

在完整的熊猫数据框中计数数字出现的频率

在熊猫数据框中旋转和计数条件

使用熊猫按日期计数值的频率

PySpark:检索数据框中的组的均值和均值附近的值计数