蟒蛇。熊猫 CSV。用其他列值计算平均值

杰瑞

我有下表:

Days, Age,  Sex

5,    39,   F

4,    54,   M

4,    26,   M

5,    42,   M

4,    29,   M

我想计算两组的平均天数:35岁以下的人群和36岁以上的人群。我在想类似的东西

df["Days"].mean().where(df["Age"]>35)......

我看到结果的最好方法是:

Age
Age <= 35   4
Age >= 35   4.6666

最好的命令是什么?谢谢。

耶斯列尔

使用:

df = (df['Days'].groupby(df["Age"]>35)
                .mean()
                .rename(index={True:'Age > 35', False:'Age <= 35'})
                .reset_index())

要么:

df["Age"] = np.where(df["Age"]>35,'Age > 35','Age <= 35')
df = df.groupby('Age', as_index=False)['Days'].mean()
print (df)
         Age      Days
0  Age <= 35  4.000000
1   Age > 35  4.666667

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章