熊猫分组计数,然后按条件均值

MTT

我有一个这样的数据框:

    col1 col2
0    a   100
1    a   200
2    a   150
3    b   1000
4    c   400
5    c   200

我想要做的是按col1分组并计算出现的次数,如果count等于或大于2,则计算这些行的col2平均值,如果不返回null。输出应为:

    col1 mean
0    a   150
1    b   
2    c   300
安塞夫

使用groupby.mean+DataFrame.whereSeries.value_counts

df.groupby('col1').mean().where(df['col1'].value_counts().ge(2)).reset_index()

#you can select columns you want
#(df.groupby('col1')[['col2']]
#   .mean()
#   .where(df['col1'].value_counts().ge(2)).reset_index())

输出量

  col1   col2
0    a  150.0
1    b    NaN
2    c  300.0

如果您真的想要空白:

df.groupby('col1').mean().where(df['col1'].value_counts().ge(2), '').reset_index()

  col1 col2
0    a  150
1    b     
2    c  300

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫分组并计数,然后按分组大小对整个数据框进行升序排序?

Spark-按键分组,然后按值计数

按熊猫分组后按条件计数

嵌套字典:按日期分组,然后按枚举值分组并汇总计数

计数不同的ID,然后按不同的ID分组,从而产生不正确的计数

数据框:如何在Scala中分组/计数然后按计数排序

MySQL按列分组,然后按另一列计数

按对象值分组,计数然后按最大对象属性设置组密钥

如何选择多个计数(*)值然后按特定列分组

SQL查询计数出现的次数,然后按天分组,但也填写缺少的日子

按唯一值过滤,然后按其他条件计数

熊猫:列的值,然后按相同的 ID 分组和合并

跨列计算值,然后按年份对熊猫进行分组

对具有不同条件的同一列求和,然后按分组

均值和计数的条件分组

熊猫如何比较相似的行然后按条件删除

熊猫按条件分组

按条件分组的熊猫

大熊猫:按两列分组,然后按第三列的值对其进行排序

首先按类别分组,然后按周或月分组

首先按C列分组,然后按A列分组

MySQL:计数然后按计数总数排序

按日期时间排序,然后按日期分组

MySQL按标题排序,然后按分组ID

MongoDB按ID然后按日期分组

Laravel雄辩:按员工分组,然后按DAY

C#按列表分组,然后按SUM

C-按计数排序,然后按字母顺序

SQL:查询两个单独的表并返回计数值,然后按两个返回值分组