熊猫过滤器，先分组再变换

Sumit sidana

我有一个pandas数据框，如下所示：

  df =
      a          b
      a1.        1
      a2         0
      a1         0
      a3         1
      a2         1
      a1         1

我想先过滤b 1，然后a对每个组的出现次数进行分组和计数（称为此列count），然后将此列附加原始df。b保证1每个的值至少有一次a。

预期产量：

  df =
      a          b.    count
      a1.        1      2
      a2         0.     1
      a1         0.     2
      a3         1      1
      a2         1.     1
      a1         1      2

我试过了：

 df['count] = df.groupby('a').b.transform('size')

但是，这也算为零。我想先过滤b == 1。

我也尝试过：

df['count'] = df[df['b' == 1].groupby('a').b.transform('size')

但是，这nans在计数列中引入了吗？

我怎样才能做到这一点？

贝尼

请与获得条件适用于b再sum

df['b'].eq(1).groupby(df['a']).transform('sum')
Out[103]: 
0    2.0
1    1.0
2    2.0
3    1.0
4    1.0
5    2.0
Name: b, dtype: float64

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

上一篇：在AWS S3中使用AWS开发工具包（NodeJS）创建一个空文件夹

熊猫分组过滤器

熊猫过滤器，先分组再变换

熊猫过滤器，先分组再变换

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面