如何基于过滤计算数据框列中的值

104

girl_of_data

鉴于此数据框：

DriverId    time                         SPEED
0           2021-04-16 21:40:00+00:00   58.500000
            2021-04-16 21:41:00+00:00   32.850000
            2021-04-16 21:42:00+00:00   89.633333
            2021-04-16 21:43:00+00:00   88.166667
            2021-04-16 21:44:00+00:00   118.016667
... ... ...
88          2021-04-27 07:30:00+00:00   79.566667
            2021-04-27 07:31:00+00:00   59.383333
            2021-04-27 07:32:00+00:00   89.133333
            2021-04-27 07:33:00+00:00   59.966667
            2021-04-27 07:34:00+00:00   25.72413

我想添加列来计算每个司机低于 40 公里/小时的速度数，所以我试过这个：

y[y.SPEED<40].count()

它显示了这一点：

    SPEED    4721
    dtype: int64

这不是我想要的，expexted 结果必须是这样的：

  DriverId        SPEED         count 
      0            15.20            2
                   32.850000 
                   89.633333
                  88.166667
                  118.016667
... ... ...
88              79.566667          1
                59.383333
                89.133333
                59.966667
                25.72413

我的数据框是一个系列，我将其转换为数据框

 y.info()
    <class 'pandas.core.frame.DataFrame'>
MultiIndex: 15082 entries, (0, Timestamp('2021-04-16 21:40:00+0000', tz='UTC')) to (88, Timestamp('2021-04-27 07:34:00+0000', tz='UTC'))
Data columns (total 1 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   SPEED   15082 non-null  float64
dtypes: float64(1)
memory usage: 922.5 KB

林山可拉依

df = pd.DataFrame([['0','2021-04-16 21:40:00+00:00',58.500000],
    ['0','2021-04-16 21:41:00+00:00', 32.850000],#FIRST ONE
    ['0','2021-04-16 21:42:00+00:00', 15.633333],#SECOND ONE
    ['0','2021-04-16 21:43:00+00:00', 88.166667],
    ['0','2021-04-16 21:44:00+00:00',118.016667],
    ['88','[2021-04-27 07:30:00+00:00',79.566667],
    ['88','2021-04-27 07:31:00+00:00',59.383333],
    ['88','2021-04-27 07:32:00+00:00',89.133333],
    ['88','2021-04-27 07:33:00+00:00',59.966667],
    ['88','2021-04-27 07:34:00+00:00',25.72413] # THIRD ONE
  ],columns=['driver_id','time','speed'])
df = df.set_index("driver_id")
counts = df[df['speed'] < 40].groupby(["driver_id",],as_index=False).agg(
    count_col=pd.NamedAgg(column="speed", aggfunc="count")
)
merged_Frame = pd.merge(df, counts, on = 'driver_id', how='inner')

输出

driver_id   time                   speed        count_col
0   0   2021-04-16 21:40:00+00:00   58.500000   2
1   0   2021-04-16 21:41:00+00:00   32.850000   2
2   0   2021-04-16 21:42:00+00:00   15.633333   2
3   0   2021-04-16 21:43:00+00:00   88.166667   2
4   0   2021-04-16 21:44:00+00:00   118.016667  2
5   88  [2021-04-27 07:30:00+00:00  79.566667   1
6   88  2021-04-27 07:31:00+00:00   59.383333   1
7   88  2021-04-27 07:32:00+00:00   89.133333   1
8   88  2021-04-27 07:33:00+00:00   59.966667   1
9   88  2021-04-27 07:34:00+00:00   25.724130   1

参考

编辑

import pandas as pd

df = pd.DataFrame([['0','2021-04-16 21:40:00+00:00',58.500000],
    ['0','2021-04-16 21:41:00+00:00', 32.850000],#FIRST ONE
    ['0','2021-04-16 21:42:00+00:00', 15.633333],#SECOND ONE
    ['0','2021-04-16 21:43:00+00:00', 88.166667],
    ['0','2021-04-16 21:44:00+00:00',118.016667],
    ['88','[2021-04-27 07:30:00+00:00',79.566667],
    ['88','2021-04-27 07:31:00+00:00',59.383333],
    ['88','2021-04-27 07:32:00+00:00',89.133333],
    ['88','2021-04-27 07:33:00+00:00',59.966667],
    ['88','2021-04-27 07:34:00+00:00',25.72413] # THIRD ONE
  ],columns=['driver_id','time','speed'])
df = df.set_index(['driver_id', 'time'])
df['count'] = df[df['speed'] < 40].groupby('driver_id')['speed'].transform('count')

输出

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-10

我来说两句

0 条评论

登录后参与评论

上一篇：如何在python中添加随机尖峰信号

如何基于过滤计算数据框列中的值

如何基于过滤计算数据框列中的值

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID