根据仅为新ID累加的另一列创建一个累加列

尼尔森

我有以下数据集：

Time = ['00:01', '00:02','00:03','00:01','00:02','00:03','00:01','00:02','00:03']
ID = [1, 1, 1, 2, 2, 2, 3, 3, 3]
Value = [3.5, 3.5, 3.5, 4.1, 4.1, 4.1, 2.3, 2.3, 2.3]   
df = pd.DataFrame({'Time':Time, 'ID':ID, 'Value':Value})

每个ID的每个值都相同。我想创建一个新列，该列会累计“值”列，但仅当每个ID更改时才累加。V

所以，而不是得到

3.5   7   10.5   14.6   18.7   22.8   25.1   27.3   29.5

我想要

3.5   3.5   3.5   7.6   7.6   7.6   9.9   9.9   9.9

马那金

使用.loc指定的值，

shift 测试ID在哪里更改

然后cumsum用ffill

df.loc[:, "Val"] = df[df["ID"].ne(df["ID"].shift())][
    "Value"
].cumsum()

df['Val'] = df['Val'].ffill()

print(df)

    Time  ID  Value  Val
0  00:01   1    3.5  3.5
1  00:02   1    3.5  3.5
2  00:03   1    3.5  3.5
3  00:01   2    4.1  7.6
4  00:02   2    4.1  7.6
5  00:03   2    4.1  7.6
6  00:01   3    2.3  9.9
7  00:02   3    2.3  9.9
8  00:03   3    2.3  9.9

或更简单地按照Ch3steR的建议

df['Value'].where(df['Value'].ne(df['Value'].shift(1))).cumsum().ffill()

0    3.5
1    3.5
2    3.5
3    7.6
4    7.6
5    7.6
6    9.9
7    9.9
8    9.9

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-24

我来说两句

0 条评论

登录后参与评论

上一篇：使用numpy数组操作从图像生成像素密度图（热图）

根据仅为新ID累加的另一列创建一个累加列

根据仅为新ID累加的另一列创建一个累加列

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u