在另一列的基础上递增计数列1

斯特林兹

我有这个数据框，需要在我的距离列上创建一个计数列。我按模型列将结果分组。我期望得到的是，每当距离为100时，下一个计数行上的增量就为1。例如，这是我到目前为止所获得的结果，但是增量没有成功

import pandas as pd
df = pd.DataFrame(
    [['A', '34', 3], ['A', '55', 5], ['A', '100', 7], ['A', '0', 1],['A', '55', 5],
     ['B', '90', 3], ['B', '0', 1], ['B', '1', 3], ['B', '21', 1],['B', '0', 1],
     ['C', '9', 7], ['C', '100', 4], ['C', '50', 1], ['C', '100', 6],['C', '22', 4]],
    columns=['Model', 'Distance', 'v1'])

df = df.groupby(['Model']).apply(lambda row: callback(row) if row['Distance'] is not None else callback(row)+1)
print(df)
import numpy as np
(
    df.groupby('Model')
    .apply(lambda x: x.assign(Bount=x.Count  + x.Distance.shift()
                              .eq('100').replace(False, np.nan)
                              .ffill().fillna(0)
                             )
          )
    .reset_index(level=0, drop=True)
)

Result with your code solution

Model   Distance    v1  Count
A           34      3   1.0
A           55      5   2.0
A           100     7   3.0
A           0       1   5.0
A           55      5   6.0
B           90      3   1.0
B           0       1   2.0
B           1       3   3.0
B           21      1   4.0
B           0       1   5.0
C           9       7   1.0
C           100     4   2.0
C           50      1   4.0
C           100     6   5.0
C           22      4   6.0


My expected result is:


Model   Distance    v1  Count
A           34      3   1.0
A           55      5   2.0
A           100     7   3.0
A           0       1   5.0
A           55      5   6.0
B           90      3   1.0
B           0       1   2.0
B           1       3   3.0
B           21      1   4.0
B           0       1   5.0
C           9       7   1.0
C           100     4   2.0
C           50      1   4.0
C           100     6   5.0
C           22      4   7.0

看一下两个距离等于100的C组

艾伦

设定：

df = pd.DataFrame({'Model': {0: 'A', 1: 'A', 2: 'A', 3: 'A', 4: 'A', 5: 'B', 6: 'B', 7: 'B', 8: 'B', 9: 'B', 10: 'C', 11: 'C', 12: 'C', 13: 'C', 14: 'C'}, 
                   'Distance': {0: '34', 1: '55', 2: '100', 3: '0', 4: '55', 5: '90', 6: '0', 7: '1', 8: '21', 9: '0', 10: '9', 11: '23', 12: '100', 13: '33', 14: '23'}, 
                   'v1': {0: 3, 1: 5, 2: 7, 3: 1, 4: 5, 5: 3, 6: 1, 7: 3, 8: 1, 9: 1, 10: 7, 11: 4, 12: 1, 13: 6, 14: 4}, 
                   'Count': {0: 1, 1: 2, 2: 3, 3: 4, 4: 5, 5: 1, 6: 2, 7: 3, 8: 4, 9: 5, 10: 1, 11: 2, 12: 3, 13: 4, 14: 5}})

如果需要在“模型”列上应用逻辑，则可以使用平移，比较并为eligibal行加1：

df.loc[df.Distance.shift().eq('100'), 'Count'] += 1

如果逻辑需要在每个模型组中应用，则可以使用groupby：

(
    df.groupby('Model')
    .apply(lambda x: x.assign(Count=x.Distance.shift().eq('100') + x.Count))
    .reset_index(level=0, drop=True)
)

根据@StringZ的更新，以下是更新的解决方案：

(
    df.groupby('Model')
    .apply(lambda x: x.assign(Count=x.Count + x.Distance.shift()
                              .eq('100').replace(False, np.nan)
                              .ffill().fillna(0)
                             )
          )
    .reset_index(level=0, drop=True)
)

Model   Distance    v1  Count
0   A   34          3   1.0
1   A   55          5   2.0
2   A   100         7   3.0
3   A   0           1   5.0
4   A   55          5   6.0
5   B   90          3   1.0
6   B   0           1   2.0
7   B   1           v3  3.0
8   B   21          1   4.0
9   B   0           1   5.0
10  C   9           7   1.0
11  C   23          4   2.0
12  C   100         1   3.0
13  C   33          6   5.0
14  C   23          4   6.0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-23

我来说两句

0 条评论

登录后参与评论

上一篇：如果条件在Python中为True，则跳过一段代码

在另一列的基础上递增计数列1

在另一列的基础上递增计数列1

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成