熊猫：如何根据其他2列的增量和连续属性来增加新列？

杰森·安德鲁斯（Jason Andrews）

我目前正在研究熊猫的批量数据预处理框架，并且由于我对熊猫还比较陌生，所以我似乎无法解决此问题：

给定：具有2列的数据集：col_1，col_2

必需：req_col如果
a，则增加其值的新列。中的值col_1不连续
或
b。的值col_2连续增加

注意：

col_2总是从1值开始并且总是增加，并且值永远不会丢失（总是连续的），例如：1、2、2、3、3、4、5、6、6、6、7、8、8、9。 ....
col_1总是从0值开始并且总是增加，但是某些值可能会丢失（不需要连续），例如：0,1,2,2,3,6,6,6,10,10,10 ...

预期答案：

col_1  col_2  req_col      #Changes in req_col explained below
 0        1        1
 0        1        1
 0        2        2       #because col_2 value has incremented
 1        2        2
 1        2        2
 3        2        3       #because '3' is not consectutive to '1' in col_1
 3        3        4       #because of increment in col_2
 5        3        5       #because '5' is not consecutive to '3' in col_1
 6        4        6       #because of increment in col_2 and so on...
 6        4        6

广晃

尝试：

df['req_col'] = (df['col_1'].diff().gt(1) | # col_1 is not consecutive
                 df['col_2'].diff().ne(0)   # col_2 is has a jump
                ).cumsum()

输出：

0    1
1    1
2    2
3    2
4    2
5    3
6    4
7    5
8    6
9    6
dtype: int32

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-13

我来说两句

0 条评论

登录后参与评论

上一篇：如何将字符串列表中的反向字符串与python中的原始字符串列表进行比较？

如何根据熊猫中的其他列添加新列？

如何根据 Pandas 中其他列的增加值添加新列排名

根据其他列值在熊猫中添加新列

熊猫根据其他两列的划分创建新列

熊猫根据其他列的值创建新的列ID

熊猫根据其他列创建和填充新列

根据其他列的条件在熊猫中创建新列

熊猫：根据其他列添加新列

熊猫根据其他列中的条件和值创建新列

根据熊猫数据框中其他列的条件和值创建新列

如何根据其他列和其他条件过滤熊猫数据框并仅保留行

如何根据数据框的其他列创建新的熊猫列？

如何根据其他两列中的值在熊猫数据框中添加新列

根据列值和其他列更新熊猫细胞

根据其他2列（熊猫）的比较填充列

如何根据其他数据帧的列使用熊猫创建新数据帧

根据其他列和行添加新列

在 R 中，如何根据其他列的值从其他列的列标题创建新列

如何根据熊猫中的其他列映射值？

熊猫：如何根据其他列值的条件求和？

熊猫根据其他列的值创建新列/逐行应用多列的功能

熊猫使用其他列中的值创建新列，并根据列值进行选择

如何基于其他2列汇总熊猫列的计数

使用其他列中的条件来计算熊猫中的新列

如何根据其他 2 列选择 1 列的最大值和最小值？

R：如何根据其他列的名称创建新变量

如何根据其他几个变量添加新列

根据其他列的唯一值的长度在熊猫中创建新列

熊猫根据许多其他列的条件逻辑添加新列

TOP 榜单

文章

熊猫：如何根据其他2列的增量和连续属性来增加新列？

熊猫：如何根据其他2列的增量和连续属性来增加新列？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接