基于 if 语句使用 for 循环对行进行分组并添加新列

aaaaa 发表于 Dev

啊啊啊

我有以下代码，我需要调整它，因为输出不是 100% 正确：

df = read.table(text='colA   colB   colC
                10  11   7
                10  34   7
                10  89   7
                10  21   7
                9   8    0
                9   11   0
                9   21   0
                2   23   5
                2   21   5
                2   56   5
                1   45   0
                1   23   0
                22  14   3
                22  19   3
                22  90   3
                11  19   2
                11  45   2
                80  13   2
                80  17   2
                99  15   1
                55  20   1', header = TRUE)

df$ID <-NA

df[1,'ID']<-1

val=1

for (i in 2:nrow(df)){

  if (df[i,'colC']!=0 & (df[i,'colC']!=df[i-1,'colC'])) {val=val+1} 
  df[i,'ID']<-val

}

按照上面的代码输出：

> df
   colA colB colC ID
1    10   11    7  1
2    10   34    7  1
3    10   89    7  1
4    10   21    7  1
5     9    8    0  1
6     9   11    0  1
7     9   21    0  1
8     2   23    5  2
9     2   21    5  2
10    2   56    5  2
11    1   45    0  2
12    1   23    0  2
13   22   14    3  3
14   22   19    3  3
15   22   90    3  3
16   11   19    2  4
17   11   45    2  4
18   80   13    2  4
19   80   17    2  4
20   99   15    1  5
21   55   20    1  5

有什么问题是最后 4 个ID值，它们应该根据行对行进行分组，colC但是因为每个不同的组之间没有 0，所以colC数字相同但不同的值colA被分组在一起，这不是我想要的。

所需的输出（见最后 4 个ID值）：

> df
   colA colB colC ID
1    10   11    7  1
2    10   34    7  1
3    10   89    7  1
4    10   21    7  1
5     9    8    0  1
6     9   11    0  1
7     9   21    0  1
8     2   23    5  2
9     2   21    5  2
10    2   56    5  2
11    1   45    0  2
12    1   23    0  2
13   22   14    3  3
14   22   19    3  3
15   22   90    3  3
16   11   19    2  4
17   11   45    2  4
18   80   13    2  5
19   80   17    2  5
20   99   15    1  6
21   55   20    1  7

我该如何解决这个问题？

西多姆

您需要稍微更改您的条件，因为不同的colA值会生成新的 ID，colA需要包含在条件中：

for (i in 2:nrow(df)){   
    # check the difference of colA here
    if (df[i,'colC']!=0 & (df[i,'colA']!=df[i-1,'colA'])) {val=val+1} 
    df[i,'ID']<-val    
}

df$ID
# [1] 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 4 4 5 5 6 7

或者您可以将其矢量化为：

df$ID <- with(df, cumsum(c(TRUE, diff(colA) != 0 & colC[-1] != 0)))
df$ID
# [1] 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 4 4 5 5 6 7

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-1

我来说两句

0 条评论

登录后参与评论

上一篇：Grails，findBy 不适用于诸如“å”、“ä”、“ö”之类的国家字符

如何使用熊猫基于多个列条件对行进行计数？

oracle中如何使用基于for循环的case语句

是否可以基于 if 语句进行循环？

IF 语句 - 基于两列创建新列

如果语句基于多个列

如何使用if else语句基于str值在r数据框中创建新列？

使用if else语句基于四列对数据进行子设置

Google脚本-函数不会基于if语句循环

R：for循环创建基于前一列的条件语句填充的新列

使用data.table基于多个列对行进行子集设置-最快的方法

使用dplyr添加基于最大行值的新列？

Python 和 Pandas - 基于排序后和基于日期而不是使用循环对列进行编号

我正在尝试使用if语句基于不同的数据框创建一个新的数据框

基于多个字段使用 If/Else 语句重新分类“添加字段”

Python-Pandas：基于列值的IF语句

基于case语句的列的SQL部分更新？

为基于 NaN 的列创建 IF 语句

SQL语句-基于列类型的总和

基于列值的IF和ELSE语句

使用在 select 语句中创建的基于条件的列连接两个表

根据基于时间值的if语句创建新列

基于R中的多个条件语句创建新列

如何基于多个条件语句创建多个新列？

具有基于值的新列的SELECT语句

基于多个条件语句熊猫数据框创建新列

基于两列对行进行分组并包括一个聚合列

基于列的值对行进行子集

Excel：基于多个列对行进行排序

使用基于group by的if语句替换NA值

TOP 榜单

文章

基于 if 语句使用 for 循环对行进行分组并添加新列

基于 if 语句使用 for 循环对行进行分组并添加新列

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

用日期数据透视表和日期顺序查询

Jqgrid：多级别组摘要

java io ioexception无法解析服务器地址解析器的响应

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

android 背部按下

Flexbox CSS 对齐属性环境惰性？

为什么随机森林中的平均降低基尼系数取决于人口规模？

ClickHouse 创建临时表

为什么PlusShare.Builder setRecipients方法不起作用？

如何在Android中识别MICR代码

PyQt4.QtCore模块无法向sip模块注册

正则表达式，用于查找所有以任何字母开头和数字开头的文件

是否可以通过编程方式对很多动画进行重新着色？

机器密钥生成