我有一个数据框df:
a <- c("ID1","ID2","ID3")
b <- c("happy;sad","happy;happy","happy;sad;sad;sad")
c <- c("I","II","I")
df <- data.frame(a,b,c)
a b c
1 ID1 happy;sad I
2 ID2 happy;happy II
3 ID3 happy;sad;sad;sad I
在b列中,有一些重复项,例如-happy在df [2,2]中列出了两次,而sad在df [3,2]中列出了三次。如何编辑df $ b,以便删除重复的条目,如下所示:
a b c
1 ID1 happy;sad I
2 ID2 happy II
3 ID3 happy;sad I
拆分,唯一,然后再次粘贴回去:
df$b <- sapply(as.character(df$b), function(i){
paste(unique(unlist(strsplit(i, ";"))), collapse = ";")
})
# a b c
# 1 ID1 happy;sad I
# 2 ID2 happy II
# 3 ID3 happy;sad I
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句