我有一个简短的问题,如何仅对选定的列名重新排序数据框。我这里需要一个通用的解决方案,因为我必须在更改V列的数量时使用它(每次V列> 100时)
例:
考虑我有数据:
dkk <- structure(list(A = 2L, X = 3L, C = 4L, D = 5L, Z = 6L, V1 = 5L,
V6 = 5L, V4 = 5L, V5 = 5L, V3 = 2L, V2 = 2L), .Names = c("X",
"B", "C", "D", "Z", "V1", "V6", "V4", "V5", "V3", "V2"),
class = "data.frame", row.names = c(NA, -1L))
# X B C D Z V1 V6 V4 V5 V3 V2
2 3 4 5 6 5 5 5 5 2 2
我如何用V重新排列列,以便它们按升序排列:
# X B C D Z V1 V2 V3 V4 V5 V6
2 3 4 5 6 5 2 2 5 5 5
非常感谢!!
这是setcolorder
来自的更快选择data.table
library(data.table)
i1 <- grep("V\\d+", names(dkk), value = TRUE)
cbind(dkk[setdiff(names(dkk), i1)], setcolorder(dkk[i1], order(i1))[])
# A B C D Z V1 V2 V3 V4 V5 V6
#1 2 3 4 5 6 5 2 2 5 5 5
当“ V”名称与其他列混合时,这变得有些复杂,例如,假设我们将列名称更改为
set.seed(24)
names(dkk) <- sample(names(dkk))
dkk
# D C V6 Z V4 V1 B V2 V3 A V5
#1 2 3 4 5 6 5 5 5 5 2 2
现在,选项是使用“ V”(“ i2”)为这些列创建数字索引,提取名称(“ i3”),并分别分配名称和列的顺序
i2 <- grep("^V\\d+", names(dkk))
i3 <- names(dkk)[i2]
names(dkk)[i2] <- sort(names(dkk)[i2])
dkk[i2] <- dkk[i2][order(i3)]
要得到
dkk
# D C V1 Z V2 V3 B V4 V5 A V6
#1 2 3 5 5 5 5 5 6 2 2 4
上述解决方案中存在一个小故障。sort
当我们使用大于9的列名(例如'V10','V11'等)时,它不能正确执行操作。假设我们的第三个列名是'V100'
colnames(dkk)[3] <- "V100"
dkk
# D C V100 Z V4 V1 B V2 V3 A V5
#1 2 3 4 5 6 5 5 5 5 2 2
i2 <- grep("^V\\d+", names(dkk))
i3 <- names(dkk)[i2]
我们可以解析数字部分parse_number
以协助订购
i4 <- readr::parse_number(i3)
names(dkk)[i2] <- i3[order(i4)]
dkk[i2] <- dkk[i2][order(i4)]
dkk
# D C V1 Z V2 V3 B V4 V5 A V100
#1 2 3 5 5 5 5 5 6 2 2 4
dkk <- structure(list(A = 2L, B = 3L, C = 4L, D = 5L, E = 6L, V1 = 5L,
V6 = 5L, V4 = 5L, V5 = 5L, V3 = 2L, V2 = 2L), .Names = c("A",
"B", "C", "D", "Z", "V1", "V6", "V4", "V5", "V3", "V2"),
class = "data.frame", row.names = c(NA, -1L))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句