向量化此R循环和自定义函数

Alex 发表于 Dev

亚历克斯

我data.frame在命名列中有一个分数，我需要根据rowMeans定义colNames需要分组的索引文件获取某些列簇。我想同时执行此操作，因为当前它是在循环中完成的，该循环传递当前的“群集”以进行处理。见下文。

我有两个数据帧，一个是带有以下内容的索引文件（还有更多，例如，这是obv）

set.seed(42)
index <- data.frame(area=c("area1","area1","area1","area2","area2","area2","area1",
    "area1","area4","area5"), name=c(paste0("name",sample(6,10,replace=T))))

另一个是数据文件，这里又是一个贫困的例子

data <- data.frame(name1=sample(10,5),name2=sample(10,5),name3=sample(10,5),
       name4=sample(10,5),name5=sample(10,5),name6=sample(10,5))

我做了一个函数，rowMeans根据“索引” df返回组成区域的“数据” df的列

myfun <- function (curr.target) {
       target.cols <- as.character(index$name[index$area==curr.target])
        return(rowMeans(data[target.cols],na.rm=T))
    }

然后，我使用该函数通过遍历区域来获取区域的行均值。

for (i in seq_along(unique(index$area))){
  data[,as.character(unique(index$area))[i]] <- myfun(as.character(unique(index$area))[i])
}

我在跳动自己，想一想如何做到这一点（一旦编写了函数），但是根本无法动弹。有什么建议么？

阿克伦

我们可以split按“区域”按“索引”中的“名称”列，然后遍历list，根据“索引”中“名称”列的子集“数据”并获取rowMeans

sapply(split(as.character(index$name), index$area), function(x) rowMeans(data[x]))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-4

我来说两句

0 条评论

登录后参与评论

上一篇：Azure DocumentDB受限制的请求

如何使用lapply函数代替在参数中未向量化的自定义函数中的for循环

R：循环自定义dplyr函数

使用字符串向量在 R 中循环自定义 ifelse 函数

R中带有向量和矩阵的自定义函数

为什么GCC无法向量化此函数并循环？

Matlab：向量化此for循环

自定义函数替换R中向量中的值

R 相关 - 如何使用 lapply 和 list 在 r 中循环自定义函数？

张量的矢量化运算，而不是在keras自定义损失函数中使用for循环

如何在R中向量化此简单的for循环？

向量化的 R 函数

r：在自定义函数中嵌套 for 循环

如何循环遍历自定义函数 R？

numpy / pandas矢量化自定义循环

向量化包含where语句和函数的for循环

使用条件和函数向量化嵌套循环

为什么此自定义bisect函数处于无限循环中？

在numpy中向量化此for循环

向量化嵌套 for 循环 r

R 使用 Group by 和 Mutate 创建自定义函数

excel自定义函数循环

嵌套 for 循环中的自定义函数

定义和调用自定义函数

向量化R中的函数

使用自定义函数，期望带有mutate和group_by的向量

具有unique_ptr成员和自定义析构函数的对象的向量

R-将向量传递给自定义函数至dplyr :: mutate

R：使用自定义概率函数从向量中绘制

R将自定义矢量化函数应用于数据帧中的行，特定列

TOP 榜单

文章

向量化此R循环和自定义函数

向量化此R循环和自定义函数

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称