如何将自定义函数应用于数据框的每一列

mark 发表于 Dev

100

标记

我试图摆脱tidyverse和dplyr方法的困扰，并希望将以下函数应用于数据框/数据表的每一列：

library(multimode)
funx <- function(x) {multimode::modetest(x, method = 'SI') }

然后尝试使用诸如summary_all之类的内容开始，但是我立即收到错误消息：

错误：列的mpg长度必须为1（汇总值），而不是8

library(dplyr)

mtcars %>%
     summarise_all(funx)

我希望最终得到一个新的数据框，该数据框显示在第1列中测试的colname和在第modetest2列中的p值

从昨天（23-05-2019）更新软件包后，我的解决方案无法正常工作，下面的代码现在显示为'。' 点而不是列名提交了一个帖子到github页面来询问这种改变的原因：github

library(multimode)
funx <- function(x) {
    print(substitute(x))
    multires <- multimode::modetest(x, method = 'SI') 
    p <- multires$p.value}

mtcars %>% 
    select(1:2) %>%
    summarise_all(list(~ funx(.)))

具有讽刺意味的更新，在获得有关github帖子的反馈后，使用新版本，我们现在可以执行以下操作：

   mtcars %>%
      select(1:2) %>%
        summarise_all(funx)

如您所见，它与我发布问题时开始的语法完全相同。因此，我想说dplyr团队所做的出色工作使语法更加“自然”。

阿克伦

所述summarise可输出仅与单个元件。根据?summarise

创建一个或多个标量变量，以汇总现有tbl的变量。具有由group_by（）创建的组的Tbl将在每个组的输出中导致一行。没有组的Tbl将导致一行。

因此，如果输出大于长度1，则将其包装在list和unnest

library(dplyr)    
out <- mtcars %>%
          summarise_all(list(~ list(funx(.))))

如果我们要提取单个值，例如p.value，则无需将其包装在list

out1 <- mtcars %>% 
          select(1:2) %>%
          summarise_all(list(~ funx(.)$p.value))
out1
#    mpg   cyl
#1 0.718 0.244

可以将其转换为两列数据集 gather

library(tidyr)
gather(out1, colName, pvalue) %>%
      arrange(pvalue)

通过检查modetest单列上的输出

funx(mtcars[[1]])

#   Silverman (1981) critical bandwidth test

#data:  x
#Critical bandwidth = 2.5413, p-value = 0.716
#alternative hypothesis: true number of modes is greater than 1

它不是单个值输出，而是摘要模型输出。因此，最好将其存储在中list，但是，我们可以提取特定的组件（p-value）并将其输出到summarise

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-8

我来说两句

0 条评论

登录后参与评论

上一篇：Unicode字符名称的官方存储库

如何将自定义函数应用于数据框的每一列

如何将自定义函数应用于数据框的每一列

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用