聚合-R中的na.omit和na.pass带因子（按因子分组）？

卡伦吉

我有一个包含薪水测试数据的数据集。并非所有单元格都具有值，因此我使用了na.action = na.pass，na.rm = TRUE，但是由于我想与JobTitle进行汇总，这给了我一个错误？

到目前为止，我已经开发了以下代码：

aggregate(salaries$JobTitle, 
list(pay = salaries$TotalPay),
FUN=mean,
na.action=na.pass,
na.rm=TRUE)

我的测试数据包括以下列：

'data.frame':   104 obs. of  36 variables:
 $ Id              : int  1 2 3 4 5 6 7 8 9 10 ...
 $ EmployeeName    : Factor w/ 11 levels "","ALBERT PARDINI",..: 10 7 2 4 11 6 3 5 9 8 ...
 $ JobTitle        : Factor w/ 9 levels "","ASSISTANT DEPUTY CHIEF II",..: 8 4 4 9 6 2 3 7 3 5 ...
 $ BasePay         : num  167411 155966 212739 77916 134402 ...
 $ OvertimePay     : num  0 245132 106088 56121 9737 ...
 $ OtherPay        : num  400184 137811 16453 198307 182235 ...
 $ Benefits        : logi  NA NA NA NA NA NA ...
 $ TotalPay        : num  567595 538909 335280 332344 326373 ...
 $ TotalPayBenefits: num  567595 538909 335280 332344 326373 ...
 $ Year            : int  2011 2011 2011 2011 2011 2011 2011 2011 2011 2011 ...
 $ Notes           : logi  NA NA NA NA NA NA ...
 $ Agency          : Factor w/ 2 levels "","San Francisco": 2 2 2 2 2 2 2 2 2 2 ..

出现的错误代码是

Warning messages:
1: In mean.default(X[[i]], ...) :
  argument is not numeric or logical: returning NA
2: In mean.default(X[[i]], ...) :
  argument is not numeric or logical: returning NA

等等...

我已经尝试过salaries $ Id，它的工作原理就像魔术一样，所以我认为代码正确，也许我需要更改JobTitle的数据类型？

阿克伦

如果我们得到mean'TotalPaygrouped by 'JobTitle', the公式'方法，将是

aggregate(TotalPay~JobTitle, salaries, mean, na.rm=TRUE, na.action=na.pass)

或使用

aggregate(salaries$TotalPay, list(salaries$JobTitle), FUN=mean, na.rm=TRUE)

数据

set.seed(24)
salaries <- data.frame(JobTitle = sample(LETTERS[1:5], 20,
       replace=TRUE), TotalPay= sample(c(1:20, NA), 20))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-1

我来说两句

0 条评论

登录后参与评论

按因子分组的计数 NA

使用 NA 按因子折叠 r 中的数据帧

在R中处理聚合函数中的NA

R中的聚合函数（处理NA）

如何与 R 中的 NA 值聚合

R中na.rm和na.omit的差异

分组和按因子求和

dplyr 中的 Sum() 和聚合：NA 值

使用分组依据聚合R中的数据，并保留非NA的其他列的值

在 R 中聚合顺序和分组数据

按 R 中的变量和级别聚合

用按因子分组的同一列的平均值替换 data.table 列中的 NA

如何在聚合中省略na以计算R中的SD

如何在 R 中聚合包含 NA 值的行

在 R 中按 2 列分组/聚合

R：如何对按因子分组的列求和？

替换因子列中的<NA>

MeteorJS中的MongoDB聚合和分组问题

在 r 中对行进行分组聚合和函数

按 R 中的日期序列和 id 變量聚合

R：将因子变量中的 <NA> 替换为 0

如何通过R中的组/因子计算NA值的长度？

R中的排序和聚合

ElasticSearch 分组和聚合

使用na.omit或NA.RM和mapply跨Datafrme的多个列忽略R中的NA

R 删除按因子分组的数据框中的异常值

Mongodb聚合和按查询分组

按多列分组和聚合

R-用分组数据中一个因子的水平重新编码NA

TOP 榜单

文章

聚合-R中的na.omit和na.pass带因子（按因子分组）？

聚合-R中的na.omit和na.pass带因子（按因子分组）？

数据

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序