R中的For循环和if语句

信德·维斯瓦纳森（Sindhu Viswanathan）

我有一个数据框orange_train，它具有231个变量和50,000个观察值。我想检查每个变量的NA或零。如果NA（对于因子）和零（对于数字和整数）的总和大于50,000的75％，我想消除这些变量。我的代码如下：但是它没有按预期工作：

counting_na <- function(x) {sum(is.na(x))}
counting_zero <- function(x){length(which(x==0))}

for(i in 1:ncol(orange_train)){
  if (class(orange_train$Var[i])=='numeric' && sum(is.na(orange_train$Var[i]))< 32500) 
    {print(orange_train$Var[i])}
  else (class(orange_train$Var[i])=='integer' && [enter image description here][1]counting_zero(orange_train$Var[i]) < 32500)
  {print(orange_train$Var[i])}

有人可以帮我提供代码。我已经奋斗了很长时间，对R来说还是个新手。

我的列的标题为Var1-Var231，数据类型为数字，因子和整数。我希望这有帮助

冰激凌巨嘴鸟

示例数据

set.seed(10)

df <- data.frame(a = sample(c(NA, LETTERS[1]), 100, T, prob = c(.75, .25))
                 , b = sample(0:1, 100, T, prob = c(.75, .25)))

计算每列的百分比（NA因子百分比0，数字百分比）

percents <- 
  sapply(df, function(x){
    if(is.factor(x)) mean(is.na(x)) 
    else if(is.numeric(x)) mean(x == 0) 
    else NA})

percents
#    a    b 
# 0.84 0.75

删除大于75％的

df[percents > 0.75] <- NULL

names(df)
#[1] "b"

您可以看到该列a已删除，因为这是一个84％NA的因素

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-16

我来说两句

0 条评论

登录后参与评论

上一篇：如何在Kotlin的forEach上引用外部

R中的条件if语句和循环

循环和If语句填充R中的家庭位置

R中的if（）语句或while（）循环

R中的if和＆语句

在Python中结合with语句和for循环

优化javascript中的嵌套for循环和if语句

For循环和Python中的else语句

AngularJS中的基本循环和if语句问题

在Python中合并循环和打印语句

java中循环if和else语句

Bash 脚本中的 While 循环和 If 语句

尝试在 R 中的 FOR 循环内运行 IF 语句

R中的循环语句有问题

if 语句循环和 while 循环

在R中构造For循环和if循环

使用 if 语句和 for 循环

PHP IF语句和循环

控制语句和循环

For 循环和 open 语句

循环和if语句的装箱

R中的循环和计数

dplyr和r中的for循环

在 R 中结合 For 和 If 循环

使用循环和条件语句比较列表中的项目

如何在python中解析循环语句的开始和结束

在硒中循环执行try和catch语句

批处理文件中的嵌套 /F 循环和 If 语句

在Java中的循环和if语句中使用变量

用if语句在画布和JavaScript中循环播放框架

TOP 榜单

文章

R中的For循环和if语句

R中的For循环和if语句

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException