R从本地文件计算平均值和中位数

Ben

我是R的新手,所以这很明显。

我到目前为止的代码:

rm(list=ls())

kdata = read.table("data_fra_klassen_v20.txt",header = TRUE,)

library(openxlsx)

kdata = read.xlsx("data_fra_klassen_v20.xlsx") 


head(kdata)

这是数据集:

  gender    shoe    height  colour
  Man        43      176    Green
  Woman      36      166    Brown
  Man        43      182    Other
  Man        36      151    Brown
  Woman      43      183    Blue
  Man        44      184    Blue
  Woman      38      164    Brown
  Woman      37      160    Brown
  Man        41      175    Brown

我正在尝试寻找均值和每种性别的中位数。

我在想也许是这样的:

heightmen = kdata$height[kdata$gender=="Man"]
mean(heightmen)

但是,似乎找不到任何值。

sm925

您可以使用dplyrR中的包来执行此操作

使用mutate

library(dplyr)
df %>% 
  group_by(gender)%>% 
  mutate(mean_height = mean(height))%>% 
  mutate(median_height = median(height)) %>% 
  select(gender, mean_height, median_height) %>% 
  unique()

或使用summarise

df %>%
  group_by(gender) %>%
  summarise(mean_height = mean(height), median_height = median(height))


# A tibble: 2 x 3
# Groups:   gender [2]
#   gender mean_height median_height
#<fct>        <dbl>         <dbl>
#1 Man           174.           176
#2 Woman         168.           165

数据

df <- structure(list(gender = structure(c(1L, 2L, 1L, 1L, 2L, 1L, 2L, 2L, 1L), .Label = c("Man", "Woman"), class = "factor"), shoe = c(43L,36L, 43L, 36L, 43L, 44L, 38L, 37L, 41L), height = c(176L, 166L,182L, 151L, 183L, 184L, 164L, 160L, 175L), colour = structure(c(3L,2L, 4L, 2L, 1L, 1L, 2L, 2L, 2L), .Label = c("Blue", "Brown", "Green", "Other"), class = "factor")), class = "data.frame", row.names = c(NA,-9L))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

有效计算平均值和中位数

R:计算新列(平均值/中位数)

计算月度数据的平均值和中位数,并在htmltable R中进行转换

r箱线图中的平均值和中位数

平均值和中位数与摘要

根据标准计算平均值或中位数 - Excel

计算每列频率表的平均值和中位数(每组的长度等级)

在 Shiny 中按日期范围计算平均值和中位数

Fillna Pandas NaN的平均值和中位数

读取带有浮点数的文件,计算C中的大小,最大值,最小值,平均值,中位数和标准偏差

数据框平均值计算->与中位数相差> 20%的值应从平均值计算中排除

如何计算数量订单的最大值、最小值、平均值和中位数

为什么我不断获得平均值,中位数和众数的NA值?(R)(统计的10天)

Java,使用 Math.random 时计算中位数和平均值

分组和总结以找到基于组的平均值和中位数

如何从字典中找到键,然后取平均值,中位数和范围

计数总计,总空值,平均值和中位数

Sql Server 2012中一个查询的平均值和中位数

在两个ggplot直方图上显示平均值和中位数

中位数/平均值未返回正确的值

quicksort中三个(平均值)的中位数?

在 boxplot matlab 中显示平均值而不是中位数

熊猫分组平均值/中位数,缺失值下降

在tcl中查找列表的中位数和平均值

查找行块平均值之间的中位数

R-如何获取不同列的非NA间隔的平均值/中位数/标准偏差?

如何用预先计算的平均值,中位数,百分位数等值在seaborn中创建箱线图?

当R中缺少一个以上的个体时,如何通过ID计算平均值,而当R中只有一个缺失值时,如何计算中位数?

从直方图计算平均值和百分位数?