数据可视化多个条形图,R中存在均值和误差

劳尔·帕拉达·麦地那

我有一个具有以下结构的数据集:

Features Method Distance V1 V2 ........  V100
  V1V2     LOF     A      4  5  .........  6
   .
   .
   .
V1V2V3V4V5 Gaussian C     7  8   .........  7

数据集由624行和103列组成。前三列与每一行的信息相对应,从V1到V100的其余各列均与数据相对应。

我需要创建一个多图26x8条形图,以显示平均值和平均值的标准误差。我添加了一个函数来计算平均值的标准误。

#function for standard error of the mean
sem <- function(x){
 sd(x)/sqrt(length(x))
 }

每个条形图应显示从V1到V100的平均值,以及每个距离A,B,C的平均值的标准误差。

下面提供了一个数据集示例

df <- read.table(text=" Features      Method Distance        V1        V2        V3        V4        V5        V6        V7
   V1V2         LOF        A 11.764706  3.703704 15.384615  9.090909  9.090909  8.000000  7.407407
V1V2 Mahalanobis        A 11.764706 33.333333 15.384615  9.090909  9.090909 28.571429 33.333333
  V1V2        Cook        A 40.540541  6.666667 24.390244 24.358974 32.608696 15.584416 17.647059
  V1V2      DIFFTS        A 24.590164  4.958678 28.169014 26.950355 30.588235 47.058824 10.909091
  V1V2       OCSVM        A 36.585366 25.000000 57.142857 35.514019 88.372093  8.988764  5.825243
  V1V2      DBSCAN        A 44.117647 21.428571 30.769231 51.351351 41.269841 14.814815  6.976744
  V1V2         PCA        A 11.764706 33.333333 15.384615  9.090909  9.090909 28.571429 33.333333
  V1V2    Gaussian        A  1.886792  3.278689  1.869159  1.398601  2.597403  2.197802  4.878049
  V1V3         LOF        A 12.698413 20.000000 55.000000  6.666667 33.333333 29.787234  2.777778
 V1V3 Mahalanobis        A 11.764706 33.333333 15.384615  9.090909  9.090909 28.571429 33.333333",header=T)

绘图的示例应该是这样的,但要有均值和均值的标准误。

在此处输入图片说明

劳尔

希罗卡

干得好。我选择在绘制数据之前先对其进行汇总,因为我希望能够控制此类事情。您也可以在ggplot2中使用内置的stat_summary。

library(ggplot2)
library(dplyr)
library(reshape2)

#first, reshape (just like in your previous Q)

df_m <- melt(df,id.vars=c("Features","Method","Distance"))

#now aggregate
sem <- function(x){
  sd(x)/sqrt(length(x))
}

df_a <- df_m %>% group_by(Features,Method,Distance) %>% summarise(
  mean_value=mean(value),
  sem_value=sem(value)
)

#now plotting is easy
#using bars
p1 <- ggplot(df_a, aes(x=Distance))+
  facet_grid(Features~Method)+
  geom_bar(aes(y=mean_value),stat="identity")+
  geom_errorbar(aes(ymin=mean_value-sem_value,ymax=mean_value+sem_value))
p1

在此处输入图片说明 #使用点(我的偏好)

p2 <- ggplot(df_a, aes(x=Distance))+
  facet_grid(Features~Method)+
  geom_point(aes(y=mean_value),size=2)+
  geom_errorbar(aes(ymin=mean_value-sem_value,ymax=mean_value+sem_value))
p2

在此处输入图片说明

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用条形图的javascript数据可视化

使用条形图可视化数据

为R中的条形图竞速可视化在数据框中创建列作为先前列的总和

SAP UI5 可视化图表(折线、堆积条形图等)中的最大可能度量和维度?

使用ggplot2的堆叠条形图-数据可视化

Kibana 可视化:使用 JSON 文档中的字段创建条形图

如何将条形图和点图与 ggplot2 结合起来进行同步数据可视化?

使用python可视化条形图中的数据

在 r 中具有分类计数和时间的热图数据可视化

R中均值的分组条形图

如何在条形图中可视化 R 中因子之间变量分布的比例?

使用数据框中多个列的误差条来绘制条形图

Python可视化功能在一个图中按柱和年份分组的2个条形图

如何在R中使用x,y数据绘制条形图和误差线

从R中的整洁数据同时创建多个条形图

向R中的水平条形图添加误差线

如何使用ggplot2可视化井眼剖面(堆积的条形图)?

将JSON文件导入Highcharts以可视化条形图

条形图R中两列的平均值

Google可视化堆叠条形图中的标签值和总计

R中具有多个条形的分组条形图

如何在R中绘制大数据缺失值的可视化图?

可视化R中的系数(点图)

ggplot条形图,带有来自多个组的数据框的误差条

从数据框中自动制作多个条形图

根据每个类别 R 中的计数从多个数据框列创建条形图

在R中组合多个数据框以进行条形图竞赛

R 中的 ggplot2() 条形图和 dplyr() 分组和整体数据

使用多个变量/参数可视化R中的“ Corrplot”