我有一个包含 +100 个观察值和 68 个变量的大数据集。我想知道是否有一种方法可以一次为所有这些变量生成图和直方图,而不必一个一个地写下箱线图/直方图的代码,并将它们作为 pns 或 pdf 保存在一个文件夹中。
可能我想在同一页面上有多个图(我知道你可以使用“par”来做到这一点)
我知道这可能是一段简单的编码,但对我来说真的很有帮助。谢谢
好的,我认为一个例子可能是来自 iris 数据集的数据:
"Sepal.Length Sepal.Width Petal.Length Petal.Width 种
1 5.1 3.5 1.4 0.2 柔滑
2 4.9 3.0 1.4 0.2 柔滑
3 4.7 3.2 1.3 0.2 柔滑
4 4.6 3.1 1.5 0.2 柔滑
5 5.0 3.6 1.4 0.2 柔滑
6 5.4 3.9 1.7 0.4 柔滑"
但不是只有“Sepal.Length Sepal.Width Petal.Length Petal.Width”作为观察变量,我有 68 个。我的兴趣是检查我所有 68 个变量和 boxplot 样本的正态分布。我知道如何为每个变量创建箱线图和直方图变量,但这会花费很多时间,我想必须有一种方法可以立即完成,可能使用循环或 %>% ?
看看DataExplorer
,skimr
和inspectdf
包。它们都会生成您想要的摘要。这些文章给出了概述:
https : //www.littlemissdata.com/blog/simple-eda
https://www.littlemissdata.com/blog/inspectdf
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句