如何删除R中的离群值?

彼得·K

我目前正在尝试以一种非常简单的方式删除R中的异常值。我知道您可以为此自己创建函数,但是我想在此简单代码上输入一些信息,为什么它似乎不起作用?

outliers <- boxplot(okt$pris)$out

okt_no_out <- okt[-c(outliers),]

boxplot(okt_no_out$pris)

第一行创建带有异常值的向量,第二行创建一个新的数据框,忽略该向量中的值。但是...当我检查新数据框时,仅删除了750个离群值中的约400个?

向量离群值包含大约750行,但是这样做时,只移除了其中的一半...。

这些简单的代码行是否应该以一种非常方便的方式消除异常值?

戴夫2e

boxplot$out返回异常值,而不是异常值。okt[-c(outliers),]删除数据序列中的随机点也是如此,其中一些是离群值,而另一些则不是。

您能做的是使用箱线图统计信息中的输出来检索上下晶须的末端,然后使用这些值过滤数据集。请参阅以下示例:

#test data
testdata<-iris$Sepal.Width

#return boxplot object
b<-boxplot(testdata)

#find extremes from the boxplot's stats output
lowerwhisker<-b$stats[1]
upperwhisker<-b$stats[5]

#remove the extremes
testdata<-testdata[testdata>lowerwhisker & testdata<upperwhisker]

#replot
b<-boxplot(testdata)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何正确删除r中特定列表元素的离群值?

如何在Python中删除离群值?

如何基于R中的分类变量删除数据框中的离群值

如何删除R中的第99个百分点离群值

R中的IQR离群值

如何摆脱R中的时间序列中的多个离群值?

从Pandas DataFrame Python中删除离群值

识别R中数据集中的离群值

如何使用均值和标准差从pyspark中的多个列中删除离群值

r从data.frames列表中删除离群值并制作新的data.frames列表吗?

如何计算平均值,以这种格式从数据帧中删除NaN和离群值?

R中的属性值频率(分类变量中的离群值)

如何获取R中数据框中所有列的离群值

如何一次性检测和删除熊猫数据框各列中的离群值?

如何计算直方图中的离群值?-R / Matlab的

如何在python中修剪日期中的离群值?

熊猫:如何检测数据框中的峰值(离群值)?

如何在Python中打印Boxplot的离群值?

如何将所有数据作为R中的箱形图的非离群值处理?

删除后:离群值接近最大值,保留在R箱图中

如果cloumn的值离群,则删除矩阵行

删除大熊猫中具有标准偏差的组中的离群值?

Matlab-如何从一组2D点中删除离群值?

如果另一列中的某个值是离群值,如何在R中创建一个新的列,该列为1?

如何从R Highcharter中删除“值”

如何删除PCL中的离群点以进行基于区域增长的表面检测

如何绘制离群值和原始序列?

groupby之后如何替换离群值?

我应该如何随机生成离群值?