检测并修复熊猫系列中的异常值

公里数

我有一些带有异常值的熊猫系列。这是一些模拟数据:

df = pd.DataFrame({'col1': [1200, 400, 50, 75, 8, 9, 8, 7, 6, 5, 4, 6, 6, 8, 3, 6, 6, 7, 6]}) 

我想用平均值替换离群值,即与平均值 >= 3 标准偏差的值。

凯尔特

让我们做:

thrs = df['col1'].mean() + 3 * df['col1'].std()
df.loc[df['col1'] >= thrs, 'col1'] = df['col1'].mean()  

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章