我是快速矿工5的新手,只是想知道如何在我的数据中找到噪音并将其显示在图表中,以及如何删除它们?
一个复杂的问题,因为它取决于您所说的噪音。
如果要查找值显然不正确的单个属性,则可以绘制直方图视图,并对构成有效值的内容进行某种限制。然后,您可以通过将Filter Examples
其删除来强加该规则。
如果要查找具有某种随机抖动的属性,将很难检测到这些属性。只有事先知道分布的预期形状是什么,您才能将其与观察结果进行比较并对此进行一些处理。但是,采取的行动绝非显而易见。
如果要在示例集中查找与其他示例明显不同的示例,则可以考虑使用各种离群值函数。最简单的入门方法是Detect Outlier (Distances)
。这会基于使用所有属性作为示例的距离计算来找到一定数量的异常值(默认值为10)。它会创建一个名为outlier
true或false的新属性。然后,您可以使用Filter Examples
运算符删除设置为true的那些运算符。
希望至少可以作为一个开始。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句