H.G*_*ami 5 data-mining rapidminer
我是快速矿工5的新手,只是想知道如何在我的数据中查找噪声并在图表中显示它们以及如何删除它们?
这是一个复杂的问题,因为这取决于噪声的含义。
如果您的意思是找到其值完全错误的单个属性,那么您可以绘制直方图视图并计算出构成有效值的某种限制。Filter Examples然后,您可以通过使用删除它们来强加该规则。
如果您的意思是查找应用了某种随机抖动的属性,则很难检测到这些属性。只有事先知道分布的预期形状是什么,您才能与观察结果进行比较并采取措施。然而,要采取的行动绝不是显而易见的。
如果您的意思是在示例集中查找与其他示例明显不同的示例,那么您可以考虑使用各种异常值函数。最简单的入门方法是Detect Outlier (Distances). 这将基于使用所有属性进行示例的距离计算来查找一定数量的异常值(默认为 10)。它创建一个名为 that 的新属性,outlier该属性设置为 true 或 false。然后,您可以使用Filter Examples运算符删除那些设置为 true 的内容。
希望这至少作为一个开始有所帮助。
| 归档时间: |
|
| 查看次数: |
3829 次 |
| 最近记录: |