使用Weka过滤属性

hrz*_*fer 3 weka

我有一个关于在WEKA中过滤属性的简单问题.

假设我有500个属性30个类,每个类有100个样本,等于3000行和500列.这会导致时间和内存问题,你可以猜到.

如何过滤仅在3000行中出现一次或两次(或n次)的属性.这是个好主意吗?

谢谢

Geo*_*tas 7

使用以下过滤器

weka.filters.unsupervised.attribute.RemoveUseless
Run Code Online (Sandbox Code Playgroud)

此过滤器会删除完全不变或变化太大的属性.将自动删除所有常量属性,以及超出方差参数的最大百分比的任何属性.