我有一个关于在WEKA中过滤属性的简单问题.
假设我有500个属性30个类,每个类有100个样本,等于3000行和500列.这会导致时间和内存问题,你可以猜到.
如何过滤仅在3000行中出现一次或两次(或n次)的属性.这是个好主意吗?
谢谢
使用以下过滤器
weka.filters.unsupervised.attribute.RemoveUseless
Run Code Online (Sandbox Code Playgroud)
此过滤器会删除完全不变或变化太大的属性.将自动删除所有常量属性,以及超出方差参数的最大百分比的任何属性.