Weka属性选择

nad*_*dia 5 machine-learning weka

我正在尝试在Weka中执行属性选择.我想使用InfoGainAttributeEval作为评估者,因为我读到它相当于互信息,而Ranker作为搜索方法.我应该对训练和测试集进行属性选择吗?另外,如何为N参数选择正确的值?

非常感谢你的时间,

纳迪亚

Sic*_*cco 1

在训练和测试上分别应用属性选择可能会导致选择不同的属性,从而使它们不兼容。因此,为了确保两个集合具有相同的属性,您需要对整个数据集应用属性选择。选择最有用的属性后,您可以将数据分成训练集和测试集。

至于-N使用哪个值,我会使用你的属性总量。这将产生您所有属性的排名列表,您可以自己评估所有属性的不同分数。然后,您可能会发现一个清晰的阈值,将包含任何有用信息以训练分类器的属性与不添加任何内容的属性分开。然后我将使用该-T选项设置此阈值。