我有两个数据集,一个用于培训,另一个用于测试.我将在测试数据集中预测具有数字类型的列的值.为了预测实例的值,我必须在训练数据集中找到该实例的k个最近邻居,并计算值的平均值.(等待也可以使用).
例如:
...... a .................. b .................... 10
... ...... ...... .................. b .................... 12
...... ç.................. d .................... 16
......一个.................. b ....................?
我需要一种数据挖掘方法来给我结果=(10 + 12)/ 2 = 11我应该使用哪种方法来得到这样的结果?您是否知道任何解释如何使用该方法的好文档?
weka ×1