Java,Weka:如何预测数字属性?

Ant*_*nin 6 java numeric predict weka

我试图使用Weka的NaiveBayesUpdateable分类器.我的数据包含名义和数字属性:

  @relation cars
  @attribute country {FR, UK, ...}
  @attribute city {London, Paris, ...}
  @attribute car_make {Toyota, BMW, ...}
  @attribute price numeric   %% car price 
  @attribute sales numeric   %% number of cars sold
Run Code Online (Sandbox Code Playgroud)

我需要根据其他属性预测销售数量(数字!).

据我所知,我不能在Weka中使用数字属性进行贝叶斯分类.一种技术是在长度为k的N个区间中分割数值属性的值,而使用标称属性,其中n是类名,如下所示:@attribute class {1,2,3,... N}.

然而,我需要预测的数字属性范围从0到1 000 000.创建1 000 000个类根本没有任何意义.如何用Weka预测数字属性或者在Weka没有这个任务的工具的情况下寻找什么算法?

Sen*_*try 12

你想要做的是回归,而不是分类.区别正是您描述/想要的:

  • 分类具有离散的类/标签,任何名义属性都可以在此处用作类
  • 回归有连续的标签,这里的类是一个错误的术语.

可以通过定义阈值将大多数基于回归的技术转换为二元分类,并且通过预测值是高于还是低于该阈值来确定类别.

我不知道所有提供回归的WEKA分类器,但你可以先看看这两个:

您可能必须使用NominalToBinary过滤器将名义属性转换为数字(二进制​​)属性.