使用LIBSVM来预测用户的真实性

ruw*_*ego 7 java machine-learning prediction weka libsvm

我计划使用LibSVM来预测Web应用程序中的用户真实性.(1)收集有关特定用户行为的数据(例如,登录时间,IP地址,国家等).(2)使用收集的数据训练SVM(3)使用实时数据比较并生成真实性水平的输出

有人可以告诉我如何用LibSVM做这样的事情?Weka能帮助解决这些类型的问题吗?

Fre*_*Foo 5

您提到的三个步骤是解决方案的概述.更详细一些:

  1. 确保获得大量标记数据,即使用真实/非真实注释的行为日志.(如果没有标记数据,您将进入半监督学习的非常先进的领域,或者必须考虑其他解决方案.)
  2. 根据您认为可以很好地预测真实性的数据设计许多功能.尝试使用该方法并对其进行优化,直到它通过某种统计标准运行良好.使用十倍交叉验证确保您不会过度拟合.
  3. LibSVM可以输出概率估计值及其答案; 见其手册第8节.