Python中SVM的主动​​学习(例如池抽样)

DrT*_*cky 5 python machine-learning svm

我正在研究一个可以从主动学习协议中获益的问题(例如,与现有模型相比,给定一组未标记的数据,该算法要求未标记数据的子集由'oracle'标记).

有没有人有任何主动学习的例子(使用池抽样,委员会查询或其他方式)在SVM中实现(最好是在python中)?

lej*_*lot 10

在python中实现主动学习非常简单.对于最简单的情况,您只需选择要查询的新样本,其在您学习的SVM(简单不确定性采样)上具有最小的decision_function绝对值,这基本上是单行长!假设你有一个二进制分类,有训练有素的svm clf和一些未标记的例子X,你只需选择

sample = X[np.argmin(np.abs(clf.decision_function(X)))] 
Run Code Online (Sandbox Code Playgroud)

您也可以在github上找到许多不同的实现,比如去年的ECML中的AL文件:https://github.com/gmum/mlls2015