我已经使用sklearn框架实现了LinearSVC和SVC进行文本分类.我使用TfidfVectorizer来获取由两个不同类(良性数据和恶意数据)组成的输入数据的稀疏表示.这部分工作得非常好,但现在我想通过使用OneClassSVM分类器并仅使用一个类(异常值检测...)训练模型来实现某种异常检测.不幸的是,它不适用于稀疏数据.一些开发人员正在开发一个补丁(https://github.com/scikit-learn/scikit-learn/pull/1586)但是有一些错误,所以还没有使用OneClassSVM实现的解决方案.
在sklearn框架中是否有其他方法可以做类似的事情?我正在查看这些示例,但似乎没有任何内容.
谢谢!