Nil*_*age 1 python cluster-analysis machine-learning matplotlib svd
我是机器学习的新手,最近几天正在尝试使用奇异值分解(SVD)。基于x和y值,我使用绘制了以下图matplotlib。我正在检测网络用户的异常活动。在此图中,离群点很少。我想确定谁属于这些异常值。
为了使它更易于理解,我们采用以下数据集。
基于网页访问的原始矩阵。
matrix = mat( [[1,0,0,1,1,0,1,0,1,0], [1,0,0,0,1,0,1,0,1,1],[1,0,1,0,1,0,0,0,1,0],[0,1,1,1,0,1,0,1,0,0],[1,1,0,0,1,0,1,1,1,1],[0,0,1,0,1,1,0,1,0,0],[1,1,0,1,0,1,0,0,1,0],[1,0,0,0,1,0,1,1,1,1],[0,1,1,0,1,0,1,0,0,0],[1,1,0,1,0,1,0,1,1,0]] )
Run Code Online (Sandbox Code Playgroud)
SVD计算后的x,y坐标。
x = [-0.34095692,-0.34044722,-0.27155318,-0.21320583,-0.44657865,-0.19587836, -0.29414279, -0.3948753 ,-0.21655774 , -0.34857087]
y = [0.16305762,0.38554548, 0.10412536, -0.57981103, 0.17927523, -0.22612216, -0.34569697, 0.30463137,0.01301744,-0.42661108]
Run Code Online (Sandbox Code Playgroud)
我想要的是找到谁属于给定的数据点。像明智的大数据集情节中如何找到异常值的标识?希望你理解我的问题。

我建议您仔细阅读以下内容:
http://scikit-learn.org/stable/modules/outlier_detection.html
OneClassSVM可以检测离群值:http : //scikit-learn.org/stable/modules/generated/sklearn.svm.OneClassSVM.html与另一个数据集一起检查:http : //scikit-learn.org/stable/auto_examples/svm/ plot_oneclass.html
| 归档时间: |
|
| 查看次数: |
4192 次 |
| 最近记录: |