标签: knn

> summary(train1)
       V1                V2             V3             
 13     : 10474   1      :  6435   7      :  8929     
 10     : 10315   2      :  6435   6      :  8895     
 4      : 10272   3      :  6435   9      :  8892     
 1      : 10244   4      :  6435   10     :  8892     
 2      : 10238   7      :  6435   15     :  8874     
 24     : 10228   8      :  6435   40     :  8870                        
 (Other):359799   (Other):382960   (Other):368218

Run Code Online (Sandbox Code Playgroud)

虽然这个不起作用:

> summary(train2)
        V1              V2               V3                   V4      
 13     : 10474   1      :  6436   7      :  8929   Christmas …

Run Code Online (Sandbox Code Playgroud)

regression r knn r-caret

the*_*ech

2015 01-11

8
推荐指数

1
解决办法

1894
查看次数

KNN算法在训练阶段做了什么？

与线性回归等其他算法不同，KNN 在训练阶段似乎不执行任何计算。就像在线性回归的情况下，它在训练阶段找到系数。但是 KNN 呢？

machine-learning knn scikit-learn

use*_*143

2020 05-24

8
推荐指数

2
解决办法

2478
查看次数

使用R获取KNN分类器的决策边界

我正在尝试拟合KNN模型并使用R中的ISLR包中的Auto数据集获取决策边界。

在这里，我很难确定3类问题的决策边界。到目前为止，这是我的代码。我无法确定决策边界。

我在该网站的其他地方看到了使用ggplot解决此类问题的答案。但是我想使用plot函数以经典方式获得答案。

 library("ISLR")

trainxx=Auto[,c(1,3)]
trainyy=(Auto[,8])

n.grid1 <- 50

x1.grid1 <- seq(f = min(trainxx[, 1]), t = max(trainxx[, 1]), l = n.grid1)
x2.grid1 <- seq(f = min(trainxx[, 2]), t = max(trainxx[, 2]), l = n.grid1)
grid <- expand.grid(x1.grid1, x2.grid1)

library("class")
mod.opt <- knn(trainxx, grid, trainyy, k = 10, prob = T)

prob_knn <- attr(mod.opt, "prob")

Run Code Online (Sandbox Code Playgroud)

我的问题主要是在此代码段之后。我非常确定我必须修改以下部分。但是我不知道如何。我是否需要在此处使用“嵌套的条件”？

prob_knn <- ifelse(mod.opt == "3", prob_knn, 1 - prob_knn) 



prob_knn <- matrix(prob_knn, n.grid1, n.grid1)


plot(trainxx, col = ifelse(trainyy == "3", "green",ifelse(trainyy=="2", "red","blue")))
title(main = …

Run Code Online (Sandbox Code Playgroud)

r classification machine-learning knn

stu*_*123

2019 03-14

8
推荐指数

1
解决办法

282
查看次数

正在获取TypeError：'（slice（None，None，None），0）'是无效的密钥

试图绘制k-NN分类器的决策边界，但无法这样做，但得到TypeError：'（slice（None，None，None），0）'是无效键`

    h = .01  # step size in the mesh

    # Create color maps
    cmap_light = ListedColormap(['#FFAAAA', '#AAFFAA', '#AAAAFF','#AFAFAF'])
    cmap_bold  = ListedColormap(['#FF0000', '#00FF00', '#0000FF','#AFAFAF'])

    for weights in ['uniform', 'distance']:
        # we create an instance of Neighbours Classifier and fit the data.
        clf = KNeighborsClassifier(n_neighbors=6, weights=weights)
        clf.fit(X_train, y_train)

        # Plot the decision boundary. For that, we will assign a color to each
        # point in the mesh [x_min, x_max]x[y_min, y_max].
        x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1 …

Run Code Online (Sandbox Code Playgroud)

python machine-learning knn

Unk*_*own

2019 05-16

8
推荐指数

6
解决办法

1万
查看次数

How to use Dynamic Time warping with kNN in python

I have a time-series dataset with two lables (0 and 1). I am using Dynamic Time Warping (DTW) as a similarity measure for classification using k-nearest neighbour (kNN) as described in these two wonderful blog posts:

https://nbviewer.jupyter.org/github/markdregan/K-Nearest-Neighbors-with-Dynamic-Time-Warping/blob/master/K_Nearest_Neighbor_Dynamic_Time_Warping.ipynb

http://alexminnaar.com/2014/04/16/Time-Series-Classification-and-Clustering-with-Python.html

Arguments
---------
n_neighbors : int, optional (default = 5)
    Number of neighbors to use by default for KNN

max_warping_window : int, optional (default = infinity)
    Maximum warping window allowed by the DTW dynamic
    programming function

subsample_step : int, optional (default …

Run Code Online (Sandbox Code Playgroud)

python classification time-series knn scikit-learn

EmJ*_*EmJ

2019 07-19

8
推荐指数

1
解决办法

8476
查看次数

如何将距离转换为概率？

有人为我的matlab程序发光吗？我有来自两个传感器的数据,我正在kNN分别对它们进行分类.在这两种情况下,训练集看起来像一组总共42行的向量,如下所示:

[44 12 53 29 35 30 49;

 54 36 58 30 38 24 37;..]

Run Code Online (Sandbox Code Playgroud)

然后我得到一个样本,例如[40 30 50 25 40 25 30],我想将样本分类到最近的邻居.作为接近度的标准,我使用欧几里德度量,sqrt(sum(Y ²)),其中Y是每个元素之间的差异,它给出了Sample和每个训练集类别之间的距离数组.

那么,有两个问题:

是否可以将距离转换为概率分布,如:Class1:60%,Class 2:30%,Class 3:5%,Class 5:1%等.

补充:到目前为止我正在使用公式:probability = distance/sum of distances但我无法绘制正确的cdf或直方图.这给了我一些分布,但我看到了一个问题,因为如果距离很大,例如700,那么最接近的类将获得最大的概率,但它是错的,因为距离太大而不能与任何课程相比.

如果我能够获得两个概率密度函数,我想我会做一些它们的产品.可能吗？

任何帮助或评论都非常感谢.

matlab classification knn euclidean-distance probability-density

nik*_*dry

2014 05-05

7
推荐指数

2
解决办法

5832
查看次数

标签统计

knn ×10

machine-learning ×4

classification ×3

scikit-learn ×3

nearest-neighbor ×2

python ×2

r ×2

algorithm ×1

c ×1

c++ ×1

decision-tree ×1

euclidean-distance ×1

kdtree ×1

matlab ×1

parallel-processing ×1

probability-density ×1

r-caret ×1

regression ×1

search ×1

time-series ×1

标签 统计

标签统计