标签: unsupervised-learning

digits = 0:9
# set seed for reproducibility
set.seed(17)
# function to create random string
createRandString <- function(n = 5000) {
  a <- do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
  paste0(a, sprintf("%04d", sample(9999, n, TRUE)), sample(LETTERS, n, TRUE))
}

df <- data.frame(ID=c(1:10), name=sample(letters[1:10]),
                 studLoc=sample(createRandString(10)),
                 finalmark=sample(c(0:100),10),
                 subj1mark=sample(c(0:100),10),subj2mark=sample(c(0:100),10)
                 )

Run Code Online (Sandbox Code Playgroud)

我使用软件包执行无监督功能选择 FactoMineR

df.princomp <- FactoMineR::FAMD(df, graph = FALSE)

Run Code Online (Sandbox Code Playgroud)

该变量df.princomp是一个列表。

之后，为了可视化我使用fviz_screeplot()和fviz_contrib()喜欢的主要成分，

#library(factoextra)
factoextra::fviz_screeplot(df.princomp, addlabels = TRUE,
                           barfill = "gray", barcolor = "black",
                           ylim = c(0, 50), xlab …

Run Code Online (Sandbox Code Playgroud)

r cluster-analysis pca feature-selection unsupervised-learning

mnm*_*mnm

2018 07-21

5
推荐指数

1
解决办法

369
查看次数

将目标/标签数据传递到Scikit学习GridSearchCV的适用于OneClassSVM的fit方法

据我了解，One-Class SVM在没有目标/标签数据的情况下进行了培训。

将OneClassSVM与GridSearchCV结合使用时的一个答案是，建议在分类器为时将Target / Label数据传递给GridSearchCV的fit方法OneClassSVM。

该GridSearchCV方法如何处理这些数据？

它实际上是否在OneClassSVM没有目标/标签数据的情况下训练，而仅使用目标/标签数据进行评估？

我尝试遵循GridSearchCV源代码，但找不到答案。

svm unsupervised-learning scikit-learn gridsearchcv one-class-classification

use*_*622

2019 10-13

5
推荐指数

1
解决办法

85
查看次数

选择适当的相似性度量并评估k均值聚类模型的有效性

我已经实现了k-means聚类来确定300个对象中的聚类.我的每个物体都有大约30个维度.使用欧几里德度量计算距离.

我需要知道

我如何确定我的算法是否正常工作？我不能有一个图表来说明我的算法的正确性.
欧几里德距离是计算距离的正确方法吗？如果我有100个维度而不是30个怎么办？

cluster-analysis machine-learning k-means unsupervised-learning

use*_*556

2011 11-14

4
推荐指数

1
解决办法

3648
查看次数

隐马尔可夫模型：精度是否可能随着状态数量的增加而降低？

我使用Baum-Welch算法构造了两个隐马尔可夫模型，以处理越来越多的状态。我注意到在8个州之后，验证得分下降了8个以上州。所以我想知道，由于某种过度拟合，隐马尔可夫模型的准确性是否可能随着状态数量的增加而降低？

提前致谢！

machine-learning markov markov-models hidden-markov-models unsupervised-learning

Tho*_*tyn

lucky-day

4
推荐指数

1
解决办法

1788
查看次数

如何使用 keras/tensorflow 构建无监督的 CNN 模型？

我正在尝试为图像到图像的翻译应用程序构建 CNN，模型的输入是图像，输出是置信度图。在训练期间没有标记的置信度作为基本事实，但设计了一个损失函数来引导模型获得正确的输出。

我在用 keras 构建神经网络时遇到了麻烦，因为 model.fit() 函数需要训练数据和标记数据（地面实况数据）。

所以我的问题是，有没有办法用 keras 或 tensorflow 构建一个无监督的 CNN？如果是这样，我应该怎么做才能建立一个？是否有应用示例或我可以参考的内容？

提前致谢！

python-3.x unsupervised-learning keras tensorflow

Jem*_*mma

2019 04-15

4
推荐指数

1
解决办法

3937
查看次数

在KMeans聚类之后找到聚类的长度（与聚类关联的点数）（scikit学习）

我已经使用sklearn使用Kmeans完成了聚类。尽管它有一种打印质心的方法，但我发现scikit-learn没有找到簇长的方法（或者到目前为止我还没有看到它）真是太奇怪了。是否有一种巧妙的方法来获取每个群集的群集长度或与群集关联的许多点？我现在有这个相当笨拙的代码，在我发现长度为一的簇的情况下，并且需要通过测量点之间的欧几里得距离来向该簇添加其他点，并且必须更新标签

import numpy as np
from clustering.clusternew import Kmeans_clu
from evolution.generate import reproduction
from mapping.somnew import mapping, no_of_neurons, neuron_weights_init
from population_creation.population import pop_create
from New_SOL import newsol


data = genfromtxt('iris.csv', delimiter=',', skip_header=0, usecols=range(0, 4)) ##Read the input data
actual_label = genfromtxt('iris.csv', delimiter=',', dtype=str,skip_header=0, usecols=(4))
chromosome = int(input("Enter the number of chromosomes: "))  #Input the population size
max_gen = int(input("Enter the maximum number of generation: "))  #Input the maximum number of generation

for i in range(0, chromosome):
    cluster = 3#random.randint(2, max_cluster) …

Run Code Online (Sandbox Code Playgroud)

python machine-learning k-means unsupervised-learning scikit-learn

Shi*_*rma

2018 06-08

3
推荐指数

1
解决办法

3279
查看次数