标签: dimensionality-reduction

autoplot(prcomp(df), data = iris, colour = 'Species',
         loadings = TRUE, loadings.colour = 'blue',
         loadings.label = TRUE, loadings.label.size = 3)

Run Code Online (Sandbox Code Playgroud)

https://cran.r-project.org/web/packages/ggfortify/vignettes/plot_pca.html

我更喜欢Python 3w/matplotlib, scikit-learn, and pandas进行数据分析.但是,我不知道如何添加这些？

你怎么能用这些载体绘制matplotlib？

我一直在阅读使用sklearn在PCA中恢复explain_variance_ratio_的功能名称,但尚未弄清楚

这是我如何绘制它 Python

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
from sklearn import decomposition
import seaborn as sns; sns.set_style("whitegrid", {'axes.grid' : False})

%matplotlib inline
np.random.seed(0)

# Iris …

Run Code Online (Sandbox Code Playgroud)

python pca dimensionality-reduction scikit-learn biplot

O.r*_*rka

2018 09-30

10
推荐指数

3
解决办法

1万
查看次数

R中的t-SNE预测

目标:我的目标是在R中使用t-SNE(t分布式随机邻域嵌入)来减少我的训练数据的维数(使用N个观测值和K个变量,其中K >> N),并随后旨在得出t-我的测试数据的SNE表示.

示例:假设我的目标是将K变量减少到D = 2维(对于t-SNE ,通常,D = 2或D = 3).有两个R包:Rtsne而且tsne,我在这里使用前者.

# load packages
library(Rtsne)

# Generate Training Data: random standard normal matrix with J=400 variables and N=100 observations
x.train <- matrix(nrom(n=40000, mean=0, sd=1), nrow=100, ncol=400)

# Generate Test Data: random standard normal vector with N=1 observation for J=400 variables
x.test <- rnorm(n=400, mean=0, sd=1)

# perform t-SNE
set.seed(1)
fit.tsne <- Rtsne(X=x.train, …

Run Code Online (Sandbox Code Playgroud)

r machine-learning dimensionality-reduction

DAW*_*DAW

2017 04-13

10
推荐指数

3
解决办法

1808
查看次数

单词嵌入的维度是什么？

我想理解单词嵌入中"维度"的含义.

当我以NLP任务的矩阵形式嵌入一个单词时,维度扮演什么角色？有没有一个可以帮助我理解这个概念的视觉例子？

nlp terminology dimensionality-reduction word-embedding

man*_*veg

2018 01-03

10
推荐指数

4
解决办法

6793
查看次数

LDA忽略n_components？

当我尝试使用Scikit-Learn的LDA时,它只给我一个组件,即使我要求更多:

>>> from sklearn.lda import LDA
>>> x = np.random.randn(5,5)
>>> y = [True, False, True, False, True]
>>> for i in range(1,6):
...     lda = LDA(n_components=i)
...     model = lda.fit(x,y)
...     model.transform(x)

Run Code Online (Sandbox Code Playgroud)

给

/Users/orthogonal/virtualenvs/osxml/lib/python2.7/site-packages/sklearn/lda.py:161: UserWarning: Variables are collinear
  warnings.warn("Variables are collinear")
array([[-0.12635305],
       [-1.09293574],
       [ 1.83978459],
       [-0.37521856],
       [-0.24527725]])
array([[-0.12635305],
       [-1.09293574],
       [ 1.83978459],
       [-0.37521856],
       [-0.24527725]])
array([[-0.12635305],
       [-1.09293574],
       [ 1.83978459],
       [-0.37521856],
       [-0.24527725]])
array([[-0.12635305],
       [-1.09293574],
       [ 1.83978459],
       [-0.37521856],
       [-0.24527725]])
array([[-0.12635305],
       [-1.09293574],
       [ 1.83978459],
       [-0.37521856],
       [-0.24527725]])

Run Code Online (Sandbox Code Playgroud)

如您所见,它每次只打印一个维度.为什么是这样？它与共线变量有什么关系吗？

另外,当我使用Scikit-Learn的PCA进行此操作时,它会给我我想要的东西.

>>> from sklearn.decomposition import PCA
>>> …

Run Code Online (Sandbox Code Playgroud)

python dimensionality-reduction scikit-learn

And*_*ham

lucky-day

9
推荐指数

1
解决办法

5284
查看次数

scikit KernelPCA不稳定的结果

我正在尝试使用KernelPCA将数据集的维度降低到2D(用于可视化目的和进一步的数据分析).

我尝试使用不同Gamma值的RBF内核计算KernelPCA,但结果不稳定:

阿尼姆

(每帧的Gamma值略有不同,其中Gamma从0到1连续变化)

看起来它不是确定性的.

有没有办法稳定它/使其确定性？

用于生成转换数据的代码:

def pca(X, gamma1):
    kpca = KernelPCA(kernel="rbf", fit_inverse_transform=True, gamma=gamma1)
    X_kpca = kpca.fit_transform(X)
    #X_back = kpca.inverse_transform(X_kpca)
    return X_kpca

Run Code Online (Sandbox Code Playgroud)

python pca dimensionality-reduction scikit-learn

ffe*_*rri

2015 07-02

7
推荐指数

1
解决办法

707
查看次数