scikit-learn的MDS的正确输入是什么？

Question

我希望这是发布的正确位置 - 如果没有,我愿意改为SO.

无论如何,我使用MDS来帮助我找到数据集的二维表示.基本上,这些是多年蛋白质数据中氨基酸残基的pKa值 - 其核心是相同比例的十进制数.有很多位置(~600行),有很多年(~12列).

我的问题是:MDS是数据矩阵(年份与职位)的正确输入,还是我可以加入相关矩阵(年与年)？我问,因为API文档与书面描述冲突.

API文档说数据矩阵:http://scikit-learn.org/stable/modules/generated/sklearn.manifold.MDS.html#sklearn.manifold.MDS(即n_samples,n_features).

Answer 1

如果您传递dissimilarity='euclidean'给初始估算器(或默认情况下),它将采用数据矩阵并为您计算欧几里德距离矩阵.

如果你通过dissimilarity='precomputed',它需要一个相异矩阵.

尽管如此,文档确实不是很清楚; 我确定一个pull请求在X参数的描述中添加一个简短的注释,并澄清这'euclidean'是默认的(我必须检查源),将被接受.