我在 100D 中有大约 3000 个数据点,我使用 t-SNE 投影到 2D。每个数据点属于三个类之一。但是,当我在两台不同的计算机上运行脚本时,我总是得到不一致的结果。当我使用随机种子时,预计会出现一些不一致,但是其中一台计算机不断获得更好的结果(我在 Ubuntu 上使用 macbook pro 和固定机器)。
我使用 Scikit-learn 的 t-SNE 实现。脚本和数据是相同的,我已经手动复制了文件夹以确保。相关的代码片段如下所示:
X_vectors, X_labels = self.load_data(spec_path, sound_path, subset)
tsne = TSNE(n_components=2, perplexity=25, random_state=None)
Y = tsne.fit_transform(X_vectors)
self.plot(X_labels, Y[:, 0], Y[:, 1], Y)
Run Code Online (Sandbox Code Playgroud)
第一张图片是从 macbook 生成的一个样本,我已经运行了几次,它总是在相同的 x/y 范围内生成类似的形状。第二个来自 Ubuntu,显然更好,我再次运行它几次以确保它继续产生更好的结果,与 mac 相比总是在更高的 x/y 范围内。不确定我在这里没有看到什么,很可能我错过了一些明显的东西。