我希望对缺少列的数据进行聚类.手动执行我会在没有此列的情况下计算缺少列的距离.
使用scikit-learn,无法获取缺失的数据.也没有机会指定用户距离功能.
有没有机会聚集丢失的数据?
示例数据:
n_samples = 1500
noise = 0.05
X, _ = make_swiss_roll(n_samples, noise)
rnd = np.random.rand(X.shape[0],X.shape[1])
X[rnd<0.1] = np.nan
Run Code Online (Sandbox Code Playgroud)