不同大小数组的协方差近似

Question

NumPy/SciPy 中是否有任何通用工具来计算即使输入变量大小不同也能工作的相关性度量？在协方差和相关性的标准公式中，需要对每个不同的待测变量具有相同数量的观测值。通常，您必须传递一个矩阵，其中每一行是一个不同的变量，每一列代表一个不同的观察值。

在我的例子中，我有 9 个不同的变量，但对于每个变量，观察的数量不是恒定的。一些变量比其他变量有更多的观察。我知道有像传感器融合这样的领域研究这样的问题，那么有哪些标准工具可以计算不同长度的数据系列的关系统计（最好是在 Python 中）？

Answer 1

从纯粹的数学角度来看，我相信它们必须是相同的。为了使它们相同，您可以应用一些与丢失数据问题相关的概念。我想我是说，如果向量大小不同，它就不再是严格的协方差。无论您使用什么工具，都只会以某种智能方式弥补一些点，以使向量长度相等。

@EMS 现在你有一个 13 x 9 矩阵。按照 numpy 文档中的说明创建另一个 13 x 9 掩码矩阵，标记矩阵中的哪些条目具有值 -1 （或其他值）。这些是您丢失的数据。现在你可以使用 numpy 函数做任何你想做的事情。 (3认同)