我有一个包含这样的数据集:
case,group,val1,val2,val3,val4
1,1,3,5,6,8
2,1,2,7,5,4
3,2,1,3,6,8
4,2,5,4,3,7
5,1,8,6,5,3
Run Code Online (Sandbox Code Playgroud)
我试图以编程方式计算组中值向量之间的欧几里德距离.
这意味着我在n个组中有x个案例.在成对的行之间计算欧氏距离,然后对该组进行平均.因此,在上面的例子中,首先我计算组1的平均值和标准差(情况1,2和5),然后标准化值(即[(原始值 - 平均值)/ st dev],然后计算案例之间的ED 1和案例2,案例2和5,以及案例1和5,最后平均该组的ED.
任何人都可以建议以一种合理有效的方式实现这一目标吗?