基 R 中排列之间的 Kendall tau 距离(又名冒泡排序距离)

Mus*_*ful 5 algorithm r permutation

如何在 R 中计算两个排列之间的 Kendall tau 距离(又名冒泡排序距离)而不加载额外的库?

Mus*_*ful 5

这是在阅读后拼凑而成的 O(n.log(n)) 实现,但我怀疑可能有更好的 R 解决方案。

inversionNumber <- function(x){
    mergeSort <- function(x){
        if(length(x) == 1){
            inv <- 0
            #printind(' base case')
        } else {
            n <- length(x)
            n1 <- ceiling(n/2)
            n2 <- n-n1
            y1 <- mergeSort(x[1:n1])
            y2 <- mergeSort(x[n1+1:n2])
            inv <- y1$inversions + y2$inversions
            x1 <- y1$sortedVector
            x2 <- y2$sortedVector
            i1 <- 1
            i2 <- 1
            while(i1+i2 <= n1+n2+1){
                if(i2 > n2 || (i1 <= n1 && x1[i1] <= x2[i2])){ # ***
                    x[i1+i2-1] <- x1[i1]
                    i1 <- i1 + 1
                } else {
                    inv <- inv + n1 + 1 - i1
                    x[i1+i2-1] <- x2[i2]
                    i2 <- i2 + 1
                }
            }
        }
        return (list(inversions=inv,sortedVector=x))
    }
    r <- mergeSort(x)
    return (r$inversions)
}
Run Code Online (Sandbox Code Playgroud)

kendallTauDistance <- function(x,y){
    return(inversionNumber(order(x)[rank(y)]))
}
Run Code Online (Sandbox Code Playgroud)

如果需要自定义打破平局,则必须修改标记行上的最后一个条件# ***

用法:

> kendallTauDistance(c(1,2,4,3),c(2,3,1,4))
[1] 3
Run Code Online (Sandbox Code Playgroud)