将距离矩阵转换并保存为特定格式

Cat*_*ine 17 csv r distance matrix

我通过以下步骤得到了一个距离矩阵:

x <- read.table(textConnection('
     t0 t1 t2
 aaa  0  1  0
 bbb  1  0  1
 ccc  1  1  1
 ddd  1  1  0
 ' ), header=TRUE)
Run Code Online (Sandbox Code Playgroud)

因此x是具有列标题和行标题的数据框

    t0 t1 t2
aaa  0  1  0
bbb  1  0  1
ccc  1  1  1
ddd  1  1  0

require(vegan)
d <- vegdist(x, method="jaccard")
Run Code Online (Sandbox Code Playgroud)

距离矩阵d如下获得:

          aaa       bbb       ccc
bbb 1.0000000                    
ccc 0.6666667 0.3333333          
ddd 0.5000000 0.6666667 0.3333333
Run Code Online (Sandbox Code Playgroud)

通过输入str(d),我发现它不是普通的表格,也不是csv格式.

Class 'dist'  atomic [1:6] 1 0.667 0.5 0.333 0.667 ...
  ..- attr(*, "Size")= int 4
  ..- attr(*, "Labels")= chr [1:4] "aaa" "bbb" "ccc" "ddd"
  ..- attr(*, "Diag")= logi FALSE
  ..- attr(*, "Upper")= logi FALSE
  ..- attr(*, "method")= chr "jaccard"
  ..- attr(*, "call")= language vegdist(x = a, method = "jaccard")
Run Code Online (Sandbox Code Playgroud)

我想用新标题将距离矩阵转换为3列,并将其保存为csv文件,如下所示:

c1  c2  distance
aaa bbb 1.000
aaa ccc 0.6666667
aaa ddd 0.5
bbb ccc 0.3333333
bbb ddd 0.6666667
ccc ddd 0.3333333
Run Code Online (Sandbox Code Playgroud)

Rei*_*son 27

使用基本R函数非常可行.首先,我们希望行的所有成对组合填充列c1c2结果对象.最后一列distance是通过简单地将"dist"对象d转换为数字向量(它已经是一个向量而不是另一个类)来实现的.

第一步是使用combn(rownames(x), 2),第二步是通过以下方式完成as.numeric(d):

m <- data.frame(t(combn(rownames(x),2)), as.numeric(d))
names(m) <- c("c1", "c2", "distance")
Run Code Online (Sandbox Code Playgroud)

这使:

> m
   c1  c2  distance
1 aaa bbb 1.0000000
2 aaa ccc 0.6666667
3 aaa ddd 0.5000000
4 bbb ccc 0.3333333
5 bbb ddd 0.6666667
6 ccc ddd 0.3333333
Run Code Online (Sandbox Code Playgroud)

要另存为CSV文件,write.csv(m, file = "filename.csv").


koh*_*ske 21

你可以通过结合reshape包,upper.tri等的熔化来做到这一点:

> library(reshape)
> m <- as.matrix(d)
> m
          aaa       bbb       ccc       ddd
aaa 0.0000000 1.0000000 0.6666667 0.5000000
bbb 1.0000000 0.0000000 0.3333333 0.6666667
ccc 0.6666667 0.3333333 0.0000000 0.3333333
ddd 0.5000000 0.6666667 0.3333333 0.0000000
> m2 <- melt(m)[melt(upper.tri(m))$value,]
> names(m2) <- c("c1", "c2", "distance")
> m2
    c1  c2  distance
5  aaa bbb 1.0000000
9  aaa ccc 0.6666667
10 bbb ccc 0.3333333
13 aaa ddd 0.5000000
14 bbb ddd 0.6666667
15 ccc ddd 0.3333333
Run Code Online (Sandbox Code Playgroud)