R中的分组

Rob*_*ats 5 r cluster-analysis binary-matrix

我想在R中的二进制矩阵上应用byclustering。有一个很好的包叫做“ biclust”,但它确实可以,并且不显示我想要的所有内容。

我有一个二进制矩阵,如下所示:

1 0 0 1 0 1 0
0 0 0 0 0 0 0
0 0 1 0 1 0 0
1 0 0 1 0 1 0
0 0 1 0 1 0 0
1 0 0 1 0 1 0
0 0 0 0 0 0 0
Run Code Online (Sandbox Code Playgroud)

我的目标是将其显示为(并显示)如下(可以是彩色的):

1 1 1 0 0 0 0
1 1 1 0 0 0 0
1 1 1 0 0 0 0
0 0 0 1 1 0 0
0 0 0 1 1 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
Run Code Online (Sandbox Code Playgroud)

设置代码:

# install.packages("biclust") (if necessary)
library("biclust")

testMatrix <- matrix(c(1,0,0,1,0,1,0,
                       0,0,0,0,0,0,0,
                       0,0,1,0,1,0,0,
                       1,0,0,1,0,1,0,
                       0,0,1,0,1,0,0,
                       1,0,0,1,0,1,0,
                       0,0,0,0,0,0,0),
                     nrow = 7,
                     ncol = 7,
                     byrow = TRUE)
Run Code Online (Sandbox Code Playgroud)

我应用了“ biclust” R包的​​biclust函数:

testCluster <- biclust(x = testMatrix, method=BCBimax())
Run Code Online (Sandbox Code Playgroud)

实际上,我得到了预期的两个集群:

An object of class Biclust 
call:
biclust(x = testMatrix, method = BCBimax())
Number of Clusters found:  2 
First  2  Cluster sizes:
                      BC 1  BC 2
Number of Rows:       3     2
Number of Columns:    3     2
Run Code Online (Sandbox Code Playgroud)

我都可以通过以下方式分别显示集群:

drawHeatmap(x = testMatrix, bicResult = testCluster, number = 1) # shown in picture below
drawHeatmap(x = testMatrix, bicResult = testCluster, number = 2)
Run Code Online (Sandbox Code Playgroud)

图片

我可以通过以下方式显示整个群集矩阵(左上角为一个群集):

drawHeatmap2(x = testMatrix, bicResult = testCluster, number = 1) # shown in picture below
drawHeatmap2(x = testMatrix, bicResult = testCluster, number = 2)
Run Code Online (Sandbox Code Playgroud)

图片

到目前为止一切顺利,但我想要:

  1. 显示颜色切换。现在1是红色,0是绿色。
  2. 我想查看原始矩阵的行和列。现在,仅显示了特定群集的行号和列号(使用drawHeatMap),而在整个群集矩阵(drawHeatMap2)上没有行号和列号。
  3. 我想要一个排序良好的聚类矩阵。现在,只有在drawHeatmap2中指定的集群显示在左上角,但是对于矩阵的其余部分,我还希望矩阵的其余部分的其他集群从左上角到右下角排列良好。

这些更改是否可能(使用“ biclust”软件包)?还是用R用另一种方式做更好?

Rob*_*ats 3

更改biclust源码包中的drawHeatmap()函数:

  1. 跟踪(“drawHeatmap”,编辑= TRUE)
  2. 更改以下内容:
    (a) 切换红色和绿色 - 在调用 rgb() 中切换 rvect 和 gvect
    (b) 原始行名而不是​​新行 - 将 'labels=' 更改为 '=bicCols' 和 '=bicRows'。
  3. 打印行号:在关于行的轴之前:cat(bicRows)。
  4. 将行号保存到文件 - 在关于行的轴之前: write(bicRows, file="FILENAME.txt")