如何将一个变量与R上的所有其他变量相关联

use*_*533 8 variables r correlation

我想将一个变量(比如酪氨酸)与R上的所有其他变量(大约200种其他代谢物,如尿素,葡萄糖,肌苷等)联系起来,我不知道该怎么做.我是R.的新手

我已经学会了配对功能,但它将指定范围内的每种代谢物配对到另一种.

谢谢!

jlh*_*ard 11

既然你提到"代谢物",我假设你的度量是"浓度",例如你有一个矩阵,称它为data每个代谢物有一列,每个样品有一行.

所以,像这样:

# just generates example - YOU SHOULD PROVIDE THIS!!!
data <- data.frame(tyrosine=1:10 + rnorm(10,sd=2), 
                   urea    =2*1:10 + rnorm(10,sd=2),
                   glucose =30 -2*1:10 +rnorm(10,sd=2),
                   inosine =25 -1:10 + rnorm(10,sd=2))
data
     tyrosine      urea  glucose  inosine
1  -0.2529076  5.023562 29.83795 26.71736
2   2.3672866  4.779686 27.56427 22.79442
3   1.3287428  4.757519 24.14913 22.77534
4   7.1905616  3.570600 18.02130 20.89239
5   5.6590155 12.249862 21.23965 17.24588
6   4.3590632 11.910133 17.88774 18.17001
7   7.9748581 13.967619 15.68841 17.21142
8   9.4766494 17.887672 11.05850 16.88137
9  10.1515627 19.642442 11.04370 18.20005
10  9.3892232 21.187803 10.83588 16.52635
Run Code Online (Sandbox Code Playgroud)

要获得相关系数,只需键入:

cor(data)
           tyrosine       urea    glucose    inosine
tyrosine  1.0000000  0.8087897 -0.9545523 -0.8512938
urea      0.8087897  1.0000000 -0.8577782 -0.8086910
glucose  -0.9545523 -0.8577782  1.0000000  0.8608000
inosine  -0.8512938 -0.8086910  0.8608000  1.0000000
Run Code Online (Sandbox Code Playgroud)

要生成散点图矩阵,只需键入:

pairs(data)
Run Code Online (Sandbox Code Playgroud)

将来,请提供可导入R的数据示例.

  • 当然,`cor(数据$酪氨酸,数据)`做到了. (3认同)
  • 不知道你怎么/为什么得到-1 (2认同)

Mar*_*box 9

在下面的示例中,我只是将包含所有变量的数据框拆分为两个矩阵.可以将这些输入到cor函数中以获取相关值:

set.seed(1)
n=20
df <- data.frame(tyrosine=runif(n), urea=runif(n), glucose=runif(n), inosine=runif(n))
df

COR <- cor(as.matrix(df[,1]), as.matrix(df[,-1]))
COR
#           urea    glucose    inosine
#[1,] -0.2373854 -0.3672984 -0.3393602
Run Code Online (Sandbox Code Playgroud)


Ste*_*son 6

类似于Marc,在框中使用Apply和column名称

> set.seed(1)
> n=20
> df <- data.frame(tyrosine=runif(n), urea=runif(n), glucose=runif(n), 
  inosine=runif(n))

> apply(df,2, function(col)cor(col, df$tyrosine))

tyrosine       urea    glucose    inosine 
1.0000000 -0.2373854 -0.3672984 -0.3393602 
Run Code Online (Sandbox Code Playgroud)

这是一个很好的问题,并且知道适当大小的数据是一种模式,因为如果您只希望酪氨酸cors(OP明确要求的话)仅计算酪氨酸cors(n时间+空间),而不是全部与全部(〜n),这将非常有效。 ^ 2时间+空间)。