小编Ale*_*der的帖子

比较R中的字符向量以查找唯一和/或缺失值

我有两个字符向量,x和y.

x <- c("a", "b", "c", "d", "e", "f", "g")
y <- c("a",      "c", "d", "e",      "g")
Run Code Online (Sandbox Code Playgroud)

x内的值不会重复(即它们都是唯一的).矢量y也是如此.我的问题是,如何让R比较两个向量,然后告诉我哪些元素相对于x缺少y?否则说明,我希望R告诉我y中缺少"b"和"f".

(注意,在我的实际数据中,x和y每个包含几千个观察,这就是我想以编程方式执行此操作的原因.可能有一个非常简单的答案,但我不确定在R中搜索什么帮助文件).

感谢任何能提供帮助的人!

statistics coding-style r character-encoding

18
推荐指数
3
解决办法
3万
查看次数

在R中使用多核来分析GWAS数据

我正在使用R来分析全基因组关联研究数据.我有大约500,000个潜在的预测变量(单核苷酸多态性或SNP),并且想要测试它们之间的关联和连续结果(在这种情况下血液中的低密度脂蛋白浓度).

我已经编写了一个没有问题的脚本.简要说明一下,我有一个名为"Data"的数据对象.每行对应于研究中的特定患者.有年龄,性别,体重指数(BMI)和血液LDL浓度的列.SNP数据还有50万个其他列.

我目前正在使用for循环来运行线性模型五十万次,如图所示:

# Repeat loop half a million times
for(i in 1:500000) {

# Select the appropriate SNP
SNP <- Data[i]

# For each iteration, perform linear regression adjusted for age, gender, and BMI and save the result in an object called "GenoMod"
GenoMod  <- lm(bloodLDLlevel ~ SNP + Age + Gender + BMI, data = Data)

# For each model, save the p value and error for each SNP. I save these two data points in columns 1 …
Run Code Online (Sandbox Code Playgroud)

statistics foreach multicore r lapply

7
推荐指数
1
解决办法
1246
查看次数

合并R中具有共同和不常见样本的两个数据帧

我有两个数据框,Data1和Data2,我想根据变量"ID"合并.

此示例数据可在此处下载:http://dl.dropbox.com/u/52600559/example.RData

这是第一个数据框:

> Data1
   ID     Fruit  Color Weight
1   1     Apple    Red      5
2   2    Orange Orange      7
3   3    Banana Yellow      3
4   4      Pear  Green      5
5   5    Tomato    Red      4
6   6     Berry   Blue      4
7   7  Mandarin Orange      4
8   8 Pineapple Yellow      9
9   9 Nectarine Orange      5
10 10      Beet    Red      5
Run Code Online (Sandbox Code Playgroud)

这是第二个数据框:

> Data2
   ID       Fruit  Color Weight
1   1       Apple    Red      5
2   2      Orange Orange      7
3 …
Run Code Online (Sandbox Code Playgroud)

merge r unique

6
推荐指数
1
解决办法
3612
查看次数

绘图不适合 R 窗口

我正在使用metaR 中的包来对比例进行元分析。我的分析中有大约一百项研究。当我输入forest(result)以创建我的森林图时,它可以工作,但图形在顶部和底部被切掉。无论我做什么,它都不适合绘图窗口!我很难过如何解决这个问题。有任何想法吗?

在此处输入图片说明

statistics graphics plot r image-resizing

5
推荐指数
1
解决办法
5828
查看次数

简化 R 中按分类变量分层的汇总统计输出

正在使用的程序

我正在使用统计程序R来分析一些数据,并提出一个可能相当简单的问题。

问题的背景

我有一个充满数值的变量,称为study_data$LN_reviewed. 我还有一个名为的变量study_data$Gender,它包含研究中每个受试者的性别。我想计算一些按性别分层的简单汇总统计数据。使用下面所示的代码很容易做到这一点:

> by(study_data$LN_reviewed, study_data$Gender, summary)

study_data$Gender: FEMALE
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
2.00   13.00   19.00   27.77   35.50  125.00 
------------------------------------------------
study_data$Gender: MALE
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
1.00   12.00   19.00   26.98   34.00  122.00 
Run Code Online (Sandbox Code Playgroud)

我的问题

我怎样才能让R以更容易理解的格式显示这些信息?具体来说,我想要一个包含两行,标题为“FEMALE”和“MALE”,以及六列,标题为“Min.”、“1st Qu.”、“Median”、“Mean”、“3rd Qu.”的表。和“最大”,如下所示。

       Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
FEMALE 2.00   13.00   19.00   27.77   35.50  125.00
MALE   1.00   12.00   19.00   26.98   34.00  122.00
Run Code Online (Sandbox Code Playgroud)

我花了一些时间尝试自己解决它,但一直无法找到解决方案。

r categorical-data

1
推荐指数
1
解决办法
4667
查看次数