我看到了excel生成的情节,我想知道R是否也可以做到.
这张图片基本上是交叉表的可视化,比较了当天的天数与当天的首选膳食以及计算属于这些类别的人数.
我已经阅读了一些R气泡图,但我还没有看到这样的一个.有人能指出我的包裹或网站,解释我如何制作这样的情节?
我想在unix中将两个文件合并为一列.
我有file_a:
subjectid name age
12 Jane 16
24 Kristen 90
15 Clarke 78
23 Joann 31
Run Code Online (Sandbox Code Playgroud)
我有另一个file_b:
subjectid prob_disease
12 0.009
24 0.738
15 0.392
23 1.2E-5
Run Code Online (Sandbox Code Playgroud)
我想在命令行中合并这些文件.我想通过subjectid合并文件a和b.由于每个文件大约有200万行,我试过R但由于数据量大而冻结,有人可以帮我在linux中做这个吗?期望的输出:
subjectid prob_disease name age
12 0.009 Jane 16
24 0.738 Kristen 90
15 0.392 Clarke 78
23 1.2E-5 Joanna 31
Run Code Online (Sandbox Code Playgroud)
请帮助,谢谢!
我正在使用汽车包中的scatterplot函数来生成散点图.我希望能够在图中生成一个应该是x = y的参考线.我尝试使用abline,它确实添加了一条线,但它不是x = y线.有人可以帮忙吗?
我的代码如下:
scatterplot(phenos$P1~pheno$P0, data=pheno,spread=FALSE,ylab="6 month timepoint", xlab="Baseline Timepoint", jitter=list(x=1, y=1))
abline(0,1)
Run Code Online (Sandbox Code Playgroud)
谢谢.
您好我正在尝试通过在ggplot中使用hexplots来查看可视化数据集的不同方法.我基本上想要一个带有1.黄土线2的十六进制图.回归线3.x = y线 - >相当于abline(0,1)
到目前为止,我已经提出了这种代码:
c <- ggplot(mtcars, aes(qsec, wt))
c+stat_binhex()+stat_smooth(method="loess", colour="red")+stat_smooth(method='lm', se=FALSE, colour="orange")+ geom_abline(intercept=0, slope=1)
Run Code Online (Sandbox Code Playgroud)
这给出了下图,但我仍然没有看到x = y参考线.请帮忙.我不确定为什么它不起作用.谢谢

我有一个包含纵向数据的数据框,如下所示
测试
Names hr1 hr2 hr3 hr4 workhr_bin
41 80 76 70 60 7
42 80 74 75 NA 8
43 85 NA 60 65 6
44 NA NA NA 60 3
45 80 70 NA NA 8
46 NA NA NA 60 3
Run Code Online (Sandbox Code Playgroud)
hr1、hr2、hr3、的变量hr4包括“姓名”列下的受试者以重复的时间间隔报告的服务时间。“workhr_bin”列包括使用分位数函数获得的 bin。总共有 10 个垃圾箱,1:10。
我正在尝试生成多个由垃圾箱组成的小时意大利面图。本质上它应该产生 10 个图,一个图用于 bin 1 中的数据,另一个图用于数据 bin 2 等。
我尝试这样做:
head(melt(test[,c(2:6)]))
Run Code Online (Sandbox Code Playgroud)
但我最终得到的workhr_bin变量消失了,取而代之的是一个像这样的文件:
variable value
1 hours1 80
2 hours1 80
3 hours1 85 …Run Code Online (Sandbox Code Playgroud) 我有一个数据框,给出了同一个州提供的人的成对相关性.我给出了一个关于我希望如何处理这些数据的小例子,但是现在我的实际数据集有成对相关的1500万行和更多的附加列.
以下是示例数据:
>sample_data
Pair_1ID Pair_2ID CORR
1 2 0.12
1 3 0.23
2 1 0.12
2 3 0.75
3 1 0.23
3 2 0.75
Run Code Online (Sandbox Code Playgroud)
我想生成一个没有重复的新数据帧,例如在第1行中,人1和2之间的相关性是0.12.第1行与第3行相同,它显示了2和1之间的相关性.由于它们具有相同的信息,我希望最终文件没有重复,我想要一个类似下面的文件:
>output
Pair_1ID Pair_2ID CORR
1 2 0.12
1 3 0.23
2 3 0.75
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?独特的命令不适用于此,我不知道该怎么做.
我有一个文件,其矩阵为500行(二进制分数)和120列.该文件是0和1的简单矩阵.
>file
00010010101010
01001010100101
00101001010001
11110101001010
Run Code Online (Sandbox Code Playgroud)
我正在编写一个函数,它使用特殊的相关公式来查找行之间的这种相关性.它需要两个向量行作为输入fn(row1,row2).例如.row1和row2并计算此特殊关联.
例
>fn(file[1,], file[2,])
>0.32
Run Code Online (Sandbox Code Playgroud)
我能够两行但是如何为所有行创建500x500相关矩阵.有人可以帮忙吗?谢谢.
我有一个非常大但与此非常相似的数据框:
df <- data.frame(Group = rep(c('A', 'B', 'C', 'D'), 50),
Number = sample(1:100, 200, replace = T))
Group Number
A 52
B 74
C 22
D 90
A 7
B 93
C 50
D 10
A 31
B 19
Run Code Online (Sandbox Code Playgroud)
我有另一个名为"remove"的数据框,如下所示:
>remove
Group Number
A 52
C 22
B 93
D 10
Run Code Online (Sandbox Code Playgroud)
如何对df数据进行子集,以便在"remove"中排除所有具有Group和Number值的行以获取以下数据帧?该文件非常大,因此我无法手动输入要排除的值.期望的输出:
Group Number
B 74
D 90
A 7
C 50
A 31
B 19
Run Code Online (Sandbox Code Playgroud)
谢谢!