PoG*_*bas -1 compare r dataset
我需要一些数据分析方面的帮助.
我有两个数据集(之前和之后),我想知道它们之间的差异有多大.
之前
11330 STAT1
2721 STAT2
52438 STAT3
6124 SUZY
Run Code Online (Sandbox Code Playgroud)
后
17401 STAT1
3462 STAT2
0 STAT3
72 SUZY
Run Code Online (Sandbox Code Playgroud)
试图将它们分组tapply(before$V1, before$V2, FUN=mean).
但是当我试图绘制它时,在x轴上我没有得到组名而是数字.如何绘制这样的应用数据(Y轴上的频率和X轴上的组名称)?
还想问一下R中的正确命令是什么来比较这些数据集,因为我愿意找到它们之间的区别?
编辑
输入($ V1之前)
c(11330L,2721L,52438L,6124L)dput($ V2之前)
结构(1:4,.Label = c("STAT1","STAT2","STAT3","SUZY"),class ="factor")
以下是一些想法.
这是我认为你的数据是什么样的?
before <- data.frame(val=c(11330,2721,52438,6124),
lab=c("STAT1","STAT2","STAT3","SUZY"))
after <- data.frame(val=c(17401,3462,0,72),
lab=c("STAT1","STAT2","STAT3","SUZY"))
Run Code Online (Sandbox Code Playgroud)
将它们组合成一个带有period变量的数据框:
combined <- rbind(data.frame(before,period="before"),
data.frame(after,period="after"))
Run Code Online (Sandbox Code Playgroud)
重新格式化为矩阵并用(基数R)绘图dotchart:
library(reshape2)
m <- acast(combined,lab~period,value.var="val")
dotchart(m)
Run Code Online (Sandbox Code Playgroud)
情节ggplot:
library(ggplot2)
qplot(lab,val,colour=period,data=combined)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1559 次 |
| 最近记录: |