我有一个看起来像这样的数据.
我打算在一个图中创建多个密度曲线,其中每个曲线对应于唯一ID.
我尝试使用"sm"包,使用此代码,但没有成功.
library(sm)
dat <- read.table("mydat.txt");
plotfn <- ("~/Desktop/flowgram_superimposed.pdf");
pdf(plotfn);
sm.density.compare(dat$V1,dat$V2, xlab = "Flow Signal")
colfill <- c(2:10);
legend(locator(1), levels(dat$V2), fill=colfill)
dev.off();
Run Code Online (Sandbox Code Playgroud)
请告知正确的方法是什么,或者是否有其他方法可以做到这一点?
我想在最后得到这种情节. 图http://img524.imageshack.us/img524/2736/testl.png
我已经花了几个星期的时间学习一些R而且我对它的光滑和强大感到很沮丧.我正在使用它来绘制从SQL查询返回的一些数据,我希望能够通过Web门户与我合作的其他人共享这些图.
我意识到我可以创建一个cron作业来运行Web服务器上的R脚本,每天创建图表,从网站上查看图像.但有什么方法可以设置,只有当用户查看页面时才创建图像?这样我就可以创建一个Web界面,让用户为SQL查询选择日期范围等.(然后让R分析数据并绘制它)
有什么建议?
使用fractions库MASS中的函数,我可以将小数转换为分数:
> fractions(.375)
[1] 3/8
Run Code Online (Sandbox Code Playgroud)
但那么如何提取分子和分母呢?帮助fractions提到了一个属性"压裂",但我似乎无法访问它.
我想将这种类型的数值转换为日期,但它不起作用.
20100727 例如
我试图将数字转换为字符并应用此:
as.Date("20100727", "Y%d%m")
Run Code Online (Sandbox Code Playgroud)
但它不起作用.
我能怎么做 ?
我有这个数据框:
set.seed(50)
data <- data.frame(age=c(rep("juv", 10), rep("ad", 10)),
sex=c(rep("m", 10), rep("f", 10)),
size=c(rep("large", 10), rep("small", 10)),
length=rnorm(20),
width=rnorm(20),
height=rnorm(20))
data$length[sample(1:20, size=8, replace=F)] <- NA
data$width[sample(1:20, size=8, replace=F)] <- NA
data$height[sample(1:20, size=8, replace=F)] <- NA
age sex size length width height
1 juv m large NA -0.34992735 0.10955641
2 juv m large -0.84160374 NA -0.41341885
3 juv m large 0.03299794 -1.58987765 NA
4 juv m large NA NA NA
5 juv m large -1.72760411 NA 0.09534935
6 juv m large -0.27786453 …Run Code Online (Sandbox Code Playgroud) 如何能够绘制比另一条更粗的一条线.我尝试使用geom_line(size=X)但是这会增加两条线的厚度.假设我想增加第一列的厚度,怎么能够接近这个?
a <- (cbind(rnorm(100),rnorm(100))) #nav[,1:10]
sa <- stack(as.data.frame(a))
sa$x <- rep(seq_len(nrow(a)), ncol(a))
require("ggplot2")
p<-qplot(x, values, data = sa, group = ind, colour = ind, geom = "line")
p + theme(legend.position = "none")+ylab("Millions")+xlab("Age")+
geom_line( size = 1.5)
Run Code Online (Sandbox Code Playgroud) 假设我有一个包含100多列的数据集,我只需要保留数据中那些符合一个条件的行,这些行应用于所有100列.我该怎么做?
假设,它如下所示...我只需保留Col1或2或3或4中的任何一个> 0的行
Col1 Col2 Col3 Col4
1 1 3 4
0 0 4 2
4 3 4 3
2 1 0 2
1 2 0 3
0 0 0 0
Run Code Online (Sandbox Code Playgroud)
在上面的例子中,除了最后一行之外,所有行都将成为它.我需要将结果放在与原始行相同的数据帧中.不确定我是否可以使用lapply循环遍历> 0的列或我可以使用子集..任何帮助表示赞赏
我可以使用列索引吗df<-subset(df,c(2:100)>0)?这不能给我正确的结果.
如何将日期转换为从一年的第一天开始的天数.
如何将以下内容转换为下面的预期结果?
Date
02/01/2000
20/02/2000
12/12/2000
13/01/2001
Run Code Online (Sandbox Code Playgroud)
以下是预期结果.
Date NumDays TotalDays
02/01/2000 1 1
20/02/2000 51 51
12/12/2000 346 346
13/01/2001 13 379
Run Code Online (Sandbox Code Playgroud) 我是R的新手,我已经使用hclust以下方法训练了模型:
model=hclust(distances,method="ward”)
Run Code Online (Sandbox Code Playgroud)
结果看起来不错:

现在我得到一些新的数据记录,我想预测它们每个属于哪个集群.我该如何完成?
这个问题跟随另一个关于群体加权平均值的问题:我想用data.table.创建加权群内平均值.与初始问题的不同之处在于,要求平均的变量名称是在字符串向量中指定的.
数据:
df <- read.table(text= "
region state county weights y1980 y1990 y2000
1 1 1 10 100 200 50
1 1 2 5 50 100 200
1 1 3 120 1000 500 250
1 1 4 2 25 100 400
1 1 4 15 125 150 200
2 2 1 1 10 50 150
2 2 2 10 10 10 200
2 2 2 40 40 100 30
2 2 3 20 100 100 10 …Run Code Online (Sandbox Code Playgroud) r ×10
graphics ×2
plot ×2
data.table ×1
fractions ×1
ggplot2 ×1
missing-data ×1
plyr ×1
statistics ×1
subset ×1