我想执行group_by并使用dplyr对数据帧执行字符串操作
df<-data.frame(varx=c("x1","x1","x2","x2","x2"),vary=c("y1","y2","y3","y4","y5"))
Run Code Online (Sandbox Code Playgroud)
我希望输出(newdf)看起来像这样:
newdf <- data.frame(varx=c("x1","x2"),catY=c("y1,y2","y3,y4,y5"))
Run Code Online (Sandbox Code Playgroud)
我在dplyr中尝试了以下内容
df %>% group_by(varx)%>%summarise(catY=paste(vary))
Error: expecting a single value
Run Code Online (Sandbox Code Playgroud)
还尝试了以下内容:
df %>% group_by(varx)%>%mutate(catY=paste(vary))
Source: local data frame [5 x 3]
Groups: varx
Run Code Online (Sandbox Code Playgroud)
我可以使用基本数据帧操作来完成它.需要帮助来理解dplyr中的出路.
我正在运行以下 RSTUDIO 帮助页面提供的 dygraph 示例。
http://rstudio.github.io/dygraphs/gallery-synchronization.html
当我运行以下代码时,我会分别获得每个 dygraph 的单独图。
dygraph(ldeaths, main = "All", group = "lung-deaths")
dygraph(mdeaths, main = "Male", group = "lung-deaths")
dygraph(fdeaths, main = "Female", group = "lung-deaths")
Run Code Online (Sandbox Code Playgroud)
我没有得到帮助页面中显示的同步图。"group" 变量 "lung-deaths" 不是 xts 对象的一部分。如果我在这里遗漏了一些基本的东西,请告诉我。
谢谢
普拉迪普
我试图使用dplyr来查询psql中的数据.我的数据采用以下格式.
date name value
10-12-2012 10:01:00 var1 100
10-12-2012 10:55:00 var1 200
10-12-2012 11:01:00 var1 150
10-12-2012 11:50:00 var1 100
10-12-2012 12:11:00 var1 50
10-12-2012 12:40:00 var1 150
10-12-2012 10:01:00 var2 10
10-12-2012 10:33:00 var2 20
10-12-2012 11:04:00 var2 15
10-12-2012 11:45:00 var2 25
10-12-2012 12:02:00 var2 10
10-12-2012 12:55:00 var2 8
Run Code Online (Sandbox Code Playgroud)
我想将数据聚合到每小时(或预定义的采样时间),并希望在该小时内"值"列的平均值.
要求输出:
date name value
10-12-2012 10:00:00 var1 150
10-12-2012 11:00:00 var1 125
10-12-2012 12:00:00 var1 100
10-12-2012 10:00:00 var2 15
10-12-2012 11:00:00 var2 20
10-12-2012 12:00:00 var2 …Run Code Online (Sandbox Code Playgroud)