是否有一种方法(在R中使用ggplot或其他方式)在单个列(两行)中绘制频率和累积频率曲线,即另一个顶部,以便可以使用直线在两条曲线上显示给定的四分位数?我希望我对此很清楚..
你可以使用这个数据..
mydata<-structure(list(speed = c(10, 15, 20, 25, 30, 35, 40, 45, 50),frequency = c(0, 1, 5, 10, 20, 10, 6, 3, 0)), .Names = c("speed","frequency"), row.names = c(NA, -9L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud) 可能重复:
R中的赋值运算符:'='和'< - '
我想知道为什么使用=和<-分配a时有区别dataframe.
案例a:使用 =
set.seed(100);a <- data.frame(a1=rnorm(10),a2=sample(c(1,0),10,replace=TRUE))
Run Code Online (Sandbox Code Playgroud)
案例b:使用 <-
set.seed(100);b <- data.frame(b1 <- rnorm(10),b2 <- sample(c(1,0),10,replace=TRUE))
Run Code Online (Sandbox Code Playgroud)
为什么会有以下区别?为什么第二种方法没有保留变量/列名?
> a
a1 a2
1 -0.50219235 0
2 0.13153117 0
3 -0.07891709 1
4 0.88678481 1
5 0.11697127 0
>b
b1....rnorm.5. b2....sample.c.1..0...5..replace...TRUE.
1 -0.50219235 0
2 0.13153117 0
3 -0.07891709 1
4 0.88678481 1
5 0.11697127 0
Run Code Online (Sandbox Code Playgroud) 我是R 2.15.2的Win-7用户
有人可以帮助我为什么以下模型不能很好地接近简单的logit模型估计?
编辑
Mydata <- structure(list(gg = c(13.659955, 6.621436486, 3.017166776, 2.516795069,
3.928538296, 4.211960532, 3.235445955, 5.152860411, 18.96466673,
5.904678823, 4.987622293, 1.170687541, 3.088224149, 4.738065529,
3.263022593, 6.050017999, 5.650762257, 2.058924721, 3.138591919,
7.169083435, 11.30381738, 3.036991188, 4.559013218, 3.978760664,
3.617455798, 2.430111184, 4.440319959, 2.200267742, 6.003166495,
3.114161526, 3.812363457, 11.12816724, 15.6564348, 13.50562576,
5.154056904, 6.26451889, 1.849669635, 1.816757851, 3.861868285,
2.884542233, 2.993444924, 2.724235493, 2.694159089, 1.973597356,
4.371300647, 3.559035718, 3.59124243, 6.587196681, 10.03402072,
4.805158339, 4.491460392, 1.627936721, 1.278291553, 0.978710462,
3.08635052, 2.58594947, 2.354973563, 1.657519171, 2.946994656,
2.110549733, 6.095182338, 6.000660354, 6.691960157, 1.796172588,
2.531234555, 2.992017156, 2.882403206, 6.066420081, 5.930524609,
5.972280022, 0.915755208, 2.398369176, …Run Code Online (Sandbox Code Playgroud) 我需要从包含2012-09-27 07:05:59time形式列的data.frame中分隔时间和日期.然后我必须使用和列来提取特定日期/时间的数据.我该怎么做呢?也许我想反过来这个.datetime
我尝试使用strptime函数和lubridate包但无法使其工作.
data1 <- structure(list(event.date = structure(list(sec = c(59, 29, 59,
0, 29, 59, 29, 29, 59, 59), min = c(5L, 7L, 15L, 17L, 17L, 19L,
21L, 22L, 22L, 23L), hour = c(7L, 7L, 7L, 7L, 7L, 7L, 7L, 7L,
7L, 7L), mday = c(27L, 27L, 27L, 27L, 27L, 27L, 27L, 27L, 27L,
27L), mon = c(8L, 8L, 8L, 8L, 8L, 8L, 8L, 8L, 8L, 8L), year = …Run Code Online (Sandbox Code Playgroud) 此答案适用于 linux 命令行。我需要同样的 Windows 命令行。我使用this创建了以下内容,但我的代码不起作用。
for /D /r %i in (*.*) do (cd %i && echo %i && git pull && cd ..)
Run Code Online (Sandbox Code Playgroud)
从@SevenEleven 的回答和@kostix 的评论来看,以下是有效的。
for /D %%i in (.\*) do (cd "%%i" && git pull && cd..)
Run Code Online (Sandbox Code Playgroud)
或者
for /D %%i in (*) do (cd "%%i" & git pull && cd..)
Run Code Online (Sandbox Code Playgroud) 我正在尝试获取所选列中具有最高值的列的索引。当尝试使用 时dplyr,我的尝试没有给我正确的结果。
library(dplyr);library(magrittr)
DF1 <- data.frame(Factor1 = c(1,2,4),Factor2 = c(3,1,1),Factor3 = c(9,1,0)) %>%
mutate(max_ind = which.max(c(.$Factor1,.$Factor2,.$Factor3))) %>% print
Factor1 Factor2 Factor3 max_ind
1 1 3 9 7
2 2 1 1 7
3 4 1 0 7
Run Code Online (Sandbox Code Playgroud)
错误在哪里?为什么dplyr会有这样的行为。我可能应该使用rowwise,但这似乎不是最好的方法。有想过如何做到这一点base吗?tidyversedata.table
通过 sapply 我得到了这个:
DF1 <- data.frame(Factor1 = c(1,2,4),Factor2 = c(3,1,1),Factor3 = c(9,1,0)) %>%
+ mutate(max_ind = which.max(c(Factor1,Factor2,Factor3)),
+ max_ind2 = sapply(X = ., function(x) which.max(c(x[Factor1],x[Factor2],x[Factor3])))) %>% print
Factor1 Factor2 …Run Code Online (Sandbox Code Playgroud)