小编Jaa*_*aap的帖子

如何在R中的seq中插入零

我需要得到这个:

      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,]    1    0    2    0    3    0    4    0    5
[2,]    0    0    0    0    0    0    0    0    0
[3,]    6    0    7    0    8    0    9    0   10
[4,]    0    0    0    0    0    0    0    0    0
[5,]   11    0   12    0   13    0   14    0   15
[6,]    0    0    0    0    0    0    0    0    0
[7,]   16    0   17    0   18    0   19    0   20 …
Run Code Online (Sandbox Code Playgroud)

r seq

11
推荐指数
4
解决办法
460
查看次数

10
推荐指数
2
解决办法
2859
查看次数

如何使用自定义中断从连续变量创建分箱因子变量?

我有一个看起来像这样的矢量:

dataset <- c(4,7,9,1,10,15,18,19,3,16,10,16,12,22,2,23,16,17)
Run Code Online (Sandbox Code Playgroud)

我想创建四个虚拟类别,其中我通过自定义中断来连接连续数据集...例如:1:4,5:9,10:17,18:23.

输出虚拟类别的长度与原始连续向量的长度相同(在这种情况下为18),但现在每个分箱的虚拟变量只包含1或0.

r

10
推荐指数
2
解决办法
1万
查看次数

从数据帧列表中获取列R.

我是R初学者,我坚持这个问题.我有一个数据帧,通过使用split()函数,我创建了一个数据帧列表,例如:

dfList <- split(mtcars, mtcars$cyl)
Run Code Online (Sandbox Code Playgroud)

现在我想要从数据帧1中检索特定数据帧的列,例如第2列,所以类似于

dfList[1][2]
Run Code Online (Sandbox Code Playgroud)

我现在能做的就是创建for循环以进入数据结构.但如果它存在,我找不到一个oneliner.我怎样才能做到这一点?提前致谢!

split r list dataframe

10
推荐指数
1
解决办法
2万
查看次数

如何在ggplot2中放大我的绘图宽度?

下面是我想要在论文中包含的情节.问题是我的情节宽度很小(这使得x-axix根本不可读)

这是ggplot2代码myCode.r:

require("ggplot2")

all <- read.csv(file="benchmark/bench.query.csv", head=TRUE, sep=";")

w <- subset(all, query %in% c("sort.q1", "sort.q2", "sort.q3", "sort.q4", "sort.q5"))

w$rtime <- as.numeric(sub(",", ".", w$rtime, fixed=TRUE))

p <- ggplot(data=w, aes(x=query, y=rtime, colour=triplestore, shape=triplestore))
p <- p + scale_shape_manual(values = 0:length(unique(w$triplestore)))
p <- p + geom_point(size=4)
p <- p + geom_line(size=1,aes(group=triplestore))
p <- p + labs(x = "Requêtes", y = "Temps d'exécution (log10(ms))")
p <- p + scale_fill_continuous(guide = guide_legend(title = NULL))
p <- p + facet_grid(trace~type)
p <- p + …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

10
推荐指数
3
解决办法
2万
查看次数

按行名称索引data.frame时出现意外行为

我不经常使用索引data.frame逐行名称,但有时候这样做有一个优势.但是,当我试图过滤出令人不快的行时,我注意到了意想不到的结果

  test <- data.frame(a = c("a", "b", "c"), 
                     b = c("A", "B", "C"), 
                     row.names = c(-99.5, 99.5, 99))
  test["-99", ]
Run Code Online (Sandbox Code Playgroud)

你会期望它会给你

     a    b
NA <NA> <NA>
Run Code Online (Sandbox Code Playgroud)

但它回来了

      a b
-99.5 a A
Run Code Online (Sandbox Code Playgroud)

只是具体而言

Session info ---------------------------------------------------------------
 setting  value                       
 version  R version 3.2.1 (2015-06-18)
 system   x86_64, mingw32             
 ui       RStudio (0.99.441)          
 language (EN)                        
 collate  English_United Kingdom.1252 
 tz       Europe/London  
Run Code Online (Sandbox Code Playgroud)

有任何想法吗?

r subset

10
推荐指数
1
解决办法
116
查看次数

在R中有效地绘制数百万个数据点

我正在尝试在R中绘制一些数据点.我目前正在使用ggplot2(但我对备用软件包的建议持开放态度).问题是图表渲染时间太长(通常超过一分钟).我正在寻找方法来更快地实现这一点 - 理想的实时.我将不胜感激任何帮助 - 为了清楚起见,将代码附加到问题上.

使用~500000个数据点创建(随机)数据框:

letters <- c("A", "B", "C", "D", "E", "F", "G")
myLetters <- sample(x = letters, size = 100000, replace = T)
direction <- c("x", "y", "z")
factor1 <- sample(x = direction, size = 100000, replace = T)
factor2 <- runif(100000, 0, 20)
factor3 <- runif(100000, 0, 100)
decile <- sample(x = 1:10, size = 100000, replace = T)


new.plot.df <- data.frame(letters = myLetters, factor1 = factor1, factor2 = factor2, 
                      factor3 = factor3, decile = decile) …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

10
推荐指数
2
解决办法
3347
查看次数

根据其他数据框替换特定值

首先,让我们从DataFrame 1(DF1)开始:

DF1 <- data.frame(c("06/19/2016", "06/20/2016", "06/21/2016", "06/22/2016", 
                    "06/23/2016", "06/19/2016", "06/20/2016", "06/21/2016",
                    "06/22/2016", "06/23/2016"),
                  c(1, 1, 1, 1, 1, 2, 2, 2, 2, 2),
                  c(149, 150, 151, 152, 155, 84, 83, 80, 81, 97),
                  c(101, 102, 104, 107, 99, 55, 55, 56, 57, 58),
                  c("MTL", "MTL", "MTL", "MTL", "MTL", "NY", "NY", 
                    "NY", "NY", "NY"))
colnames(DF1) <- c("date", "id", "sales", "cost", "city")
Run Code Online (Sandbox Code Playgroud)

我也有DataFrame 2(DF2):

DF2 <- data.frame(c("06/19/2016", "06/27/2016", "06/22/2016", "06/23/2016"),
                  c(1, 1, 2, 2),
                  c(9999, 8888, 777, 555),
                  c("LON", "LON", "QC", …
Run Code Online (Sandbox Code Playgroud)

lookup r dataframe

10
推荐指数
1
解决办法
2263
查看次数

检查一个值是否在一个范围内?

我有一个data.table看起来像这样的格式的数据集:

ID     time.s     time.e
1       1         2
2       1         4
3       2         3
4       2         4
Run Code Online (Sandbox Code Playgroud)

我想检查值1是否在内time.s,time.e以便最终结果如下

[1] TRUE TRUE FALSE FALSE
Run Code Online (Sandbox Code Playgroud)

我该怎么做?我试过用

 a[1 %in% seq(time.s, time.e)]
Run Code Online (Sandbox Code Playgroud)

但我得到的只是所有真值.有什么建议?

r

10
推荐指数
4
解决办法
2万
查看次数

将 HTML 表格转换为 R 数据框

<TABLE  cellspacing=1 cellpadding=7 rules=all frame=Box border=1>
<thead>
<TR>
 <TD ROWSPAN=2 ALIGN=CENTER VALIGN=CENTER>&nbsp;</TD>
 <TD COLSPAN=6 ALIGN=CENTER>1a. My peers make a positive impact my work environment.</TD>
 <TD ALIGN=CENTER>Number</TD>
</TR>
<TR>
 <TD ALIGN=CENTER>Strongly agree  <br>         </TD>
 <TD ALIGN=CENTER>Generally agree <br>         </TD>
 <TD ALIGN=CENTER>Neither agree nor<br>disagree</TD>
 <TD ALIGN=CENTER>Generally disagree<br>       </TD>
 <TD ALIGN=CENTER>Strongly disagree<br>        </TD>
 <TD ALIGN=CENTER>No basis to judge<br>        </TD>
 <TD ALIGN=CENTER>of Cases</TD>
</TR>
</thead>
<tbody>
<TR>
 <TD ALIGN=LEFT VALIGN=TOP>  Company-Wide                                     </TD>
 <TD ALIGN=RIGHT VALIGN=BOTTOM>        44.1</TD>
 <TD ALIGN=RIGHT VALIGN=BOTTOM>        44.9</TD>
 <TD ALIGN=RIGHT VALIGN=BOTTOM>         6.6</TD> …
Run Code Online (Sandbox Code Playgroud)

html r dataframe xml-parsing

9
推荐指数
1
解决办法
9305
查看次数

标签 统计

r ×10

dataframe ×3

ggplot2 ×2

plot ×2

floating-accuracy ×1

html ×1

list ×1

lookup ×1

seq ×1

split ×1

subset ×1

xml-parsing ×1