小编SHR*_*ram的帖子

在R中的大矩阵中加入连续的四/ n数

我有非常大的数据集,其维度为60K x 4 K.我正在尝试在列的每一行中连续添加每四个值.以下是较小的示例数据集.

    set.seed(123)
    mat <- matrix (sample(0:1, 48, replace = TRUE), 4)

   [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12]
[1,]    0    1    1    1    0    1    1    0    1     1     0     0
[2,]    1    0    0    1    0    1    1    0    1     0     0     0
[3,]    0    1    1    0    0    1    1    1    0     0     0     0
[4,]    1    1    0    1    1    1    1    1    0     0     0     0 …
Run Code Online (Sandbox Code Playgroud)

loops r large-data

7
推荐指数
3
解决办法
291
查看次数

如何在r函数中将参数作为列表传递

我的函数有很多参数.所以我想创建一个参数列表并将它们传递给函数.

举个例子,拿?mean函数:

mean(x, trim = 0, na.rm = FALSE, ...)

所以我想说我想计算1:10的平均值,这里是x,但是将其他参数作为列表传递:

 gm <- list (trim = 0, na.rm = FALSE)

mean(1:10, gm)
Error in mean.default(1:10, gm) : 'trim' must be numeric of length one
Run Code Online (Sandbox Code Playgroud)

我尝试使用,do.call但也没有工作.

 do.call(mean,list(1:10, gm))
Error in mean.default(1:10, list(trim = 0, na.rm = FALSE)) : 
  'trim' must be numeric of length one
Run Code Online (Sandbox Code Playgroud)

arguments r function

7
推荐指数
1
解决办法
1915
查看次数

计算r中单词向量中特定字母的出现次数

我试图在长矢量的单词中计算特定字母的数量.

例如:

我想在下面的向量中计算字母"A"的数量.

myvec <- c("A", "KILLS", "PASS", "JUMP", "BANANA", "AALU", "KPAL")
Run Code Online (Sandbox Code Playgroud)

所以预期的输出是:

c(1,0,1,0, 3,2,1)
Run Code Online (Sandbox Code Playgroud)

任何的想法 ?

string r count

7
推荐指数
3
解决办法
2913
查看次数

带有ggplot的多面热图,用于选定的X部分,上面有附加的文本标签

我有以下数据:

Id = paste ("ID-", 1:5, sep = "")
position <- rep(seq (1, 100,10), each = 5)
group = rep (rep(rep (1:5, each = length (Id)), each = length(position)))
yvar <- rnorm (length(position), 0.5, 0.1)
ycat <- c(sample (c("A", "B"), length(yvar), replace = TRUE))
namevar <- rep(Id, length(group)/length(Id))
mydf <- data.frame (namevar, group, position, yvar, ycat)
Run Code Online (Sandbox Code Playgroud)

group是一个刻面变量,position是一个连续的x变量.yvar用于填充瓷砖的颜色.ycat是每个图块的文本标签.我想为所有值创建一个空白空间的绘图,除了我选择用填充颜色和标签绘制的某些切片.

这是我到目前为止:

  ggplot(mydf,aes(y=Id,x=position)) +
      facet_wrap(~group) +     
      geom_tile(aes(fill = yvar),colour = "black") +
      geom_text(aes(label = ycat)) +
      labs(x …
Run Code Online (Sandbox Code Playgroud)

r heatmap ggplot2

6
推荐指数
1
解决办法
1744
查看次数

r中的anova分区和比较(正交单df)

我想在anova(固定或混合模型)中进行单df正交对比.这只是一个例子:

require(nlme)
data (Alfalfa)
  Variety: a factor with levels Cossack, Ladak, and Ranger
  Date : a factor with levels None S1 S20 O7
  Block: a factor with levels 1 2 3 4 5 6
  Yield : a numeric vector
Run Code Online (Sandbox Code Playgroud)

这些数据在Snedecor和Cochran(1980)中作为分裂图设计的一个例子进行了描述.实验中使用的处理结构为3×4全饱和因子,1943年有3个品种的苜蓿和4个第三次扦插日期.实验单元分为6个区块,每个区块分为4个区块.将苜蓿(Cossac,Ladak和Ranger)的品种随机分配到块中,并将第三次切割的日期(无,S1- 9月1日,S20- 9月20日和O7- 10月7日)随机分配到图中.每个区块都使用了所有四个日期.

model<-with (Alfalfa, aov(Yield~Variety*Date +Error(Block/Date/Variety)))

    > summary(model)

Error: Block
          Df Sum Sq Mean Sq F value Pr(>F)
Residuals  5   4.15    0.83

Error: Block:Date
          Df Sum Sq Mean Sq F value   Pr(>F)
Date       3 1.9625  0.6542   17.84 3.29e-05 *** …
Run Code Online (Sandbox Code Playgroud)

r orthogonal contrast anova

5
推荐指数
1
解决办法
883
查看次数

避免r图中的标签过度拥挤

我正在努力避免在以下情节中过度拥挤标签:

set.seed(123)
position <- c(rep (0,5), rnorm (5,1,0.1), rnorm (10, 3,0.1), rnorm (3, 4, 0.2), 5, rep(7,5), rnorm (3, 8,2),  rnorm (10,9,0.5),
               rep (0,5), rnorm (5,1,0.1), rnorm (10, 3,0.1), rnorm (3, 4, 0.2), 5, rep(7,5), rnorm (3, 8,2),  rnorm (10,9,0.5))
group <- c(rep (1, length (position)/2),rep (2, length (position)/2)  )
mylab <- paste ("MR", 1:length (group), sep = "")
barheight <- 0.5

y.start <- c(group-barheight/2)
y.end <- c(group+barheight/2)
mydf <- data.frame (position, group, barheight, y.start, y.end, mylab)


plot(0,type="n",ylim=c(0,3),xlim=c(0,10),axes=F,ylab="",xlab="")
#Create two …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2

5
推荐指数
1
解决办法
394
查看次数

我可以在饼图中嵌入的R - 条形图中制作这样的图形

我有以下数据:

    I   II  Total 
A   15  25  40
B   5   45  50
C   15  5   20
Run Code Online (Sandbox Code Playgroud)

R数据输入:

group <- c("A", "B", "C", "A", "B", "C")
subgroup <- c("I", "I", "I", "II", "II", "II")
yvar <- c(15, 5, 15, 25, 45, 5)
Run Code Online (Sandbox Code Playgroud)

当我想到一个更好的方式呈现它时,我开始想到饼图(最好是3D)和条形图(最好是3D).这是我的想法的粗略草图,其中条形图嵌入饼图中.如果您有任何其他创新想法来提供此类数据,请建议我.

在此输入图像描述 在此输入图像描述

r graph ggplot2 pie-chart

4
推荐指数
3
解决办法
2248
查看次数

在ggplot2 r中添加轴刻度和标签

这是数据.

X <- 1:10
Y <- rnorm (length(X), 5, 2)
ticks <- data.frame (t = c(5, 8, 9), l = c(1:3)) 

plot (X, Y, xaxt = "n")

axis(1, at = ticks$t, labels = ticks$l)
Run Code Online (Sandbox Code Playgroud)

我想在ggplot2中做类似的工作.我该怎么做

在此输入图像描述

label r ggplot2

4
推荐指数
1
解决办法
1万
查看次数

在unix shell中有自动时间的目录

我想创建脚本,其中新生成的目录自动将当前时间作为名称的一部分.

句法

mkdir mydir[min-hour-day-month-year]
Run Code Online (Sandbox Code Playgroud)

因此最近的目录将命名为

mydir101718052012
Run Code Online (Sandbox Code Playgroud)

一小时后创建的目录

mydir111718052012
Run Code Online (Sandbox Code Playgroud)

等等.

对不起,简单的问题,我是unix的新手,我使用的是bash

编辑:为什么不遵循正确的?我该怎么做 ?

newdir = mydir$( date +%Y-%m-%d-%H-%M-%S)
cp new.txt newdir/new1.txt
Run Code Online (Sandbox Code Playgroud)

unix directory time date

4
推荐指数
1
解决办法
5735
查看次数

在 r 中绘制每月和每年的天气数据

我正在尝试开发一个像天气数据中出现的那样的天气图 - 类似的东西。

在此输入图像描述

我想绘制每日价值(尽管平均值可以出现在圆圈中)。我使用 ggplot2 因为它需要多方面(每个月和每年)。

st <- as.Date ("2009-1-1")
en <- as.Date ("2011-12-28")
date1 <- seq(st, en, "1 day")
year <- format(date1, "%Y")
month <- format (date1, "%b")
day <- as.numeric (format(date1, "%d"))

avgtm <- round (rnorm (length(date1), 50,5), 1)
maxtm <- avgtm + abs(rnorm (length (avgtm), 0, 5))
mintm <-  avgtm - abs(rnorm (length (avgtm), 0, 5))

myd <- data.frame ( year, month, day, avgtm, maxtm, mintm)
require(ggplot2)
qplot(day, avgtm, data = myd, geom = "line", col = …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2 lattice

3
推荐指数
1
解决办法
4177
查看次数