小编Sis*_*sse的帖子

R重复数据帧的元素

我在互联网上搜索过,但我找不到解决问题的办法.我有一个数字和字符的数据框:

mydf <- data.frame(col1=c(1, 2, 3, 4), 
                   col2 = c(5, 6, 7, 8), 
                   col3 = c("a", "b", "c", "d"), stringsAsFactors  = FALSE)
Run Code Online (Sandbox Code Playgroud)

是myDF:

col1 col2 col3
  1    5   a
  2    6   b
  3    7   c
  4    8   d
Run Code Online (Sandbox Code Playgroud)

我想重复一遍

col1 col2 col3
  1   5    a
  1   5    a
  1   5    a
  2   6    b
  2   6    b
  2   6    b
  3   7    c
  3   7    c
  3   7    c
  4   8    d
  4   8    d
  4   8    d
Run Code Online (Sandbox Code Playgroud)

使用apply(mydf, …

r repeat dataframe

4
推荐指数
2
解决办法
3693
查看次数

R数学注释

我在数学注释中插入垂直线时遇到问题.我没有运气就搜索了注释符号.

我想在一个图的x标签中放入一个包含条件概率符号(|)的数学注释.我想要的是表达式p(x_j | o_i),其中"j"和"i"是下标.

我有以下结构

plot(1:10, xlab = expression( paste("Likelihood, p" * (y[i] %up% o[j])) ))
Run Code Online (Sandbox Code Playgroud)

我想用垂直线代替箭头.非常感谢任何帮助或指导.

annotations r plotmath

4
推荐指数
1
解决办法
1558
查看次数

将黄土平滑应用于时间序列

我想通过应用黄土函数来平滑我绘制的时间曲线,但我无法使其工作.一个例子:

mydat <- runif(50)
day1 <- as.POSIXct("2012-07-13", tz = "UTC")
day2 <- day1 + 49*3600*24
pdays <- seq(day1, day2, by = "days")
lo <- loess(mydat ~ pdays)
Run Code Online (Sandbox Code Playgroud)

我收到以下消息:

Error: NA/NaN/Inf in foreign function call (arg 2)
Run Code Online (Sandbox Code Playgroud)

是否可以将黄土平滑应用于时间序列

非常感谢任何帮助或指导!

r loess

4
推荐指数
1
解决办法
9009
查看次数

NAs的问题

我有一个数据集

dat
   ejer_id person_alder koen  aar
1        1            9    1 2011
2        2            9    1 2011
3        3            7    1 2011
4        4           94    1 2011
5        5           94    2 2011
6        6           93   NA 2011
7        7           93    1 2011
8        8           91    2 2011
9        9           91    1 2011
10      10           91   NA 2011
Run Code Online (Sandbox Code Playgroud)

我算了NAs:

isna <- sum(is.na(dat$koen))
Run Code Online (Sandbox Code Playgroud)

这使

> isna
   [1] 2
Run Code Online (Sandbox Code Playgroud)

我不明白为什么以下不起作用:

 > length( dat$koen[dat$koen == 1] )
[1] 8
Run Code Online (Sandbox Code Playgroud)

这应该是6.

长度(dat $ koen [dat $ …

r na

4
推荐指数
1
解决办法
106
查看次数

使用plyr和ldply

我有一个reoccuring问题 - 我道歉!

假设我想根据'id'和'year'列出棒球数据(来自plyr包).根据以下任一方法创建列表之间存在差异:

1. mylist1 <- dlply(baseball, .(id, year), identity)
Run Code Online (Sandbox Code Playgroud)

2. mylist2 <- dlply(baseball, .(id), dlply, .(year), identity)
Run Code Online (Sandbox Code Playgroud)

在列表的组织方式,但将列表重新放回数据框与'mylist1'工作正常.

mydf1 <- ldply(mylist1)
Run Code Online (Sandbox Code Playgroud)

但不是'mylist2'

mydf2 <- ldply(mylist2)
Run Code Online (Sandbox Code Playgroud)

它给出以下错误消息:

Error in list_to_dataframe(res, attr(.data, "split_label")): Result must be all atomic, or all data frames
Run Code Online (Sandbox Code Playgroud)

我是R的新手,这个错误信息对我来说没什么意义.

我想根据方法2分割我自己的数据帧,因为我需要相当多的数据操作.我的问题是:如何将此列表合并到数据框中?有替代品do.call(rbind, do.call(rbind,...吗?

我很乐意为你提供帮助!

r plyr

3
推荐指数
1
解决办法
8624
查看次数

标签 统计

r ×5

annotations ×1

dataframe ×1

loess ×1

na ×1

plotmath ×1

plyr ×1

repeat ×1