滚动装置和应用装置在一系列数据的开头

我想对数据集中前4个值进行滚动均值.但是,一开始,由于没有4个值,我想做1/2/3观测的滚动平均值.我该怎么做呢？

 library(zoo)
 df= data.frame(a=c(1,2,3,4,5))
 df$answer = rollapply(df$a, 4,mean)
 #help

Run Code Online (Sandbox Code Playgroud)

例如,第1行的值为1,第2行的值为(1 + 2)/2=1.5,第3行的值为6/3 = 2.

我想做4个周期的滚动方式,但是在月数较少的时期,我想做允许的最大周期的平均值.

r time-series dataframe

run*_*rds

2016 09-11

6
推荐指数

1
解决办法

309
查看次数

熊猫描述由 - 附加参数

我看到 pandas 库有一个Describe by函数可以返回一些有用的统计信息。但是，有没有办法向输出添加额外的行，例如标准偏差 (.std) 和中值绝对偏差 (.mad) 或唯一值的计数？

我明白了，df.describe()但我无法找到如何添加这些额外的摘要内容

python pandas

run*_*rds

2016 07-24

6
推荐指数

2
解决办法

5784
查看次数

在r中的两个数据帧/矩阵中按行对产品求和

我有两个数据框,每个数据框有两列.如果这有助于计算,它们可以是具有相同尺寸的矩阵.

我想要做的是各个位置/行的这些数据帧的总和.

例如,解决方案将在以下列中列出.

 21 = 1*1+10*2
 42 = 2*1 +20*2
63 = 3*1 + 20*2

 a=data.frame(c_1=c(1,2,3),c_2=c(10,20,30))
  b=data.frame(c2_1=c(1,1,1),c2_2=c(2,2,2))

Run Code Online (Sandbox Code Playgroud)

r sum dataframe cross-product

run*_*rds

lucky-day

5
推荐指数

1
解决办法

4225
查看次数

按时间段滚动平均值而不是 R 中的观察值

我有一个日期随机发生的数据集。例如：

10/21/15、11/21/15、11/22/15、11/28/15、11/30/15、12/12/15...等

我希望按时间段而不是观察级别创建滚动平均值。例如，如果我想计算过去 7 天的移动平均线。我不想查看最后 7 行，而是查看最后 7天

举一个小例子：

 dates = c('2015-08-07', '2015-08-08','2015-08-09','2015-09-09','2015-10-10')
 value = c(5,10,5,3,2)
 df=data.frame(dates, value)
 df$desired = c(NA,5,7.5, NA,NA)

Run Code Online (Sandbox Code Playgroud)

显然，我希望对更大的数据集执行此操作，但我希望您明白这一点。例如，如果我使用 7 天，这就是我期望的结果。

请注意，我没有将当前观测值纳入滚动平均值，仅将前一个观测值纳入其中。我想要按时间段滚动平均值，而不是观察行数。

我尝试查看 rollmean 和 dplyr 但我无法弄清楚。我真的不在乎它是如何发生的。

谢谢！

time r summary time-series moving-average

run*_*rds

lucky-day

5
推荐指数

1
解决办法

5436
查看次数

RStudio 错误消息 - 设备无法识别命令

我反复收到错误消息：

错误保存文件：“设备无法识别命令”一遍又一遍（每 15 秒）弹出 - 即使我没有单击保存或单击保存时也是如此。

我也无法加载我文件夹中的 R 文件 - 我必须在记事本中打开它并将其复制粘贴才能看到它。

有人可以让我知道如何解决这个问题吗？我安装了最新版本的 Rstudio。

r rstudio

run*_*rds

lucky-day

5
推荐指数

1
解决办法

2708
查看次数

R 中 I(x^3) 和 poly(x,3) 之间的差异进行回归

我是 R 的初学者，所以请原谅。我对文档没有足够的理解来区分这三种形式的 I() 和 poly() 工作方式之间的区别

使用 mtcars 数据集...

xx=lm(mpg~hp+I(hp^2)+I(hp^3), data=mtcars)
yy=lm(mpg~I(hp^3), data=mtcars)
zz=lm(mpg~poly(hp,3), data=mtcars)
summary(xx)
summary(yy)
summary(zz)

Run Code Online (Sandbox Code Playgroud)

所有返回差异结果。我以为 ZZ 会给我与 XX 甚至 YY 相同的结果，但事实并非如此。再一次，如果有人能向我解释这一点，那就太好了

statistics r

run*_*rds

lucky-day

4
推荐指数

1
解决办法

2287
查看次数

不同数据集上相同值的一致因子水平

我不确定我是否完全理解因素是如何运作的。因此，如果我错了，请以易于理解的方式纠正我。

我总是假设在进行回归时，R 在幕后将分类变量转换为整数，但这部分超出了我的思路。

它将使用训练集中的分类值，并在构建模型后，检查测试数据集中的相同分类值。无论潜在的“水平”是什么——对我来说都无关紧要。

但是，我一直在思考更多......并且需要澄清 - 特别是如果我在如何解决这个问题上做错了。

     train= c("March","April","January","November","January")
     train=as.factor(train)
     str(train)
     Factor w/ 4 levels "April","January",..: 3 1 2 4 2

     test= c(c("March","April"))
     test=as.factor(test)
      str(test)
     # Factor w/ 2 levels "April","March",..:  1 2

Run Code Online (Sandbox Code Playgroud)

题

如果你看到上面的内容，它会创建因子水平，我相信这就是每个月对它们的调用。然而，水平不一定匹配。

例如，在测试中，“APRIL”在两者中都是“1”，但在火车中“JANUARY”是 2，而“MARCH”在 2nd 中是 2。

如果我要将其合并到模型中，我认为我不会出错，因为 TEST 集中的所有分类值都已经在训练集中了……但是会使用适当的系数/值吗？

请帮助我很困惑

r factors categorical-data

run*_*rds

lucky-day

4
推荐指数

1
解决办法

2934
查看次数

编辑后恢复默认R数据集

如果我使用的是包中提供的数据集,并且我不小心编辑了它并覆盖了某些值,我该如何将其恢复为原始形式？除了卸载包之外,还有其它命令吗？

statistics r

run*_*rds

lucky-day

3
推荐指数

1
解决办法

2692
查看次数

将熊猫列转换为逗号分隔的列表以在sql语句中使用

我有一个数据框，并且我试图将列变成逗号分隔的列表。最终目标是将此逗号分隔的列表作为SQL查询中已过滤项的列表传递。

我该怎么做呢？

> import pandas as pd
> 
> mydata = [{'id' : 'jack', 'b': 87, 'c': 1000},
>           {'id' : 'jill', 'b': 55, 'c':2000}, {'id' : 'july', 'b': 5555, 'c':22000}] 
  df = pd.DataFrame(mydata) 
  df

Run Code Online (Sandbox Code Playgroud)

预期的解决方案-注意id周围的引号，因为它们是字符串，而列中的标题为“ b”的项是引号，因为这是一个数字字段，也是SQL的工作方式。然后我最终会发送一个查询

select * from mytable where ids in (my_ids)  or values in (my_values):

Run Code Online (Sandbox Code Playgroud)

my_ids ='jack'，'jill'，'july'

my_values = 87,55,5555

csv dataframe pandas pandasql

run*_*rds

lucky-day

2
推荐指数

1
解决办法

4206
查看次数

始终让 Jupyter 笔记本加载某些选项/包

有没有办法确保 jupyter 笔记本始终以以下任一开头：

1) 导入某些包和/或 2 设置某些选项

我不想每次都在我运行的每个笔记本的顶部输入相同的内容 - 例如总是使用 numpy 或 pandas。

此外，我总是希望能够看到每个单元格的多个输出。我使用以下代码来让它正常工作，但我希望将其保存为某种模板，这样不需要我每次手动输入。

谢谢！

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

Run Code Online (Sandbox Code Playgroud)

python python-2.7 jupyter-notebook

run*_*rds

lucky-day

2
推荐指数

1
解决办法

1370
查看次数

标签统计

r ×7

dataframe ×3

pandas ×2

python ×2

statistics ×2

time-series ×2

categorical-data ×1

cross-product ×1

csv ×1

factors ×1

jupyter-notebook ×1

moving-average ×1

pandasql ×1

python-2.7 ×1

rstudio ×1

sum ×1

summary ×1

time ×1

小编run*_*rds的帖子

题

标签 统计

小编run_rds的帖子

标签统计