小编Bti*_*rt3的帖子

将每日数据汇总到月/年间隔

我不经常在R中使用日期,但我想这很容易.我有一个代表数据框中日期的列.我只想创建一个新的数据框,使用日期按月/年汇总第二列.什么是最好的方法?

我想要第二个数据帧,以便将其提供给绘图.

您将提供的任何帮助将不胜感激!

编辑:供参考:

> str(temp)
'data.frame':   215746 obs. of  2 variables:
 $ date  : POSIXct, format: "2011-02-01" "2011-02-01" "2011-02-01" ...
 $ amount: num  1.67 83.55 24.4 21.99 98.88 ...

> head(temp)
        date amount
1 2011-02-01  1.670
2 2011-02-01 83.550
3 2011-02-01 24.400
4 2011-02-01 21.990
5 2011-02-03 98.882
6 2011-02-03 24.900
Run Code Online (Sandbox Code Playgroud)

datetime r

55
推荐指数
6
解决办法
6万
查看次数

将SPSS文件读入R中

我正在尝试学习R并想要引入一个SPSS文件,我可以在SPSS中打开它.

我试过使用read.spssfrom foreignspss.getfrom Hmisc.两条错误消息都是相同的.

这是我的代码:

## install.packages("Hmisc")
library(foreign)

## change the working directory
getwd()
setwd('C:/Documents and Settings/BTIBERT/Desktop/')

## load in the file
## ?read.spss
asq <- read.spss('ASQ2010.sav', to.data.frame=T)
Run Code Online (Sandbox Code Playgroud)

由此产生的错误:

read.spss中的错误("ASQ2010.sav",to.data.frame = T):读取系统文件头的错误此外:警告消息:在read.spss("ASQ2010.sav",to.data.frame = T):ASQ2010.sav:位置0:字符`\ 000'(

此外,我尝试将SPSS文件保存为SPSS 7 .sav文件(之前使用的是SPSS 18).

警告消息:1:在read.spss("ASQ2010_test.sav",to.data.frame = T)中:ASQ2010_test.sav:系统文件2中遇到无法识别的记录类型7,子类型14:在read.spss中("ASQ2010_test. sav",to.data.frame = T):ASQ2010_test.sav:系统文件中遇到无法识别的记录类型7,子类型18

r spss

54
推荐指数
6
解决办法
8万
查看次数

从aov中提取p值

我希望提取R中的anova生成的p值.

这是我正在运行的:

test <- aov(asq[,9] ~ asq[,187])
summary(test)
Run Code Online (Sandbox Code Playgroud)

产量:

              Df Sum Sq Mean Sq F value    Pr(>F)    
asq[, 187]     1   3.02 3.01951  12.333 0.0004599 ***
Residuals   1335 326.85 0.24483                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
12 observations deleted due to missingness
Run Code Online (Sandbox Code Playgroud)

当我看到结构时,这就是我所看到的.我通常可以通过列表来获得我需要的东西,但是我很难用这个.谷歌搜索也似乎揭示了比我更简单的结构.

注意:ASQ是我的数据框架.

str(test)

List of 13
 $ coefficients : Named num [1:2] 0.2862 0.0973
  ..- attr(*, "names")= chr [1:2] "(Intercept)" "asq[, 187]"
 $ residuals    : Named num [1:1337] 0.519 0.519 …
Run Code Online (Sandbox Code Playgroud)

r anova

54
推荐指数
4
解决办法
7万
查看次数

安排Python脚本 - Windows 7

我有一个python脚本,我想定期运行.我正在运行Windows 7.实现这一目标的最佳方法是什么?最简单的方法?

python windows scheduled-tasks

46
推荐指数
3
解决办法
7万
查看次数

R向量/数据帧中的基本滞后

很可能会暴露我是R的新手,但在SPSS中,运行滞后非常容易.显然这是用户错误,但我缺少什么?

x <- sample(c(1:9), 10, replace = T)
y <- lag(x, 1)
ds <- cbind(x, y)
ds
Run Code Online (Sandbox Code Playgroud)

结果是:

      x y
 [1,] 4 4
 [2,] 6 6
 [3,] 3 3
 [4,] 4 4
 [5,] 3 3
 [6,] 5 5
 [7,] 8 8
 [8,] 9 9
 [9,] 3 3
[10,] 7 7
Run Code Online (Sandbox Code Playgroud)

我想我会看到:

     x y
 [1,] 4 
 [2,] 6 4
 [3,] 3 6
 [4,] 4 3
 [5,] 3 4
 [6,] 5 3
 [7,] 8 5
 [8,] 9 8
 [9,] 3 9
[10,] …
Run Code Online (Sandbox Code Playgroud)

r time-series zoo xts

35
推荐指数
6
解决办法
6万
查看次数

在R中将字符转换为日期

我对R来说比较新,但这是我第一次不得不处理日期转换.我从CSV读取数据(使用read.table()),但我缩短了数据以突出显示我的问题.当读入R时,Date字段是字符.

简单地说,我的大多数日期都被正确强制,除了少数情况.下面的例子有望向您展示正在发生的事情.

# my attempt to coerce the date -- uses the stringr package
prods.all$Date2 <- as.Date(str_sub(prods.all$Date, 1, 
                str_locate(prods.all$Date, " ")[1]-1), 
                "%m/%d/%Y")

# grab two rows to highlight my issue
temp <- prods.all[c(1925:1926), c(1,8)]

> temp
                   Date      Date2
1925  10/9/2009 0:00:00 2009-10-09
1926 10/15/2009 0:00:00 0200-10-15
Run Code Online (Sandbox Code Playgroud)

如您所见,某些日期的年份不准确.当这一天是两位数时,似乎会出现这种模式.

我查看了几本书并尝试了Google更好的方法,但似乎所有内容都表明我的数据在输入时格式不正确.

鉴于R有多强大,我认为有一种非常简单的方法可以强制我的专栏成为有效的日期,而且我忽略了一个非常明显的解决方案.

我们将非常感谢您提供的任何帮助.

r lubridate

28
推荐指数
2
解决办法
14万
查看次数

如果密钥可能不存在,则从Python dict读取

我是Python和解析数据的新手.

我可以将外部JSON提要拉入Python字典并迭代字典.

for r in results:
     print r['key_name']
Run Code Online (Sandbox Code Playgroud)

当我浏览返回的结果时,当一个键没有值时,我会收到一个错误(记录的值可能并不总是存在).如果我打印结果,则显示为

'key_name': None, 'next_key':.................
Run Code Online (Sandbox Code Playgroud)

我的代码打破了错误.如何控制没有值的键?

任何帮助将不胜感激!

python json

27
推荐指数
2
解决办法
5万
查看次数

使用R从网页中提取链接

下面的两个帖子是从网站提取数据并将其解析为R的不同方法的很好的例子.

使用XML包将html表刮入R数据帧

我如何使用R(Rcurl/XML包?!)来抓取这个网页

我对编程非常陌生,刚开始使用R,所以我希望这个问题非常基本,但考虑到上面的那些帖子,我想是的.

我要做的就是提取与给定模式匹配的链接.我觉得我可以使用RCurl来读取网页并使用字符串表达式提取它们的暴力方法.也就是说,如果网页形成得相当好,我将如何使用XML包进行此操作.

随着我了解更多,我喜欢在查看问题时"查看"数据.问题是这些方法中的一些生成了列表列表等列表,因此新的(像我)这样的人很难走到我需要去的地方.

同样,我对所有编程都是新手,所以任何帮助或代码片段都将不胜感激.

r web-scraping

26
推荐指数
2
解决办法
3万
查看次数

与CSS的Knitr样式桌

我确信我忽略了一些显而易见的东西,但我想kable用自定义css 制作我的桌子.

你可以在这里找到我RMDCSS文件的要点 .

我的目标是利用我在这里找到的一些表CSS示例.

当我运行我的报告时,我的表看起来像这样:

在此输入图像描述

但是从上面的CSS示例中,它应该如下图所示.

在此输入图像描述

我的问题:我错过了什么,或者这种风格水平是不可能的RMarkdown.

我的RMD文件也显示如下:

---
title: "Test Table CSS"
output: 
  html_document:
    theme: NULL
    style: flat-table.css
---

I want to be able to style my tables with CSS. From the looks of it, I should be able to do that 
through the use of `CSS` and `knitr:kable`.  


```{r setup, echo=FALSE}
data(mtcars)
mt_head = head(mtcars[, 1:5])
```

I want to be able to …
Run Code Online (Sandbox Code Playgroud)

css r knitr r-markdown

25
推荐指数
1
解决办法
7028
查看次数

生成动态R降价块

在我的数据集中,我有60个组要分析,并使用R Markdown将其放入HTML报告中.因为我想对每个组应用相同的分析,我希望有一种方法可以动态生成代码块/分析.

简单地说,我想避免复制块60次.

我碰到这个这个问题,它使用儿童knitr.我试图用虹膜数据集复制它.在下面的例子中,我想做的就是生成三个H4标题,每个标题一个.

值得注意的是,我没有嫁给这种方法,它似乎与我想要做的事情有关.

这是我使用的文件:

parent.RMD文件.这将是我的"主人"报告.

Automate Chunks of Analysis in R Markdown 
========================================================


```{r setup, echo=FALSE}
library(knitr)
```


```{r run-numeric-md, include=FALSE}
out = NULL
for (i in as.character(unique(iris$Species))) {
  out = c(out, knit_child('child.Rmd'))
}
Run Code Online (Sandbox Code Playgroud)

```

这是child.Rmd.

#### Species = `r [i]`
Run Code Online (Sandbox Code Playgroud)

r knitr r-markdown

24
推荐指数
2
解决办法
6756
查看次数