我不经常在R中使用日期,但我想这很容易.我有一个代表数据框中日期的列.我只想创建一个新的数据框,使用日期按月/年汇总第二列.什么是最好的方法?
我想要第二个数据帧,以便将其提供给绘图.
您将提供的任何帮助将不胜感激!
编辑:供参考:
> str(temp)
'data.frame': 215746 obs. of 2 variables:
$ date : POSIXct, format: "2011-02-01" "2011-02-01" "2011-02-01" ...
$ amount: num 1.67 83.55 24.4 21.99 98.88 ...
> head(temp)
date amount
1 2011-02-01 1.670
2 2011-02-01 83.550
3 2011-02-01 24.400
4 2011-02-01 21.990
5 2011-02-03 98.882
6 2011-02-03 24.900
Run Code Online (Sandbox Code Playgroud) 我正在尝试学习R并想要引入一个SPSS文件,我可以在SPSS中打开它.
我试过使用read.spss
from foreign
和spss.get
from Hmisc
.两条错误消息都是相同的.
这是我的代码:
## install.packages("Hmisc")
library(foreign)
## change the working directory
getwd()
setwd('C:/Documents and Settings/BTIBERT/Desktop/')
## load in the file
## ?read.spss
asq <- read.spss('ASQ2010.sav', to.data.frame=T)
Run Code Online (Sandbox Code Playgroud)
由此产生的错误:
read.spss中的错误("ASQ2010.sav",to.data.frame = T):读取系统文件头的错误此外:警告消息:在read.spss("ASQ2010.sav",to.data.frame = T):ASQ2010.sav:位置0:字符`\ 000'(
此外,我尝试将SPSS文件保存为SPSS 7 .sav文件(之前使用的是SPSS 18).
警告消息:1:在read.spss("ASQ2010_test.sav",to.data.frame = T)中:ASQ2010_test.sav:系统文件2中遇到无法识别的记录类型7,子类型14:在read.spss中("ASQ2010_test. sav",to.data.frame = T):ASQ2010_test.sav:系统文件中遇到无法识别的记录类型7,子类型18
我希望提取R中的anova生成的p值.
这是我正在运行的:
test <- aov(asq[,9] ~ asq[,187])
summary(test)
Run Code Online (Sandbox Code Playgroud)
产量:
Df Sum Sq Mean Sq F value Pr(>F)
asq[, 187] 1 3.02 3.01951 12.333 0.0004599 ***
Residuals 1335 326.85 0.24483
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
12 observations deleted due to missingness
Run Code Online (Sandbox Code Playgroud)
当我看到结构时,这就是我所看到的.我通常可以通过列表来获得我需要的东西,但是我很难用这个.谷歌搜索也似乎揭示了比我更简单的结构.
注意:ASQ是我的数据框架.
str(test)
List of 13
$ coefficients : Named num [1:2] 0.2862 0.0973
..- attr(*, "names")= chr [1:2] "(Intercept)" "asq[, 187]"
$ residuals : Named num [1:1337] 0.519 0.519 …
Run Code Online (Sandbox Code Playgroud) 我有一个python脚本,我想定期运行.我正在运行Windows 7.实现这一目标的最佳方法是什么?最简单的方法?
很可能会暴露我是R的新手,但在SPSS中,运行滞后非常容易.显然这是用户错误,但我缺少什么?
x <- sample(c(1:9), 10, replace = T)
y <- lag(x, 1)
ds <- cbind(x, y)
ds
Run Code Online (Sandbox Code Playgroud)
结果是:
x y
[1,] 4 4
[2,] 6 6
[3,] 3 3
[4,] 4 4
[5,] 3 3
[6,] 5 5
[7,] 8 8
[8,] 9 9
[9,] 3 3
[10,] 7 7
Run Code Online (Sandbox Code Playgroud)
我想我会看到:
x y
[1,] 4
[2,] 6 4
[3,] 3 6
[4,] 4 3
[5,] 3 4
[6,] 5 3
[7,] 8 5
[8,] 9 8
[9,] 3 9
[10,] …
Run Code Online (Sandbox Code Playgroud) 我对R来说比较新,但这是我第一次不得不处理日期转换.我从CSV读取数据(使用read.table()),但我缩短了数据以突出显示我的问题.当读入R时,Date字段是字符.
简单地说,我的大多数日期都被正确强制,除了少数情况.下面的例子有望向您展示正在发生的事情.
# my attempt to coerce the date -- uses the stringr package
prods.all$Date2 <- as.Date(str_sub(prods.all$Date, 1,
str_locate(prods.all$Date, " ")[1]-1),
"%m/%d/%Y")
# grab two rows to highlight my issue
temp <- prods.all[c(1925:1926), c(1,8)]
> temp
Date Date2
1925 10/9/2009 0:00:00 2009-10-09
1926 10/15/2009 0:00:00 0200-10-15
Run Code Online (Sandbox Code Playgroud)
如您所见,某些日期的年份不准确.当这一天是两位数时,似乎会出现这种模式.
我查看了几本书并尝试了Google更好的方法,但似乎所有内容都表明我的数据在输入时格式不正确.
鉴于R有多强大,我认为有一种非常简单的方法可以强制我的专栏成为有效的日期,而且我忽略了一个非常明显的解决方案.
我们将非常感谢您提供的任何帮助.
我是Python和解析数据的新手.
我可以将外部JSON提要拉入Python字典并迭代字典.
for r in results:
print r['key_name']
Run Code Online (Sandbox Code Playgroud)
当我浏览返回的结果时,当一个键没有值时,我会收到一个错误(记录的值可能并不总是存在).如果我打印结果,则显示为
'key_name': None, 'next_key':.................
Run Code Online (Sandbox Code Playgroud)
我的代码打破了错误.如何控制没有值的键?
任何帮助将不胜感激!
獾
下面的两个帖子是从网站提取数据并将其解析为R的不同方法的很好的例子.
我对编程非常陌生,刚开始使用R,所以我希望这个问题非常基本,但考虑到上面的那些帖子,我想是的.
我要做的就是提取与给定模式匹配的链接.我觉得我可以使用RCurl来读取网页并使用字符串表达式提取它们的暴力方法.也就是说,如果网页形成得相当好,我将如何使用XML包进行此操作.
随着我了解更多,我喜欢在查看问题时"查看"数据.问题是这些方法中的一些生成了列表列表等列表,因此新的(像我)这样的人很难走到我需要去的地方.
同样,我对所有编程都是新手,所以任何帮助或代码片段都将不胜感激.
我确信我忽略了一些显而易见的东西,但我想kable
用自定义css 制作我的桌子.
你可以在这里找到我RMD
和CSS
文件的要点 .
我的目标是利用我在这里找到的一些表CSS示例.
当我运行我的报告时,我的表看起来像这样:
但是从上面的CSS示例中,它应该如下图所示.
我的问题:我错过了什么,或者这种风格水平是不可能的RMarkdown
.
我的RMD
文件也显示如下:
---
title: "Test Table CSS"
output:
html_document:
theme: NULL
style: flat-table.css
---
I want to be able to style my tables with CSS. From the looks of it, I should be able to do that
through the use of `CSS` and `knitr:kable`.
```{r setup, echo=FALSE}
data(mtcars)
mt_head = head(mtcars[, 1:5])
```
I want to be able to …
Run Code Online (Sandbox Code Playgroud) 在我的数据集中,我有60个组要分析,并使用R Markdown将其放入HTML报告中.因为我想对每个组应用相同的分析,我希望有一种方法可以动态生成代码块/分析.
简单地说,我想避免复制块60次.
我碰到这个这个问题,它使用儿童knitr
.我试图用虹膜数据集复制它.在下面的例子中,我想做的就是生成三个H4标题,每个标题一个.
值得注意的是,我没有嫁给这种方法,它似乎与我想要做的事情有关.
这是我使用的文件:
parent.RMD
文件.这将是我的"主人"报告.
Automate Chunks of Analysis in R Markdown
========================================================
```{r setup, echo=FALSE}
library(knitr)
```
```{r run-numeric-md, include=FALSE}
out = NULL
for (i in as.character(unique(iris$Species))) {
out = c(out, knit_child('child.Rmd'))
}
Run Code Online (Sandbox Code Playgroud)
```
这是child.Rmd
.
#### Species = `r [i]`
Run Code Online (Sandbox Code Playgroud) r ×8
knitr ×2
python ×2
r-markdown ×2
anova ×1
css ×1
datetime ×1
json ×1
lubridate ×1
spss ×1
time-series ×1
web-scraping ×1
windows ×1
xts ×1
zoo ×1