Big*_*hao 4 r data.table colon-equals
我在 data.table 中遇到了奇怪的错误信息
我使用 修改了一个 data.table :=,它完全没问题,没有任何错误。当我尝试将代码放入函数时,出现以下错误消息。
Error in `:=`(date, as.Date(as.character(date), "%Y%m%d") - 1) :
:= and `:=`(...) are defined for use in j, once only and in particular ways. See help(":="). Check is.data.table(DT) is TRUE.
Run Code Online (Sandbox Code Playgroud)
这是可重现的示例
testdat <- data.table(ID = c(1:10), date = c(20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101), Number = rnorm(10))
# The single line command works fine.
testdat[, date := as.Date(as.character(date),"%Y%m%d") - 1][, Number:= NULL]
# But if I wrote them into a function, it failed.
# ( In this case, it worked as well.. So I got totally lost. )
test2 <- data.frame(ID = c(1:10), date = c(20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101, 20130101), Number = rnorm(10))
readdata <- function(fn){
DT <- data.table(fn)
DT[, date:= as.Date(as.character(date),"%Y%m%d") - 1][, Number:= NULL]
return(DT)
}
Run Code Online (Sandbox Code Playgroud)
为了更好地描述,我将部分原始代码放在这里。所以你可能会明白哪里出错了。
readdata <- function(fn){
DT <- fread(fn, sep=",")
# DT <- fread("1202.txt")
setnames(DT, paste0("V",c(1:12)), column_names)
# Modification on date
setkey(DT,uid)
DT[,date := as.Date(as.character(date),"%Y%m%d") - 1][, ignore:= NULL] #ignore is the name of one column
...}
Run Code Online (Sandbox Code Playgroud)
我有一个 txt 文件列表,我想对每个文件进行计算。第一步是使用fread,然后一步一步进行。假设现在我想根据“1202.txt”文件进行计算。如果我从DT <- fread("1202.txt")然后继续。它不会出现这个错误。
如果我想使用readdata("1202.txt")
错误信息就出来了。最奇怪的是,我使用了readdata之前没有任何错误。
那么这里发生了什么?有什么建议?谢谢。
> sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_United States.1252
[2] LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] data.table_1.8.11
loaded via a namespace (and not attached):
[1] tools_3.0.2
Run Code Online (Sandbox Code Playgroud)
编辑
经过一些试验,我发现如果我修改代码如下,它工作
readdata <- function(fn){
DT <- fread(fn, sep=",")
DT <- data.table(DT) ## Just add this line compared to the original one.
# DT <- fread("1202.txt")
setnames(DT, paste0("V",c(1:12)), column_names)
# Modification on date
setkey(DT,uid)
DT[,date := as.Date(as.character(date),"%Y%m%d") - 1][, ignore:= NULL] #ignore is the name of one column
...}
Run Code Online (Sandbox Code Playgroud)
所以错误是由于fread?在 fread 之后,它应该是一个 data.table。为什么我需要使用 data.table(DT) 来转换它?
编辑
谢谢关注。这是 2014 年 2 月 4 日的更新
我首先卸载了我的 1.8.11,然后按照 Matt 的说明进行操作。再次从CRAN安装1.8.10,然后按照他的代码一步一步来。结果完全没问题,没有任何错误。
然后我卸载了 1.8.11,然后尝试使用预编译的 zip 文件再次安装 1.8.11。
像往常一样,有一条警告消息:
> install.packages("~/Desktop/data.table_1.8.11.zip", repos = NULL)
Warning in install.packages :
package ~/Desktop/data.table_1.8.11.zip?is not available (for R version 3.0.2)
Installing package into C:/Users/James/R/win-library/3.0?(as lib?is unspecified)
package data.table?successfully unpacked and MD5 sums checked
> require(data.table)
Loading required package: data.table
data.table 1.8.11 For help type: help("data.table")
Run Code Online (Sandbox Code Playgroud)
好像是警告信息不对,我装包的时候完全没问题。而此时,整个过程完全没问题。感谢马特和阿伦以及所有其他热心肠的人的耐心。我是data.table的初学者。真的很感激你的好意。
还有一件事,正如我已经在此链接中报告的那样,但仍未解决。
> ?melt.data.table
No documentation for ?elt.data.table?in specified packages and libraries:
you could try ??melt.data.table?
Run Code Online (Sandbox Code Playgroud)
真的很可惜。有任何想法吗?
我在该链接中报告了我的 sessionInfo。我用的是 Win8.1 64bit
重新安装data.table v1.8.10 / v1.8.11(两个版本我都试过)后,重新启动了一个新的R会话。问题解决了。
事实证明,我的问题是由安装了 5 个月大的开发版本引起的。
该data.table网页是有些误导:
为 Windows 预编译的最后推荐快照:v1.8.11 rev931 2013 年 9 月 4 日
[主页][1] 已改进,现在显示为:
install.packages("data.table", repos="http://R-Forge.R-project.org")
或者,如果失败,复制到此主页的最后一个 Windows 预编译 .zip 可能就足够了:v1.8.11 rev1110 2014 年 2 月 4 日
感谢大家的宝贵回答和意见。
| 归档时间: |
|
| 查看次数: |
9623 次 |
| 最近记录: |