加载dplyr包时改变stats :: lag的行为

Mat*_*ley 17 r dplyr

stats::lag使用dplyr包时我遇到了这个功能 问题.具体来说,我从加载前后的滞后函数得到不同的结果dplyr.

例如,这是一个示例时间序列.如果我计算滞后量 k = -1,则滞后序列开始于1971年.

data <- ts(1:10, start = 1970, frequency = 1)
lag1 <- stats::lag(data, k = -1)
start(lag1)[1]

## [1] 1971
Run Code Online (Sandbox Code Playgroud)

现在,如果我加载dplyr,同一个调用会产生一个从1970年开始的滞后序列.

library(dplyr)

## 
## Attaching package: 'dplyr'
## 
## The following object is masked from 'package:stats':
## 
##     filter
## 
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

lag2 <- stats::lag(data, k = -1)
start(lag2)[1]

## [1] 1970

start(lag1)[1] == start(lag2)[1]

## [1] FALSE
Run Code Online (Sandbox Code Playgroud)

鉴于加载时的警告dplyr,我的猜测是这与环境有关.但是,分离dplyr似乎没有帮助.

detach("package:dplyr", unload = TRUE, character.only = TRUE)
lag3 <- stats::lag(data, k = -1)
start(lag3)[1]

## [1] 1970

start(lag1)[1] == start(lag3)[1]

## [1] FALSE
Run Code Online (Sandbox Code Playgroud)

任何建议都非常感谢.到目前为止,我唯一的解决方案是重新计算lag1和之间的R会话lag2.

这是我的会议:

##  setting  value                       
##  version  R version 3.2.0 (2015-04-16)
##  system   i386, mingw32               
##  ui       RTerm                       
##  language (EN)                        
##  collate  English_Canada.1252         
##  tz       America/New_York            
## 
##  package    * version  date       source        
##  assertthat   0.1      2013-12-06 CRAN (R 3.2.0)
##  bitops       1.0-6    2013-08-17 CRAN (R 3.2.0)
##  DBI          0.3.1    2014-09-24 CRAN (R 3.2.0)
##  devtools     1.8.0    2015-05-09 CRAN (R 3.2.0)
##  digest       0.6.8    2014-12-31 CRAN (R 3.2.0)
##  dplyr        0.4.1    2015-01-14 CRAN (R 3.2.0)
##  evaluate     0.7      2015-04-21 CRAN (R 3.2.0)
##  formatR      1.2      2015-04-21 CRAN (R 3.2.0)
##  git2r        0.10.1   2015-05-07 CRAN (R 3.2.0)
##  htmltools    0.2.6    2014-09-08 CRAN (R 3.2.0)
##  httr       * 0.6.1    2015-01-01 CRAN (R 3.2.0)
##  knitr        1.10.5   2015-05-06 CRAN (R 3.2.0)
##  magrittr     1.5      2014-11-22 CRAN (R 3.2.0)
##  memoise      0.2.1    2014-04-22 CRAN (R 3.2.0)
##  Rcpp         0.11.6   2015-05-01 CRAN (R 3.2.0)
##  RCurl        1.95-4.6 2015-04-24 CRAN (R 3.2.0)
##  rmarkdown    0.6.1    2015-05-07 CRAN (R 3.2.0)
##  rversions    1.0.0    2015-04-22 CRAN (R 3.2.0)
##  stringi      0.4-1    2014-12-14 CRAN (R 3.2.0)
##  stringr      1.0.0    2015-04-30 CRAN (R 3.2.0)
##  XML          3.98-1.1 2013-06-20 CRAN (R 3.2.0)
##  yaml         2.1.13   2014-06-12 CRAN (R 3.2.0)
Run Code Online (Sandbox Code Playgroud)

我也unloadNamespace按照@BondedDust的建议尝试过:

unloadNamespace("dplyr")  
lag4 <- stats::lag(data, k = -1)  

## Warning: namespace 'dplyr' is not available and has been replaced  
## by .GlobalEnv when processing object 'sep'  

start(lag4)[1]  

## [1] 1970  

start(lag1)[1] == start(lag4)[1]  

## [1] FALSE
Run Code Online (Sandbox Code Playgroud)

42-*_*42- 18

dplyr包有效地覆盖'滞后'.调度机制没有找到,lag因为该名称确实没有函数,只有两个副本lag.default,一个在'stats'中,一个在'dplyr'中,而'dplyr'副本首先被找到.您可以使用:::-mechanism 强制查找统计信息版本:

> lag2 <- stats::lag.default(data, k = -1)
Error: 'lag.default' is not an exported object from 'namespace:stats'

> lag2 <- stats:::lag.default(data, k = -1)
> stats::start(lag2)[1]
[1] 1971
Run Code Online (Sandbox Code Playgroud)

dplyr:::lag.default不使用的时间序列的特定功能.我无法解释为什么unloadNamespace无法删除函数的定义,但它仍然存在:

> unloadNamespace("dplyr")
> getAnywhere(lag.default)
2 differing objects matching ‘lag.default’ were found
in the following places
  registered S3 method for lag from namespace dplyr
  namespace:stats
Use [] to view one of them
Run Code Online (Sandbox Code Playgroud)

更奇怪:卸载dply-namespace后我看到了这个:

> environment(getAnywhere(lag.default)[1])
<environment: namespace:dplyr>
> environment(getAnywhere(lag.default)[2])
<environment: namespace:dplyr>
> environment(getAnywhere(lag.default)[3])
<environment: namespace:stats>
Run Code Online (Sandbox Code Playgroud)

(然后重新启动并加载dplyr,我看到同样明显的双重输入.)

对于以下帮助页面,还有一些奇怪之处dplyr::lag:

> help(lag,pac=dplyr)
No documentation for ‘lag’ in specified packages and libraries:
you could try ‘??lag’
> help(`lag`,pac=`dplyr`)
No documentation for ‘lag’ in specified packages and libraries:
you could try ‘??lag’
> help(`lag.default`,pac=`dplyr`)  # This finally succeeds!
Run Code Online (Sandbox Code Playgroud)

看看github(在确定我在CRAN上有最新版本的dplyr之后),我发现这是该R CMD check过程的一个问题:https://github.com/hadley/dplyr/commit/f8a46e030b7b899900f2091f41071619d0a46288.显然lag.default不会在未来的版本中覆盖,但lag会掩盖统计版本.我想知道发生了什么lag.zoolag.zooreg.也许它会在包装加载时宣布重写或屏蔽?

  • 仅供参考,我最近遇到了“zoo”包的这个问题。有趣的是,当我在“zoo”之后加载“dplyr”时,“lag.zoo”似乎被屏蔽了,尽管没有警告。42- 的解决方法仍然有效,即“zoo:::lag.zoo(x, n)”。 (2认同)