分配多个环境

Bra*_*sen 11 r

有人可以向我解释这种行为吗?

a <- b <- c <- new.env()
a$this <- 1
b$this 
# 1
c$this 
# 1 
Run Code Online (Sandbox Code Playgroud)

我原本以为a/b/c会是不同的环境,就像以同样方式创建的变量一样?

但是,在全局环境中会显示三个环境,但是对一个环境的任何操作都会被推送到所有环境中.

Ten*_*bai 13

免责声明:这个答案可能不完全是SFW,因为S-Expressions是R中所有对象的常见类型,缩写为SEXP(是的,S-EXPression,连字符不在你想到的地方).现在,作为SALT"N" PEPA有唱:让我们来谈谈SEXP!


TL; DR:环境作为指针存储在其父环境中,复制变量以访问它,只需复制指针并仍然以同一对象为目标.


我做了一些挖掘根本原因,主要原因是什么是环境,或者实际上,它是如何存储在它的父环境中的.我们来看看new.env:

> new.env
function (hash = TRUE, parent = parent.frame(), size = 29L) 
.Internal(new.env(hash, parent, size))
<bytecode: 0x0000000005972428>
<environment: namespace:base>
Run Code Online (Sandbox Code Playgroud)

好的,是时候去源代码,在names.c:

{"new.env", do_newenv,  0,  11,     3,      {PP_FUNCALL, PREC_FN,   0}},
Run Code Online (Sandbox Code Playgroud)

搜索do_newenv带给我们builtin.c哪个回归(我在这里采取了一个捷径,但让我们保持这个不太长):

ans = NewEnvironment(R_NilValue, R_NilValue, enclos);
Run Code Online (Sandbox Code Playgroud)

NewEnvironment在这里memory.c定义的,上面的评论为我们提供了一个关于发生了什么的线索:

通过将"rho"扩展为通过
将"namelist"上的标签给出的变量名称与"valuelist"元素给出的值配对而获得的框架来创建环境.

代码本身并不那么容易理解:

SEXP NewEnvironment(SEXP namelist, SEXP valuelist, SEXP rho)
{
    SEXP v, n, newrho;

    if (FORCE_GC || NO_FREE_NODES()) {
    PROTECT(namelist);
    PROTECT(valuelist);
    PROTECT(rho);
    R_gc_internal(0);
    UNPROTECT(3);
    if (NO_FREE_NODES())
        mem_err_cons();
    }
    GET_FREE_NODE(newrho);
    newrho->sxpinfo = UnmarkedNodeTemplate.sxpinfo;
    INIT_REFCNT(newrho);
    TYPEOF(newrho) = ENVSXP;
    FRAME(newrho) = valuelist;
    ENCLOS(newrho) = CHK(rho);
    HASHTAB(newrho) = R_NilValue;
    ATTRIB(newrho) = R_NilValue;

    v = CHK(valuelist);
    n = CHK(namelist);
    while (v != R_NilValue && n != R_NilValue) {
    SET_TAG(v, TAG(n));
    v = CDR(v);
    n = CDR(n);
    }
    return (newrho);
}
Run Code Online (Sandbox Code Playgroud)

与全球环境中的变量定义(例如选择读者心灵的健全性)相比gsetVar:

void gsetVar(SEXP symbol, SEXP value, SEXP rho)
{
    if (FRAME_IS_LOCKED(rho)) {
    if(SYMVALUE(symbol) == R_UnboundValue)
        error(_("cannot add binding of '%s' to the base environment"),
          CHAR(PRINTNAME(symbol)));
    }
#ifdef USE_GLOBAL_CACHE
    R_FlushGlobalCache(symbol);
#endif
    SET_SYMBOL_BINDING_VALUE(symbol, value);
}
Run Code Online (Sandbox Code Playgroud)

我们可以看到从父环境可以访问的"值"是新的环境地址,由GET_FREE_NODE父母环境给出(我不确定我在这里是否清楚,但我没有找到正确的措辞).

因此,事实<-被定义为x <- value我们复制指针,我们有多个独立变量,都指向同一个对象.

使用任何引用更新对象更新内存中存在的唯一对象.

SEXP 根据各种文献表示S-Expression,主要是C中的指针.

来自评论,

  • 所以,如果我要总结一下.这是因为`new.env()`返回一个指向环境的指针,基本上当你链接`a <-b <-c <-new.env()`时,你只是将指针推到`b`和`c `因此,所有采取的行动都会自动推送给其他人(因为其他人只是指向第一个). (2认同)
  • @Brandon完全正确.而new.env文档并未明确说明. (2认同)
  • *SEXP*代表什么?谷歌搜索,几乎让我离开办公室. (2认同)
  • @BhargavRao辉煌.用C编程,不安全的工作. (2认同)
  • @BrandonBertelsen我即将编辑Tensibai的答案,添加一条横幅,说明它是NSFW. (2认同)
  • 我认为这种行为更多地与"$ < - "`不与其他对象相比复制"environent"这一事实有关.例如,`a = b = list()`在调用`"$ < - "之前看起来也是相同的"SEXP":``a = b = list(); .内部(检查的(a)); .内部(检查(B)); b $ this = 1; .内部(检查的(a)); .内部(检查(b))的` (2认同)
  • Fyi,这方面的标准参考是**[R语言定义的第2.1.10节](https://cran.r-project.org/doc/manuals/r-release/R-lang.html#Environment-对象)** (2认同)
  • 我检查时感到很惊讶; 然后,我记得几年前读过上面的手册.值得一读.顺便说一句,看起来你已经深入到了R内部. (2认同)

Ric*_*ven 7

new.env()只被调用一次,只创建一个新环境.它们都获得相同的环境,因为您将所有分配链接到同一个new.env()调用.因此,当您指定一个时,您将全部分配给它们.

a <- b <- c <- new.env()

a
# <environment: 0x49c1ed8>
b
# <environment: 0x49c1ed8>
c
# <environment: 0x49c1ed8>
Run Code Online (Sandbox Code Playgroud)

如果您希望它们是独立的环境,请不要链接分配(即使用三个单独的调用new.env()).

为了完整起见,将Tensibai的评论带入 -

这是<-你的代码行的副作用是相同的a <- new.env(); b <- a; c <- a(更明显地没有调用new.env()3次,但是将它引用到3个变量名称)

  • @BrandonBertelsen这是`<-`的副作用你的代码行与`a < - new.env(); b < - a; c < - a`(更明显地没有调用new.env()3次,但是将它引用到3个变量名) (6认同)