有人可以向我解释这种行为吗?
a <- b <- c <- new.env()
a$this <- 1
b$this
# 1
c$this
# 1
Run Code Online (Sandbox Code Playgroud)
我原本以为a/b/c会是不同的环境,就像以同样方式创建的变量一样?
但是,在全局环境中会显示三个环境,但是对一个环境的任何操作都会被推送到所有环境中.
Ten*_*bai 13
免责声明:这个答案可能不完全是SFW,因为S-Expressions是R中所有对象的常见类型,缩写为SEXP(是的,S-EXPression,连字符不在你想到的地方).现在,作为SALT"N" PEPA有唱:让我们来谈谈SEXP!
TL; DR:环境作为指针存储在其父环境中,复制变量以访问它,只需复制指针并仍然以同一对象为目标.
我做了一些挖掘根本原因,主要原因是什么是环境,或者实际上,它是如何存储在它的父环境中的.我们来看看new.env:
> new.env
function (hash = TRUE, parent = parent.frame(), size = 29L)
.Internal(new.env(hash, parent, size))
<bytecode: 0x0000000005972428>
<environment: namespace:base>
Run Code Online (Sandbox Code Playgroud)
好的,是时候去源代码,在names.c:
{"new.env", do_newenv, 0, 11, 3, {PP_FUNCALL, PREC_FN, 0}},
Run Code Online (Sandbox Code Playgroud)
搜索do_newenv带给我们builtin.c哪个回归(我在这里采取了一个捷径,但让我们保持这个不太长):
ans = NewEnvironment(R_NilValue, R_NilValue, enclos);
Run Code Online (Sandbox Code Playgroud)
这NewEnvironment是在这里memory.c定义的,上面的评论为我们提供了一个关于发生了什么的线索:
通过将"rho"扩展为通过
将"namelist"上的标签给出的变量名称与"valuelist"元素给出的值配对而获得的框架来创建环境.
代码本身并不那么容易理解:
SEXP NewEnvironment(SEXP namelist, SEXP valuelist, SEXP rho)
{
SEXP v, n, newrho;
if (FORCE_GC || NO_FREE_NODES()) {
PROTECT(namelist);
PROTECT(valuelist);
PROTECT(rho);
R_gc_internal(0);
UNPROTECT(3);
if (NO_FREE_NODES())
mem_err_cons();
}
GET_FREE_NODE(newrho);
newrho->sxpinfo = UnmarkedNodeTemplate.sxpinfo;
INIT_REFCNT(newrho);
TYPEOF(newrho) = ENVSXP;
FRAME(newrho) = valuelist;
ENCLOS(newrho) = CHK(rho);
HASHTAB(newrho) = R_NilValue;
ATTRIB(newrho) = R_NilValue;
v = CHK(valuelist);
n = CHK(namelist);
while (v != R_NilValue && n != R_NilValue) {
SET_TAG(v, TAG(n));
v = CDR(v);
n = CDR(n);
}
return (newrho);
}
Run Code Online (Sandbox Code Playgroud)
与全球环境中的变量定义(例如选择读者心灵的健全性)相比gsetVar:
void gsetVar(SEXP symbol, SEXP value, SEXP rho)
{
if (FRAME_IS_LOCKED(rho)) {
if(SYMVALUE(symbol) == R_UnboundValue)
error(_("cannot add binding of '%s' to the base environment"),
CHAR(PRINTNAME(symbol)));
}
#ifdef USE_GLOBAL_CACHE
R_FlushGlobalCache(symbol);
#endif
SET_SYMBOL_BINDING_VALUE(symbol, value);
}
Run Code Online (Sandbox Code Playgroud)
我们可以看到从父环境可以访问的"值"是新的环境地址,由GET_FREE_NODE父母环境给出(我不确定我在这里是否清楚,但我没有找到正确的措辞).
因此,事实<-被定义为x <- value我们复制指针,我们有多个独立变量,都指向同一个对象.
使用任何引用更新对象更新内存中存在的唯一对象.
SEXP 根据各种文献表示S-Expression,主要是C中的指针.
来自评论,
new.env()只被调用一次,只创建一个新环境.它们都获得相同的环境,因为您将所有分配链接到同一个new.env()调用.因此,当您指定一个时,您将全部分配给它们.
a <- b <- c <- new.env()
a
# <environment: 0x49c1ed8>
b
# <environment: 0x49c1ed8>
c
# <environment: 0x49c1ed8>
Run Code Online (Sandbox Code Playgroud)
如果您希望它们是独立的环境,请不要链接分配(即使用三个单独的调用new.env()).
为了完整起见,将Tensibai的评论带入 -
这是
<-你的代码行的副作用是相同的a <- new.env(); b <- a; c <- a(更明显地没有调用new.env()3次,但是将它引用到3个变量名称)