嗨,我正在getParseData
用来修复代码中的某些内容。例如替换=
为<-
txt = "
flag = F
if(flag){
dat = data.frame(x = 1, stringAsFactor = F)
} else {
dat <- 1
}
"
sf = parse(text = txt)
p = getParseData(sf)
p[p$token == 'EQ_ASSIGN', 'text'] = '<-'
Run Code Online (Sandbox Code Playgroud)
现在如何从p
- 显示解析代码的 data.frame - 作为字符串返回到 R 代码?谢谢
更新:试试 getParseText
首先,我无法让示例getParseText
工作:
fn <- function(x) {
x + 1 # A comment, kept as part of the source
}
d <- getParseData(fn)
d
# NULL
Run Code Online (Sandbox Code Playgroud)
然后我尝试模仿?getParseText
示例中的代码:
txt = "
flag = F
f2 = 1 + 1
if(flag){
dat = data.frame(x = 1, stringAsFactor = F)
} else {
dat <- 1
}
"
sf = parse(text = txt)
p = getParseData(sf)
plus <- which(p$token == "'+'")
sum <- p$parent[plus]
p[as.character(sum), ]
cat(getParseText(p, sum))
# 1 + 1
cat(getParseText(p, unique(p$parent)))
# not correct
cat(paste0(unique(getParseText(p, p$id)), collapse=" ")) # incorrect
# flag = F f2 1 + 1 1 + if(flag){
# dat = data.frame(x = 1, stringAsFactor = F)
# } else {
# dat <- 1
# } if ( ) {
# dat = data.frame(x = 1, stringAsFactor = F)
# } { dat data.frame(x = 1, stringAsFactor = F) data.frame x , stringAsFactor } else {
# dat <- 1
# } dat <- 1 <-
Run Code Online (Sandbox Code Playgroud)
您不需要使用getParseData
来替换R 代码中的=
符号<-
。R 的一项令人惊奇的事情是您可以直接对语言进行操作,因此我们将在此处进行操作。
sf = parse(text = txt)
Run Code Online (Sandbox Code Playgroud)
sf
是一个表达式对象,它实际上是一个 R 语言对象列表,每个顶级语句一个:
sf[[1]]
## flag = F
sf[[2]]
## if (flag) {
## dat = data.frame(x = 1, stringAsFactor = F)
## } else {
## dat <- 1
## }
Run Code Online (Sandbox Code Playgroud)
以上是语言调用。调用是一个未计算的 R 语句,您可以从parse
或 中获得quote
:
my.call <- quote(1 + 1)
my.call
## 1 + 1
class(my.call)
## [1] "call"
Run Code Online (Sandbox Code Playgroud)
关于调用的事情是 R 对你的底层结构说谎。R 调用是 R 专门显示和处理的列表(好吧,实际上是成对列表,但这里的区别无关紧要)。我们可以展示他们的真实本性:
as.list(my.call)
## [[1]]
## `+`
##
## [[2]]
## [1] 1
##
## [[3]]
## [1] 1
Run Code Online (Sandbox Code Playgroud)
请注意调用的前导元素如何是“函数”,或者在这种情况下是“运算符”,无论如何它在 R 中只是一个函数(更准确地说是函数/运算符的名称)。呼叫总是如此。第一个元素是函数,后面的元素是参数。R 假装运算符是特殊的并以不同的方式显示它们,但对于底层调用结构和评估,它们是相同的。
看看我们能做什么:
my.call[[1]] <- as.name('-')
my.call
## 1 - 1
Run Code Online (Sandbox Code Playgroud)
我们过去常常as.name
创建一种特殊类型的 R 对象,称为符号。这些可用于在调用中引用函数。可以想象,如果我们可以替换+
为-
,我们也可以为=
和做同样的事情<-
。但是要系统地做到这一点,我们需要通过语言树进行递归。我们将编写一个简单的函数来做到这一点:
symb_rep <- function(lang, from, to) {
if(is.call(lang)) {
if(lang[[1]] == from) lang[[1]] <- to
lang[-1] <- lapply(lang[-1], symb_rep, from, to)
}
lang
}
Run Code Online (Sandbox Code Playgroud)
然后我们可以在我们的原始表达式上运行它,其中recall是一个调用列表,因此我们使用lapply
应用于每个元素:
lang.sub <- lapply(sf, symb_rep, as.name("="), as.name("<-"))
lang.sub
## [[1]]
## flag <- F
##
## [[2]]
## if (flag) {
## dat <- data.frame(x = 1, stringAsFactor = F)
## } else {
## dat <- 1
## }
Run Code Online (Sandbox Code Playgroud)
如果您想要返回字符表示,您可以使用deparse
:
unlist(lapply(lang.sub, deparse))
## [1] "flag <- F"
## [2] "if (flag) {"
## [3] " dat <- data.frame(x = 1, stringAsFactor = F)"
## [4] "} else {"
## [5] " dat <- 1"
## [6] "}"
Run Code Online (Sandbox Code Playgroud)
很酷,不是吗?
最后一点,您会注意到在 中data.frame(x = 1, ...)
,=
没有被替换。这是为什么?好吧,这=
实际上并不存在于通话数据中。它由 R 显示为装饰。实际上,请注意参数名称的存储方式:
as.list(quote(data.frame(x=1, y=2)))
## [[1]]
## data.frame
##
## $x
## [1] 1
##
## $y
## [1] 2
Run Code Online (Sandbox Code Playgroud)
没有=
在望,因为参数名称是调用对象的只是名字。R 只是在打印出调用时显示等号作为视觉辅助,并在解析调用时以相同的方式解释它们。这个“谎言”就是为什么这两个表达式在语义上是不同的:
data.frame(x <- 5)
## x....5
## 1 5
x
## [1] 5
data.frame(x = 1)
## x
## 1 1
x
## [1] 5
Run Code Online (Sandbox Code Playgroud)
前者中R在全局环境中将5赋给x,并为数据框参数组成一个名称。在第二个 R 中x
用作参数名称但不分配给全局环境。因为 R 依赖=
in 参数列表来获取参数名称,所以不能将它与正常的赋值语义一起使用。