getParseData 的反转 : from parsed code back to code-6ren

getParseData 的反转 : from parsed code back to code

转载作者：行者123 更新时间：2023-12-05 02:18:37

嗨，我正在使用 getParseData修复代码中的某些内容。例如替换 =与 <-

txt = "
flag = F

if(flag){
        dat = data.frame(x = 1, stringAsFactor = F)
} else {
        dat <- 1
}
"

sf = parse(text = txt)
p = getParseData(sf)

p[p$token == 'EQ_ASSIGN', 'text'] = '<-'

现在如何从 p 返回- 显示已解析代码的数据框 - 将 R 代码作为字符串？谢谢

更新:尝试getParseText

首先我无法得到getParseText中的例子工作:

fn <- function(x) {
        x + 1 # A comment, kept as part of the source
}

d <- getParseData(fn)
d
# NULL

然后我尝试模仿 ?getParseText 中的代码在我的例子中:

txt = "
flag = F

f2 = 1 + 1

if(flag){
        dat = data.frame(x = 1, stringAsFactor = F)
} else {
        dat <- 1
}
"

sf = parse(text = txt)
p = getParseData(sf)

plus <- which(p$token == "'+'")
sum <- p$parent[plus]
p[as.character(sum), ]
cat(getParseText(p, sum))
# 1 + 1

cat(getParseText(p, unique(p$parent)))
# not correct

cat(paste0(unique(getParseText(p, p$id)), collapse=" ")) # incorrect
# flag = F f2 1 + 1 1 + if(flag){
#         dat = data.frame(x = 1, stringAsFactor = F)
# } else {
#         dat <- 1
# } if ( ) {
#         dat = data.frame(x = 1, stringAsFactor = F)
# } { dat data.frame(x = 1, stringAsFactor = F) data.frame x , stringAsFactor } else {
#         dat <- 1
# } dat <- 1 <-

最佳答案

您不需要使用 getParseData替换 =带有 <- 的符号在 R 代码中。 R 的一项令人惊奇的事情是您可以直接在该语言上进行操作，因此我们将在此处进行操作。

sf = parse(text = txt)

sf是一个表达式对象，它实际上是一个 R 语言对象列表，每个顶级语句对应一个对象:

sf[[1]]
## flag = F
sf[[2]]
## if (flag) {
##     dat = data.frame(x = 1, stringAsFactor = F)
## } else {
##     dat <- 1
## }

以上是语言调用。一个 call 是一个未计算的 R 语句，你从 parse 得到它, 或者用 quote :

my.call <- quote(1 + 1)
my.call
## 1 + 1
class(my.call)
## [1] "call"

关于调用的事情是 R 就其底层结构向您撒谎。 R 调用是 R 显示和特殊处理的列表(好吧，实际上是配对列表，但这里的区别无关紧要)。我们可以展示他们的本性:

as.list(my.call)
## [[1]]
## `+`
## 
## [[2]]
## [1] 1
## 
## [[3]]
## [1] 1

请注意调用的前导元素是“函数”，或者在本例中是“运算符”，无论如何在 R 中它只是一个函数(更准确地说是函数/运算符的名称)。通话总是如此。第一个元素是函数，后面的元素是参数。 R 假装运算符很特殊并以不同方式显示它们，但对于底层调用结构和评估它们是相同的。

看看我们能做什么:

my.call[[1]] <- as.name('-')
my.call
## 1 - 1

我们使用了 as.name创建一种称为符号的特殊类型的 R 对象。这些可用于在调用中引用函数。可以想象，如果我们可以替换 +与 - , 我们也可以对 = 做同样的事情和 <- .但要系统地做到这一点，我们需要递归遍历语言树。我们将编写一个简单的函数来执行此操作:

symb_rep <- function(lang, from, to) {
  if(is.call(lang)) {
    if(lang[[1]] == from) lang[[1]] <- to
    lang[-1] <- lapply(lang[-1], symb_rep, from, to)
  }
  lang
}

然后我们可以在我们的原始表达式上运行它，recall 是一个调用列表，所以我们使用 lapply应用于每个元素:

lang.sub <- lapply(sf, symb_rep, as.name("="), as.name("<-"))
lang.sub
## [[1]]
## flag <- F
## 
## [[2]]
## if (flag) {
##     dat <- data.frame(x = 1, stringAsFactor = F)
## } else {
##     dat <- 1
## }

如果你想要返回字符表示，你可以使用 deparse :

unlist(lapply(lang.sub, deparse))
## [1] "flag <- F"                                       
## [2] "if (flag) {"                                     
## [3] "    dat <- data.frame(x = 1, stringAsFactor = F)"
## [4] "} else {"                                        
## [5] "    dat <- 1"                                    
## [6] "}"

很酷，不是吗？

最后一点，您会注意到在 data.frame(x = 1, ...) 中, =没有被更换。这是为什么？嗯，那个=实际上并不存在于调用数据中。它由 R 作为装饰显示。实际上，请注意参数名称是如何存储的:

as.list(quote(data.frame(x=1, y=2)))
## [[1]]
## data.frame
## 
## $x
## [1] 1
## 
## $y
## [1] 2

没有=在视线中，因为参数名称只是调用对象的名称。 R 在打印调用时仅显示等号作为视觉辅助，并在解析调用时以相同的方式解释它们。这个“谎言”就是为什么这两个表达式在语义上是不同的:

data.frame(x <- 5)
##   x....5
## 1      5
x
## [1] 5
data.frame(x = 1)
##   x
## 1 1
x
## [1] 5

前面R在全局环境中将5赋值给x，并为data frame参数起个名字。在第二个 R 中使用 x作为参数名称但不分配给全局环境。因为 R 依赖于 =在参数列表中获取参数名称时，它不能将其与正常的赋值语义一起使用。

关于getParseData 的反转 : from parsed code back to code，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44786316/

文章推荐： odata - 微软图形 API : Filter by GUID value

文章推荐： PHP 警告 PHP 启动无法加载动态库 php_pdo_sqlsrv_7_ts_x64.dll

文章推荐： arrays - 如何将数组作为参数传递给 R 脚本命令行运行？

文章推荐：斯卡拉 : Collect with generics

getParseData 的反转 : from parsed code back to code
嗨，我正在使用 getParseData修复代码中的某些内容。例如替换 =与 <- txt = " flag = F if(flag){ dat = data.frame(x = 1,

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

getParseData 的反转 : from parsed code back to code