gpt4 book ai didi

ruby - 将 Treetop 解析树转换为抽象语法树 (AST)

转载 作者:数据小太阳 更新时间:2023-10-29 08:47:09 27 4
gpt4 key购买 nike

我已经简化了在 Treetop 中表达的语法,并且我正在尝试使用自定义节点将解析器的输出过滤为 AST。

grammar Elem

rule top
lpar 'top' space
args_:(lpar 'args' space ((ident / number) space?)* rpar) space?
rpar <Top>
end

rule ident
[a-zA-Z] [a-zA-Z0-9_]* <Ident>
end

rule number
[0-9]+ <Number>
end

rule space
[\s]+
end

rule lpar
space? '(' space?
end

rule rpar
space? ')' space?
end
end

基本上,它可以解析下面的例子:

(top (args foo bar 42))

自定义节点全部继承Treetop::Runtime::SyntaxNode

现在,我需要将 Treetop 生成的解析树过滤成 AST。

我按照攻略讲解here ,没有成功:我的 AST 只是空的......

我的编译器驱动如下:

require 'treetop'
require 'pp'

require_relative 'elem'
require_relative 'node_extension'

class ElemCompiler
def initialize
@parser=ElemParser.new
end

def compile filename
puts "==> compiling #{filename}"
@ast=parse(filename)
puts "==> AST in memory. Good."
end

def parse filename
pp tree=@parser.parse(IO.read(filename))
pp clean(tree)
end

private

def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
end


end

compiler=ElemCompiler.new.parse ARGV[0]

我错过了什么?

最佳答案

您的代码确实正确解析了提供的表达式。

不过,在 clean 方法中有一个小错误:

def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
end

clean 方法返回最后计算的表达式,即数组元素的 each 方法。实际上,您想要返回的是根节点,因此 pp clean(tree) 行实际上会打印生成的干净树,而不是每个表达式的结果。

可以通过两种方式解决,一种是添加root_node作为返回表达式:

def clean(root_node)
(...)
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node # here
end

或者您可以将解析方法更改为以下内容:

def parse filename
pp tree = @parser.parse(IO.read(filename))
clean(tree) # we clean the tree
pp tree # since tree is an object, side-effects will persist here
end

但是,我不建议清理树。我在这方面有过一些非常糟糕的经历。的确,你得到了一个更清晰的结构,你可以更好地理解,因为 Treetop 通常会保留很多你实际上不需要的信息,但你可能会丢失,例如,使用其标识符(自定义标签)引用已解析表达式的可能性或 Automatically-Defined Element Accessor Methods 对于非终端符号)(这是一个 webarchive 链接)。

此外,在某些情况下,仅仅因为节点的类名是“Treetop::Runtime::SyntaxNode”而清理节点是不正确的,因为在某些情况下,您必须使用模块而不是类来扩展您的节点,在这种情况下,节点类名仍将是“Treetop::Runtime::SyntaxNode”,但节点将从树中清除,您将失去混合模块功能。

让我知道我是否清楚(不幸的是,文档站点似乎已关闭,它有很多我想向您展示的有用示例,而且由于已经有一段时间我不玩语法了,所以我不真的记住了)。

关于ruby - 将 Treetop 解析树转换为抽象语法树 (AST),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24209732/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com