- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
在 ANTLR 版本 3 中,如何在高级树解析器规则的 @init 操作中获取行号?
例如,在下面的@init 操作中,我想将行号与句子文本一起推送。
sentence
@init { myNodeVisitor.pushScriptContext( new MyScriptContext( $sentence.text )); }
: assignCommand
| actionCommand;
finally {
m_nodeVisitor.popScriptContext();
}
我需要在执行与规则中符号关联的操作之前推送上下文。
一些不起作用的东西:
$sentence.line
-- 它没有定义,尽管 $sentence.text
是。getTreeNodeStream().getTreeAdaptor().getToken( $sentence.start ).getLine()
。 编辑: 实际上,如果 $sentence.start 是一个真实的标记或带有引用的虚构标记,这确实有效——请参阅下面的 Bart Kiers 回答。看来如果我可以在@init 规则中轻松获取匹配的文本和第一个匹配的标记,那么应该也有一种简单的方法来获取行号。
最佳答案
您可以使用以下代码在树语法的标记/树流中向前看 1 步:CommonTree ahead = (CommonTree)input.LT(1)
,您可以将其放在@init
部分。
每个 CommonTree
(ANTLR 中默认的 Tree
实现)都有一个返回 Token
的 getToken()
方法> 与这棵树相关联。并且每个 Token
都有一个 getLine()
方法,毫不奇怪,该方法返回此标记的行号。
因此,如果您执行以下操作:
sentence
@init {
CommonTree ahead = (CommonTree)input.LT(1);
int line = ahead.getToken().getLine();
System.out.println("line=" + line);
}
: assignCommand
| actionCommand
;
您应该能够看到打印出一些正确的行号。我说一些,因为这不会在所有 情况下按计划进行。让我用一个简单的示例语法来演示:
grammar ASTDemo;
options {
output=AST;
}
tokens {
ROOT;
ACTION;
}
parse
: sentence+ EOF -> ^(ROOT sentence+)
;
sentence
: assignCommand
| actionCommand
;
assignCommand
: ID ASSIGN NUMBER -> ^(ASSIGN ID NUMBER)
;
actionCommand
: action ID -> ^(ACTION action ID)
;
action
: START
| STOP
;
ASSIGN : '=';
START : 'start';
STOP : 'stop';
ID : ('a'..'z' | 'A'..'Z')+;
NUMBER : '0'..'9'+;
SPACE : (' ' | '\t' | '\r' | '\n')+ {skip();};
其树语法如下:
tree grammar ASTDemoWalker;
options {
output=AST;
tokenVocab=ASTDemo;
ASTLabelType=CommonTree;
}
walk
: ^(ROOT sentence+)
;
sentence
@init {
CommonTree ahead = (CommonTree)input.LT(1);
int line = ahead.getToken().getLine();
System.out.println("line=" + line);
}
: assignCommand
| actionCommand
;
assignCommand
: ^(ASSIGN ID NUMBER)
;
actionCommand
: ^(ACTION action ID)
;
action
: START
| STOP
;
如果你运行下面的测试类:
import org.antlr.runtime.*;
import org.antlr.runtime.tree.*;
public class Main {
public static void main(String[] args) throws Exception {
String src = "\n\n\nABC = 123\n\nstart ABC";
ASTDemoLexer lexer = new ASTDemoLexer(new ANTLRStringStream(src));
ASTDemoParser parser = new ASTDemoParser(new CommonTokenStream(lexer));
CommonTree root = (CommonTree)parser.parse().getTree();
ASTDemoWalker walker = new ASTDemoWalker(new CommonTreeNodeStream(root));
walker.walk();
}
}
您将看到以下内容正在打印:
line=4
line=0
如您所见,"ABC = 123"
产生了预期的输出(第 4 行),但 "start ABC"
没有(第 0 行)。这是因为 action
规则的根是一个 ACTION
标记,这个标记从未在词法分析器中定义,只在 tokens{...}/
block 。因为它并不真正存在于输入中,默认情况下第 0 行附加到它。如果你想改变行号,你需要提供一个“引用”标记作为这个所谓的imaginary ACTION
标记的参数,它用来将属性复制到自身.
因此,如果将组合语法中的 actionCommand
规则更改为:
actionCommand
: ref=action ID -> ^(ACTION[$ref.start] action ID)
;
行号如预期(第 6 行)。
请注意,每个解析器规则都有一个 start
和 end
属性,它们分别是对第一个和最后一个标记的引用。如果 action
是一个词法分析器规则(例如 FOO
),那么您可以从中省略 .start
:
actionCommand
: ref=FOO ID -> ^(ACTION[$ref] action ID)
;
现在 ACTION
token 已经复制了 $ref
指向的所有属性,除了 token 的类型,当然是 int ACTION
。但这也意味着它复制了 text
属性,所以在我的示例中,AST 由 ref=action ID -> ^(ACTION[$ref.start] action ID)
可能看起来像:
[text=START,type=ACTION]
/ \
/ \
/ \
[text=START,type=START] [text=ABC,type=ID]
当然,它是一个合适的 AST,因为节点的类型是唯一的,但它使调试变得困惑,因为 ACTION
和 START
共享相同的 .text
属性。
您可以通过提供第二个字符串参数将除 .text
和 .type
之外的所有属性复制到虚构 标记,如下所示:
actionCommand
: ref=action ID -> ^(ACTION[$ref.start, "Action"] action ID)
;
如果您现在再次运行相同的测试类,您将看到以下打印内容:
line=4
line=6
如果您检查生成的树,它将如下所示:
[type=ROOT, text='ROOT']
[type=ASSIGN, text='=']
[type=ID, text='ABC']
[type=NUMBER, text='123']
[type=ACTION, text='Action']
[type=START, text='start']
[type=ID, text='ABC']
关于java - 如何在 ANTLR3 tree-parser @init 操作中获取行号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8344264/
让我们考虑以下 ANTLR4 语法(最小示例): grammar Foo; expr : a? b? c? ; 我如何指定 a、b 或 c 中的至少一个 必须出现在表达式? 基本上我正在寻
我为字符串变量声明写了下面的语法。字符串的定义类似于单引号之间的任何内容,但必须有一种方法可以通过使用 $ 字母转义将单引号添加到字符串值。 grammar test; options {
我最近创建了一个 ANTLR3 解析器规则 options : foo bar; 它没有编译,我花了一些时间才发现 options是一个保留字(AntlrWorks 指出了错误,但没有指出原因)。 A
我正在从“The Definitive Antlr reference”一书中学习 Antlr。我还处于起步阶段。我喜欢动手做东西,所以我认为做一个好的示例项目会是一个很好的学习经验。 我正在寻找一个
我们有一个为 antlr V2 编写的语法,我想迁移到 antlr v4。有迁移指南吗?我还想知道对现有 V2 语法的修改,以便我们更好地利用 v4 功能。 最佳答案 我通过编写一个新的 Antlr
介绍 查看文档,ANTLR 2 曾经有一个叫做 predicated lexing 的东西。 ,有这样的例子(受 Pascal 启发): RANGE_OR_INT : ( INT ".."
我已经开始学习 ANTLR,并且拥有 2007 年的书《The Definitive ANTLR Reference》和 ANTLRWorks(用于创建语法的交互式工具)。而且,作为这样的人,我从第三
我正在开发 D 语言的解析器,当我尝试添加“切片”运算符规则时遇到了麻烦。你可以找到它的ANTLR语法here 。基本上问题是,如果词法分析器遇到这样的字符串:“1..2”,它就会完全丢失,并且最终成
在 ANTLR 语法中,我们如何区分变量名和标识符? VAR: ('A'..'Z')+ DIGIT* ; IDENT : ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'
我想在 ANTLR 语法中解析 ISO 8601 日期。 2001-05-03 我的语法文件中有以下条目: date : FOUR_DIGIT ('-')? TWO_DIGIT ('-')? T
我们有一个为 antlr V3 编写的语法,我想迁移到 antlr v4。有没有迁移指南。我还想知道对现有 V3 语法的修改,以便我们很好地利用 v4 的功能。 最佳答案 如果您在 v3 或更早版本中
我正在尝试在一台新计算机上使用 ANTLR v4 语法插件在 IntelliJ 中运行一个简单的语法文件。我已经按照在线步骤在 IntelliJ 中安装插件,插件看起来安装正确。我在 .g4 语法文件
我正在使用 ANTLR 为旧的专有报告规范编写一个解析器,目前我正在尝试实现生成的解析树的访问者,以扩展自动生成的抽象访问类。 我对 ANTLR(我最近才学会)和一般的访问者模式都没有什么经验,但是如
我知道插入符号后缀在 antlr 中的含义(即 make root)但是当插入符号是我一直在阅读的以下语法中的前缀时呢(该语法是全新的,由学习 antlr 的新团队完成)。 .. selectClau
我不知道这个问题是否有效,因为我对源代码解析不是很熟悉。我的目标是为一种现有的编程语言(语言“X”)编写一个源代码完成函数,以供学习之用。 Antlr(v4) 是否适合这样的任务,还是应该手动完成必要
请查看源代码:https://gist.github.com/1684022 . 我定义了两个 token : ID : ('a'..'z' | 'A'..'Z') ('0'..'9' | 'a
我知道“+”、“?”和 '*'。但是,如果我希望某事重复 5 次,该怎么办?例如,如果标识符必须是长度为 5 的十六进制数字符串? 更具体地说,我正在考虑定义一个无限长度的通用词法分析器规则,然后在解
如何控制切换Antlr来自解析器操作的词法分析器模式? 我扩展了生成的 Parser 和 Lexer,所以我可以调用 pushMode和 popMode从解析器女巫依次调用合适的pushMode和 p
我正在使用 ANTLR 来标记一个简单的语法,并且需要区分一个 ID: ID : LETTER (LETTER | DIGIT)* ; fragment DIGIT : '
我有一个这样的 ANTLR 规则 receive returns[Evaluator e,String message] : RECEIVE FILENAME {$e= new ReceiveEv
我是一名优秀的程序员,十分优秀!