- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
介绍
查看文档,ANTLR 2 曾经有一个叫做 predicated lexing 的东西。 ,有这样的例子(受 Pascal 启发):
RANGE_OR_INT
: ( INT ".." ) => INT { $setType(INT); }
| ( INT '.' ) => REAL { $setType(REAL); }
| INT { $setType(INT); }
;
INT ".."
然后将应用第一个规则(并匹配该输入的
INT
部分),依此类推。
The biggest difference between ANTLR 3 and 4 is that ANTLR 4 takes any grammar you give it unless the grammar had indirect left recursion. That means we don't need syntactic predicates or backtracking so ANTLR 4 does not support that syntax; you will get a warning for using it.
(...)=> syntactic predicates are not supported in ANTLR 4
grammar Demo;
prog: atom (',' atom)* ;
atom: INT { System.out.println("INT: " + $INT.getText()); }
| REAL { System.out.println("REAL: " + $REAL.getText()); }
| a=INT RANGE b=INT { System.out.println("RANGE: " +
$a.getText() + " .. " + $b.getText()); }
;
WS : (' ' | '\t' | '\n' | '\r')+ -> skip ;
INT : ('0'..'9')+ ;
REAL: INT '.' INT? | '.' INT ;
RANGE: '..' ;
Demo.g
,然后编译运行:
$ wget -nc http://www.antlr.org/download/antlr-4.5.2-complete.jar
$ java -jar antlr-4.5.2-complete.jar Demo.g
$ javac -cp antlr-4.5.2-complete.jar Demo*.java
$ java -cp .:antlr-4.5.2-complete.jar org.antlr.v4.gui.TestRig \
Demo prog <<< '1,2.,3.4,5 ..6,7..8'
INT: 1
REAL: 2.
REAL: 3.4
RANGE: 5 .. 6
REAL: 7.
line 1:17 extraneous input '.8' expecting {<EOF>, ','}
INT '..'
发出两个不同的 token ?
.
结尾。之后没有数字,因此从那里学习解决方案似乎不是一种选择。
emit
词法分析器的方法,带有引用
How can I emit more than a single token per lexer rule? 的注释ANTLR 3 wiki 中的常见问题解答页面,所以我想这是一种方法。如果没有人打败我,并且我可以让它在我的例子中工作,我会把它变成一个答案。
_input.LA(int)
检查前瞻的方法。 ANTLR 4
lexical analysis faq提及
_input.LA
无需详谈。这也应该适用于上面的示例,但对于需要考虑多个前瞻字符的场景将很难。
最佳答案
这是一个非常简短的解决方案:
@lexer::members { private int _pos; }
INT_RANGE: INT { _pos=_input.index(); setType(INT); emit(); }
'..' { _input.seek(_pos); };
INT '..'
表达式,然后将输入倒回到
INT
之后我们发出 token 并保存位置。然后在规则末尾使用该位置以更持久的方式倒回输入。
_input.seek
,结果 token 将具有不正确的位置信息。不会影响什么
getCharPositionInLine
返回。在这种情况下,可以做
setCharPositionInLine(getCharPositionInLine() - 2)
..
,这种方法将不起作用一个是处理可变长度的输入。我曾希望我能够保存
getCharPositionInLine()
的结果在第一个 Action 中,可惜这已经反射(reflect)了整个表情的结尾。
LexerATNSimulator.evaluatePredicate
我看到这种方法努力恢复给定的位置状态。因此,我们可以通过滥用语义谓词的副作用来获得正确的状态:
@lexer::members {
private int _savedIndex, _savedLine, _savedColumn;
private boolean remember() {
_savedIndex = _input.index();
_savedLine = getLine();
_savedColumn = getCharPositionInLine();
return true;
}
private void recall(int type) {
_input.seek(_savedIndex);
setLine(_savedLine);
setCharPositionInLine(_savedColumn);
setType(type);
}
}
INT_RANGE: INT { remember() }? '..' { recall(INT); } ;
remember()
来自不同规则的调用会覆盖状态。如果有疑问,您可以使用多个这样的函数或数组的索引,使每个匹配都明确无误。
关于antlr - ANTLR 词法分析器规则中的句法谓词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35724082/
我试图了解传递给 setTimeout 的箭头函数如何记住上一个执行上下文中的 this 的值。我知道在执行箭头函数时会使用词法作用域规则查找 this 值。这是否意味着箭头函数关闭变量和 this
这个问题已经有答案了: How does the "this" keyword in Javascript act within an object literal? [duplicate] (4 个
我已阅读 this问题,我想我已经理解了投票最多的答案,但他说 since basically every programming language in wide use today uses le
如何让这段宏发挥预期的作用? -- 我想从词法环境中捕获 p 而不必将其作为参数发送给宏。 (define-syntax-rule (fi a b) (if p a b)) ;--->capt
Program A() { x, y, z: integer; procedure B() { y: integer; y=0;
我正在用 Java 实现自己的链表。节点类只有一个名为“name”的字符串字段和一个名为“link”的节点。现在我有一个测试驱动程序类,它只按顺序插入几个名字。现在,我正在尝试编写一种排序方法来按字母
考虑到这个question SO,其中调用了整个 C# 内存中编译器。只有lexical and syntactic analyzing时是必需的:将文本解析为词素流,检查它们并退出。 在System
我有 2 个场景。 这失败了: class F { public X X { get; set; } } 错误 CS0102:类型“F” ' 已经包含 ' X 的定义| ' 这个有效: class
我有一个用 NodeJS 执行的 .js 文件。这是我的文件的内容: var ctry = "America"; function outer(msg) { console.log(msg +
我对编写汇编程序的概念非常陌生,即使在阅读了大量 Material 之后,我仍然很难理解几个概念。 将源文件实际分解为 token 的过程是什么?我相信这个过程称为词法分析,我已经到处搜索有意义的真实
在 static scoping,标识符可以通过分析/解析源代码来确定(与动态作用域不同,动态作用域或多或少需要了解调用者环境)。 我的问题是这样的,因为静态作用域只需要解析源代码以了解作用域和标识符
编辑:我在第一个答案后更改了示例代码,因为我想出了一个简单的版本来回避相同的问题。 我目前正在学习 Common Lisp 的作用域属性。在我认为我有一个坚实的理解之后,我决定编写一些我可以预测结果的
考虑这段代码: class Bar(object): pass class Foo(object): def bar(self): return Bar() f = Foo() def Bar
将 ES6 箭头函数与词法 this 绑定(bind)结合使用非常棒。 但是,我刚才在使用典型的 jQuery 单击绑定(bind)时遇到了一个问题: class Game { foo() {
将 ES6 箭头函数与词法 this 绑定(bind)结合使用非常好。 但是,我刚才在将它与典型的 jQuery 点击绑定(bind)一起使用时遇到了一个问题: class Game { foo(
我是一名优秀的程序员,十分优秀!