gpt4 book ai didi

antlr - 动态创建词法分析器规则

转载 作者:行者123 更新时间:2023-12-01 10:13:42 28 4
gpt4 key购买 nike

这是一个简单的规则:

NAME : 'name1' | 'name2' | 'name3';

是否可以使用包含字符串的数组动态地为此类规则提供替代方案?

最佳答案

Yes, dynamic tokens match IDENTIFIER rule



在这种情况下,只需在 Id 之后进行检查即可。已完全匹配以查看文本是否为 Id匹配在预定义的集合中。如果它在集合中(在我的示例中为 Set),请更改 token 的类型。

一个小演示:

grammar T;

@lexer::members {
private java.util.Set<String> special;

public TLexer(ANTLRStringStream input, java.util.Set<String> special) {
super(input);
this.special = special;
}

}

parse
: (t=. {System.out.printf("\%-10s'\%s'\n", tokenNames[$t.type], $t.text);})* EOF
;

Id
: ('a'..'z' | 'A'..'Z' | '_') ('a'..'z' | 'A'..'Z' | '_' | '0'..'9')*
{if(special.contains($text)) $type=Special;}
;

Int
: '0'..'9'+
;

Space
: (' ' | '\t' | '\r' | '\n') {skip();}
;

fragment Special : ;

如果您现在运行以下演示:

import org.antlr.runtime.*;

public class Main {
public static void main(String[] args) throws Exception {
String source = "foo bar baz Mu";
java.util.Set<String> set = new java.util.HashSet<String>();
set.add("Mu");
set.add("bar");
TLexer lexer = new TLexer(new ANTLRStringStream(source), set);
TParser parser = new TParser(new CommonTokenStream(lexer));
parser.parse();
}
}

您将看到正在打印以下内容:

Id        'foo'
Special 'bar'
Id 'baz'
Special 'Mu'

ANTLR4

对于 ANTLR4,您可以执行以下操作:

grammar T;

@lexer::members {
private java.util.Set<String> special = new java.util.HashSet<>();

public TLexer(CharStream input, java.util.Set<String> special) {
this(input);
this.special = special;
}
}

tokens {
Special
}

parse
: .*? EOF
;

Id
: [a-zA-Z_] [a-zA-Z_0-9]* {if(special.contains(getText())) setType(TParser.Special);}
;

Int
: [0-9]+
;

Space
: [ \t\r\n] -> skip
;

用类测试它:

import org.antlr.v4.runtime.*;
import java.util.HashSet;
import java.util.Set;

public class Main {

public static void main(String[] args) {

String source = "foo bar baz Mu";
Set<String> set = new HashSet<String>(){{
add("Mu");
add("bar");
}};

TLexer lexer = new TLexer(CharStreams.fromString(source), set);
CommonTokenStream tokenStream = new CommonTokenStream(lexer);
tokenStream.fill();

for (Token t : tokenStream.getTokens()) {
System.out.printf("%-10s '%s'\n", TParser.VOCABULARY.getSymbolicName(t.getType()), t.getText());
}
}
}

这将打印:

Id         'foo'
Special 'bar'
Id 'baz'
Special 'Mu'
EOF '<EOF>'

关于antlr - 动态创建词法分析器规则,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9008134/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com