gpt4 book ai didi

ANTLR4 词法分析器规则未按预期工作

转载 作者:行者123 更新时间:2023-12-05 03:14:03 26 4
gpt4 key购买 nike

我想写一个关于月份和年份的词法分析器规则,规则是(带正则表达式):

"hello"[0-9]{1,2}"ever"([0-9]{2}([0-9]{2})?)?

“hello”和“ever”文字仅用于调试。

也就是说,月份是一位或两位数,年份是两位数或四位。更重要的是,年份部分可以被绕过。

例如: 2015 年 8 月 ->hello08ever2015 或 hello8ever2015 或 hello8ever15 或 hello8ever 或 hello08ever; 2015 年 10 月 -> hello10ever2015 或 hello10ever15 或 hello10ever;

我的词法分析器规则如下(ANTLR4):

grammar Hello;
r : 'hello' TimeDate 'ever' TimeYear? ;

TimeDate : Digit Digit?;

TimeYear : TwoDigit TwoDigit?;

TwoDigit : Digit Digit;

Digit : [0-9] ;

WS : [ \t\r\n]+ -> skip ; // skip spaces, tabs, newlines

但是好像不行。这是我测试的一些日志:

C:\antlr\workspace\demo>java org.antlr.v4.runtime.misc.TestRig Hello r -tree -gui
hello20ever2014
^Z
(r hello 20 ever 2014)

C:\antlr\workspace\demo>grun Hello r -tree -gui

C:\antlr\workspace\demo>java org.antlr.v4.runtime.misc.TestRig Hello r -tree -gui
hello2ever20
^Z
(r hello 2 ever)

C:\antlr\workspace\demo>grun Hello r -tree -gui

C:\antlr\workspace\demo>java org.antlr.v4.runtime.misc.TestRig Hello r -tree -gui
hello20ever14
^Z
(r hello 20 ever)

C:\antlr\workspace\demo>grun Hello r -tree -gui

C:\antlr\workspace\demo>java org.antlr.v4.runtime.misc.TestRig Hello r -tree -gui
hello2ever2014
^Z
(r hello 2 ever 2014)

对于输入:hello2ever20,无法识别年份部分'20';对于输入:hello20ever14,无法识别年份部分“14”;

有人可以帮忙吗???

谢谢!!

最佳答案

你必须意识到 ANTLR 的词法分析器规则是根据它们在语法文件中的位置来匹配的。词法分析器不会“监听”解析器在解析器规则中某个位置可能需要的内容。词法分析器尝试匹配尽可能多的字符,当 2 个(或更多)规则匹配相同数量的字符时,首先定义的规则将获胜。

在您的情况下,这意味着 15 将始终被标记为 TimeDate 而永远不会被标记为 TimeYear 因为这两个规则都匹配 15 但首先定义了 TimeDate2015 将被标记为 TimeYear,因为没有其他规则匹配 4 位数字。

一个解决方案是将 TimeYear 更改为解析器规则:

timeYear
: TimeDate TimeDate?
;

关于ANTLR4 词法分析器规则未按预期工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27541957/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com