java - ANTLR:解析引号字符串中的日期-6ren

java - ANTLR:解析引号字符串中的日期

转载作者：搜寻专家更新时间：2023-11-01 03:34:13

27

4

我在弄清楚如何解析语法中的日期时遇到了问题。

问题在于它与字符串共享其定义，但根据 Antlr 4 文档，它应该通过查看声明顺序来遵循优先级。

这是我的语法:

grammar formula;


/* entry point */
parse: expr EOF;

expr
    : value                                  # argumentArithmeticExpr
    | l=expr operator=('*'|'/'|'%') r=expr   # multdivArithmeticExpr // TODO: test the % operator
    | l=expr operator=('+'|'-') r=expr       # addsubtArithmeticExpr
    | '-' expr                               # minusArithmeticExpr
    | FUNCTION_NAME '(' (expr ( ','  expr )* ) ? ')'# functionExpr
    | '(' expr ')'                           # parensArithmeticExpr
    ;

value
    : number
    | variable
    | date
    | string
    | bool;

/* Atomes */

bool
    : BOOL
    ;

variable
    : '[' (~(']') | ' ')* ']'
    ;

date
    : DQUOTE date_format DQUOTE
    | QUOTE date_format QUOTE
    ;

date_format
    : year=INT '-' month=INT '-' day=INT (hour=INT ':' minutes=INT ':' seconds=INT)?
    ;

string
    : STRING_LITERAL
    ;


number
    : ('+'|'-')? NUMERIC_LITERAL
    ;


/* lexemes de base */

QUOTE   : '\'';
DQUOTE  : '"';
MINUS   : '-';
COLON   : ':';
DOT     : '.';
PIPE    : '|';
BOOL    : T R U E | F A L S E;

FUNCTION_NAME: IDENTIFIER ;

IDENTIFIER
 : [a-zA-Z_] [a-zA-Z_0-9]* // TODO: do we more chars in this set?
 ;

NUMERIC_LITERAL
 : DIGIT+ ( '.' DIGIT* )? ( E [-+]? DIGIT+ )? // ex: 0.05e3
 | '.' DIGIT+ ( E [-+]? DIGIT+ )? // ex: .05e3
 ;

INT: DIGIT+;

STRING_LITERAL
    :  '\'' ( ~'\'' | '\'\'' )* '\''
    |  '"' ( ~'"' | '""' )* '"'
    ;

WS: [ \t\n]+ -> skip;

UNEXPECTED_CHAR: . ;

fragment DIGIT: [0-9];
fragment A:('a'|'A');
fragment B:('b'|'B');
fragment C:('c'|'C');
fragment D:('d'|'D');
fragment E:('e'|'E');
fragment F:('f'|'F');
fragment G:('g'|'G');
fragment H:('h'|'H');
fragment I:('i'|'I');
fragment J:('j'|'J');
fragment K:('k'|'K');
fragment L:('l'|'L');
fragment M:('m'|'M');
fragment N:('n'|'N');
fragment O:('o'|'O');
fragment P:('p'|'P');
fragment Q:('q'|'Q');
fragment R:('r'|'R');
fragment S:('s'|'S');
fragment T:('t'|'T');
fragment U:('u'|'U');
fragment V:('v'|'V');
fragment W:('w'|'W');
fragment X:('x'|'X');
fragment Y:('y'|'Y');
fragment Z:('z'|'Z');

这里的重要部分是:

value
    : number
    | variable
    | date
    | string
    | bool;

date
    : DQUOTE date_format DQUOTE
    | QUOTE date_format QUOTE
    ;

date_format
    : year=INT '-' month=INT '-' day=INT (hour=INT ':' minutes=INT ':' seconds=INT)?
    ;

我的语法需要这些东西:

"a quoted string" -> 给出一个string
"2015-03 TOTOTo" -> 给出了一个字符串，因为日期格式不匹配。
"2015-03-15" -> 给出一个 date 因为它匹配 DQUOTE INT '-' INT '-' INT DQUOTE

我(尝试过？)确保解析器在尝试匹配字符串之前尝试匹配日期:值:...|日期 |字符串| ...。

但是当我使用 grun 实用程序(和我的单元测试......)时，我可以看到它将日期归类为字符串，就像它从不费心检查日期格式一样。

你能告诉我为什么会这样吗？我怀疑我声明语法规则的顺序有问题，但我尝试了一些排列但没有得到任何结果。

最佳答案

问题源于未能理解词法分析器在任何解析器规则被有效考虑之前运行完成。

这意味着，STRING_LITERAL 词法分析器规则将使用所有字符串，包括日期，并且仅输出 STRING_LITERAL 标记。 date 和相关的解析器子规则从未被解析器考虑过。

也许最小的解决方案是将 STRING_LITERAL 词法分析器规则修改为

STRING_LITERAL
    :  { notDateString() }? 
    ( QUOTE  .*? QUOTE
    | DQUOTE .*? DQUOTE
    )
    ;

notDateString 谓词需要 native 代码来执行日期格式和其他字符串之间的基本消歧。

另一种选择是将 STRING_LITERAL 规则完全提升到解析器。可行，但有点困惑，具体取决于是否需要在“真实”字符串中保留空格。

顺便说一句，您可能希望添加一个 token stream dump到您的标准单元测试系列。

关于java - ANTLR:解析引号字符串中的日期，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36503592/

27

4

0

文章推荐： ios - 间歇性 SSL 错误

文章推荐： JavaFX- float 菜单

php - 引号(引号)在乌尔都语中造成问题
我有一个类似 ( www.bbcurdu.com) 的网站。现在我的问题是，当我添加一个带有引号或引号的新故事时，它不会保存在数据库中。如果我删除这些逗号或引号，那么它将保存在数据库中。并正确获取和显
ruby - 如何在 Ruby 1.8.7 中将 Microsoft Office "Smart"或 "Curly"引号/撇号转换为 ASCII 或 UTF-8 "Straight"引号/撇号？
我正在使用(并坚持使用)以下版本的 Ruby: ruby 1.8.7 (2012-06-29 patchlevel 370) [x86_64-linux] 我尝试了很多谷歌搜索，但找不到解决我的问题的
Excel连接字符串中的“引号
我有以下示例数据，我想连接 string1 和 string2 以产生连接结果 "a""b" 使用连接函数我在官方的microsoft excel文档中没有找到任何答案 https://suppo
MySQL 引号
我是 SQL-mySQL 方面的 super 新手，我想查询这些包含具有特定值的列的条目，但该值中已经有引号，它实际上看起来像这样，引号已经存在:“荷兰鹿特丹 Voor Land-en Volkenk
正则表达式匹配所有 unicode 引号
是否有一个简单的正则表达式来匹配所有 unicode 引号？还是必须像这样手动编码: quotes = ur"[\"'\u2018\u2019\u201c\u201d]" 感谢阅读。布莱恩最佳答案
javascript - 禁用特殊字符(引号)
我有下面的代码，禁止将特殊字符插入到 HTML 表单上提交的文本中。可以看出，我需要禁用的特殊字符位于引号之间，而我需要禁用引号 " 本身，但我不能这样做，因为如果我添加另一个中间的引号然后读起来就
java - 替换不在括号内的逗号，引号
对于给定的输入字符串 abc,[def,ghi,ijk],lm,(no,pq,rs),[tu,vw,xy],zs,"as,as,fr"输出应该是 abc [def,ghi,ijk] lm (no,pq
Javascript 引号 ... 淡入淡出
下午好，快乐 4 我在处理一些 javascript 时遇到了问题....我是一个初学者，正在使用这个特定的在线示例来了解如何淡入和淡出多个引号... 我已经实现了 HTML/Javascript/C
javascript - 网页上多行文本上的省略号 + 引号
我想在一段文本周围加上引号。文本不能超过 3 行:如果超过，我想要一个省略号(并且我仍然想要引号)。我附上我现在拥有的东西。我的解决方案使用 JS:虽然纯 CSS 解决方案是理想的，但可能的 CSS
随变量帮助一起发送的 php 引号
我将它发送给一个函数，我想在下面的变量值周围加上双引号，例如 $var = "New York"(注意引号) $fq.=" + area:$state"; 所以当我回显 $state 时我想用双
java - 如何在打印的字符串周围添加 ""引号？
这个问题在这里已经有了答案: How can I make Java print quotes, like "Hello"? (11 个答案) 关闭 9 年前。我想在 java 中打印反引号。但是
构造函数中的 F# 引号、数组和自标识符
我认为这是 F# 的一个众所周知的限制，但我找不到任何好的解决方法…… 所以，这里是代码(我试图让它尽可能简单，所以它可能看起来没有任何意义): [] type Human (makeAName: u
php - 如何调用带参数的php url并在SQLite3上的SQL查询中使用它们(引号…)？
我在Windows 7上，在Apache 2.4上使用PHP 5.6.14版：我必须使用PHP在SQLite3数据库上构建查询选择。 NOTA：我是PHP的再见..... 我的代码如下 '; echo
javascript - 令人困惑的 Javascript 引号
在 jQuery 文档中，大多数字符串都是使用单引号“声明”的。包括documentation用于 jQuery UI。那为什么不呢 $(".datepicker").datepicker({ da
Java，在正则表达式中转义(使用)引号
我正在尝试在 Java 中使用以下正则表达式，它应该与任何 lang="2-char-lang-name" 匹配: String lang = "lang=\"" + L.detectLang(inp
restructuredtext - 如何在指令后立即添加 block 引号？
我试图在 more 之后插入一个 block 引用指令，不接受任何参数: First paragraph. .. more:: Blockquote here! -- Author S
java - 使用正则表达式删除 JSON 引号
我从外部进程获得了一些我无法更改的 JSON，并且我需要修改此 JSON 字符串才能使下游 Java 进程正常工作。 JSON 字符串如下所示: {"widgets":"blah","is_dog":
java - 正则表达式处理逗号、双引号、引号
我试图在从数据库读取数据后生成 CSV 文件。现在单个数据可以包含逗号、单引号和双引号。请告诉我如何在正则表达式的帮助下处理这种情况。最佳答案您可以为 CSV 文件使用不同的分隔符吗？也许是一个
java - arg 参数中的代码模型/引号 (")
我尝试在 codemodel(Sun) 中创建下一个表达式: driver.findElement(By.xpath("//div[text()=\""+whatToclick+"\"]/pare
common-lisp - 引号、列表等用时的区别
我需要知道报价和列表之间的区别。例如: cl-prompt> (equal (first (list * 1 2)) *) T cl-prompt> (equal (first '(* 1 2)) *

首页

博学

6Ren·AI

商城

java - ANTLR:解析引号字符串中的日期