- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图让解析器识别度量单位,然后根据需要使用监听器转换单位。但是,当解析测试句子时,当解析器在文本的其他部分(例如单词中间)看到单元时,我会得到一个 missing matched input 错误。这是我的代码的简化版本。
UnitsOfMeasure.g4
grammar UnitsOfMeasure;
import
ImperialUnitsParser;
/*------------------------------------------------------------------
* UNITS OF MEASURE PARSER RULES
*------------------------------------------------------------------*/
include_metric_units
: imperial_types
| include_metric_units imperial_types
;
imperial_types
: i_area
;
i_area
: QUANTITY square_inch
| QUANTITY square_feet
| QUANTITY square_mile
| QUANTITY square_yard
;
/*------------------------------------------------------------------
* UNITS OF MEASURE - LEXER RULES
*------------------------------------------------------------------*/
SQUARE
: [S|s]'quare'
| [S|s]'q' '.'?
;
SQUARED
: [S|s]'quared'
| '^2'
| '<sup>2</sup>'
| '²'
| '\u00B2'
;
fragment PLURAL
: 's' ?
| 'es' ?
;
QUANTITY
: '-'? FLOAT
| '-'? DIGITS
;
FLOAT
: DIGITS '.' DIGITS
;
fragment DIGITS
: DIGIT+
;
fragment DIGIT
: '0'..'9'
;
/*------------------------------------------------------------------
* SKIP EVERYTHING ELSE
*------------------------------------------------------------------*/
EVERYTHING
: . -> skip
;
ImperialUnitsParser.g4
parser grammar ImperialUnitsParser;
import ImperialUnitsLexer;
/*------------------------------------------------------------------
* AREA
*------------------------------------------------------------------*/
square_inch
: SQUARE INCH
| INCH SQUARED
;
/*------------------------------------------------------------------
* LENGTH
*------------------------------------------------------------------*/
inch
: INCH
;
ImperialUnitsLexer.g4
lexer grammar ImperialUnitsLexer;
/*------------------------------------------------------------------
* BASE UNITS
*------------------------------------------------------------------*/
INCH
: [I|i]'nch' PLURAL
| [I|i]'n' '.'?
;
转换.java
public static String includeMetricUnits(String parse) throws UnitsOfMeasureParserRuntimeException
{
StringBuilder builder = new StringBuilder(parse);
ANTLRInputStream in = new ANTLRInputStream(builder.toString());
UnitsOfMeasureLexer lexer = new UnitsOfMeasureLexer(in);
CommonTokenStream tokens = new CommonTokenStream(lexer);
UnitsOfMeasureParser parser = new UnitsOfMeasureParser(tokens);
parser.addParseListener(new UnitsOfMeasureParseListener(builder));
parser.addErrorListener(new UnitsOfMeasureErrorListener());
parser.include_metric_units(0);
return builder.toString();
}
因此,此处的监听器会在解析流时对构建器进行一些编辑。一个工作示例如下:
“具有 1550 平方英寸书写空间的白板” 返回:
“一 block 1550 英寸2(1 米2)书写空间的白板”
但是,当我通过添加多个单元使其变得更复杂时,它会报告以下内容:
line 1:44 mismatched input 'in' expecting {EOF, QUANTITY}
在:
“具有 1550 平方英寸书写空间的白板和 775 平方英寸的触摸屏” 返回:
“具有 1550 英寸2(1 米2)书写空间的白板和 775 平方英寸的触摸屏”
在调试器之后,它执行第一次转换而没有错误,然后在它向前看后退出。我可能还没有完全正确地理解递归部分,但本质上,语法应该一直寻找,直到找到一个数量后跟一个度量单位。如果数量后面没有可识别的单位,它应该忽略它并继续。
从错误中我可以看到它在“书写”中拾取了“in”,因为我有一个 Lexer 规则将其识别为英寸,但因为没有数量,它会引发错误。
任何人都可以帮助我解决这个问题,以便我可以获得语法来忽略不匹配的输入吗?谁能告诉我递归位是否正确,以便它一直持续到句子结尾。
最佳答案
当您不想匹配作为另一个词的一部分的标记 INCH
时,您将需要匹配词,并跳过这些词:
WORD
: [a-zA-Z]+ -> skip
;
请务必将此规则放在 您的 INCH
规则之后,否则它也会将输入的 "in"
作为单词匹配(你显然不想要)。您还需要扩展此规则匹配的字符:仅 ascii 字母是不够的。
此外,[I|i]
也匹配管道字符:改为执行 [Ii]
。
虽然正确:
include_metric_units
: imperial_types
| include_metric_units imperial_types
;
它更像是 LR/Bison 风格。更具可读性的是写:
include_metric_units
: imperial_types+
;
要匹配可能在 token 流中但与您的任何产品都不匹配的 token ,只需匹配顶级规则中的任何 token :
parse
: ( include_metric_units // match metrics
| . // or any "dangling" single token
)* // zero or more times
EOF // end of the input
;
include_metric_units
: imperial_types+
;
是的,这是正确的:生产/解析器规则中的 .
(DOT) 匹配单个标记,而不是单个字符。它只匹配词法分析器规则中的单个字符。
当我现在解析输入时
A whiteboard with 1550 square inches of writing space, and
a touchscreen measuring 775 square inches and an in at the end...
(注意最后的 'in'
!),我得到以下解析树:
关于java - Antlr v4 我可以忽略不匹配的输入吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22717130/
我正在尝试设置我的 git 配置,以便我可以使用工作环境和个人环境。 这是我的 ~.gitconfig 文件的内容(碰巧 work 和 private 在 github 上): [url "git@
我有以下情况。我在 Sheet1 上有一个项目列表,我想将项目复制到 Sheet2 并排除特定项目。 假设我在 Sheet1 上有以下项目列表: 我想将“梨”单元格留在 Sheet2 上。 它应该完全
我试图让 gcc 以不同的语言提供错误消息。但它仍然给我英文的错误信息。 我的语言环境输出 varun@varun-desktop:$ 语言环境 LANG=en_IN LC_CTYPE="es_EC.
我在 Linux x86 上使用 gcc。 我的程序将指向 C 函数的指针导出到 LLVM JIT 函数。调用约定是 cdecl。它在 Windows 上的 MingW 上运行良好。但是奇怪的事情发生
windows 上 php 的奇怪问题...我的应用程序加载了一个“核心”文件,该文件加载了一个设置文件、注册自动加载、进行初始化等。在核心文件的顶部我有 include_once("config.p
在工具|选项|调试器选项 |语言异常可以忽略特定的异常类型。是否可以为每个项目定义这个?例如在调试构建配置中(Delphi 2009 和/或 2010)? /编辑:Reported in QC 最佳答
我在一个文本框旁边有 2 个按钮,在这 2 个按钮后面还有另一个文本框。第一个文本框的 tabindex 为 1000,第一个按钮为 1001,第二个按钮为 1002。第二个文本框的 tabindex
我是 python 新手,正在尝试类型提示,但它们似乎只在某些情况下起作用。它们似乎在属性返回类型上按预期工作,但是当我尝试将整数分配给字符串值(即 self._my_string = 4)时,我没有
问题陈述 我有一些国家和这些国家的州的依赖组合框。我使用 VBA 在第一个组合框中填充唯一值,然后在第二个组合框中动态填充唯一值。该代码似乎忽略了初始传递中的条件。 例如,该代码适用于第一个国家/地区
我对 Javascript 有点陌生。我试图做到这一点,以便单击一个页面上的图像会将您带到一个新页面,并在该新页面上显示特定的 div,因此我使用 sessionStorage 来记住并使用 bool
我不确定我是否正确地处理了这个问题。 我有一个 ASP.NET MVC Web 应用程序。有 4 个主要“页面”通过单击菜单选项,可以选择一个页面,并将该页面选项存储在本地存储中。 现在,如果我刷新页
我的页面工作正常,并按预期显示日期和时间,直到我不得不添加 new Date() 以避免 momentjs deprecation warning 。现在我的约会比应有的时间晚了 5 个小时。 我该如
我需要合并一个 fork 项目。不幸的是,CVS $Id 行不同,因此我尝试的合并工具报告所有文件都不同(其中 95% 只有这一行不同) 是否有一个合并工具可以配置为忽略基于模式的行比较结果? [编辑
我是 python 新手,正在尝试类型提示,但它们似乎只在某些情况下起作用。它们似乎在属性返回类型上按预期工作,但是当我尝试将整数分配给字符串值(即 self._my_string = 4)时,我没有
我正在尝试根据 How do a send an HTTPS request through a proxy in Java? 使用代理访问 https 网页 但是我遇到了一个奇怪的问题:HttpsU
我有一个简单的 CMakeLists.txt 文件: cmake_minimum_required(VERSION 2.8.9) project (sample) add_library(Shared
这个问题在这里已经有了答案: typedef pointer const weirdness (6 个答案) 关闭 8 年前。 我有一个结构体 type_s。然后我将指向 struct type_s
我正在尝试制作一个使用 AES 256 加密的应用程序。不幸的是我无法让它工作。也许我没有完全理解密码逻辑。 所以它正在工作,但据我了解,哈希包含密码。但如果我更改密码,输出是相同的。因此,Crypt
我的文件包含一些行,例如 "This is a string." = "This is a string's content." " Another \" example \"" = " New ex
我尝试使用此查询来获取所选健身房的所有用户。 我的问题是查询忽略了这部分:ual.user_id = weekUsers.user_id 查询似乎获取了与我选择的日期匹配的所有用户 ID,而不检查该用
我是一名优秀的程序员,十分优秀!