- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在编写一种类似 SQL 的语言。假设正确的语法是
USE foo;
SELECT * FROM bar;
但我输入它
US foo;
SELECT * FROM bar;
默认行为是 Antlr 将停止解析并且我丢失了语法高亮显示和大纲 View 。错误消息是 Missing EOF at 'US'
。我将 IParser 重新绑定(bind)到 RuntimeModule 中的自定义解析器
@Override
public Class<? extends org.eclipse.xtext.parser.IParser> bindIParser() {
return CustomCqlParser.class;
}
重写Parser
中的createParser
方法
@Override
protected InternalCqlParser createParser(XtextTokenStream stream) {
return new CustomInternalCqlParser(stream, getGrammarAccess());
}
并覆盖方法处理这部分 recoverFromMismatchedToken
以消耗所有 token 直到分号
@Override
protected Object recoverFromMismatchedToken(IntStream input, int ttype, BitSet follow) throws RecognitionException {
Object out = super.recoverFromMismatchedToken(input, ttype, follow);
if (out == null) {
beginResync();
consumeUntil(input, RULE_T_SEMICOLON);
input.consume();
endResync();
Object matchedSymbol = getCurrentInputSymbol(input);
System.out.println(matchedSymbol);
return matchedSymbol;
}
return out;
}
在这个matchedSymbol
之后是SELECT
,但是语法高亮仍然没有了,antlr停止解析。我怎样才能实现我的目标?
============编辑================================
我将 super.recoverFromMismatchToken
复制到我的自定义类,并将其添加到原始源代码中。
if (ttype != EOF) {
beginResync();
consumeUntil(input, RULE_T_SEMICOLON);
input.consume();
endResync();
Object matchedSymbol = getCurrentInputSymbol(input);
input.consume(); // move past ttype token as if all were ok
return matchedSymbol;
}
如果 token 错误不是在开始时发生并且不是 no viable alternative
异常,这将使语法突出显示继续进行。但它仍然会认为它仍在使用相同的解析规则,而不是开始一个新的解析规则。此外,如果我一开始输入了错误的标记,则预期的标记将是 EOF
。这将使我的“消耗所有 token 直到分号”也失败。
========================编辑====================== ==================
跟踪InternalCqlParser.java
,我发现如果错字发生在语句的第一个关键字中,它会得到一个ID
并返回。我在那之后添加了一个代码片段
if (LA1_0 == RULE_IDENT) {
beginResync();
consumeUntil(input, RULE_T_SEMICOLON);
input.consume();
endResync();
continue;
}
解析会继续,语法高亮会保留在错误语句之后。但是,错误行不会有任何错误标记,而且我在该行之后 丢失了内容帮助。触发内容辅助的类是 Statement
但它不再起作用。
最佳答案
基于词法分析器的解析器(如 Antlr/Xtext 生成的解析器)通常不能很好地支持您要求的内容,因为词法分析器必须在不知道 token 可能匹配的解析器规则的情况下决定生成哪个 token 。
无论如何,我不建议尝试在 Antlr 级别解决此问题,因为您将不得不在 Xtext 工具中进行大量自定义。
如果可能,我建议考虑完全不涉及语法的替代解决方案:
如果你想要更好的语法错误信息,你可以customize他们。
如果您的用例支持用户打字,则自定义 Auto Edit Strategy Provider可能是对的。
如果您想支持用户修复现有查询中的错误,Quick Fixes可能是要走的路(可以结合语法错误消息,参见上面的链接)。
只有当这些都不是一个选项时,并且您确实想要允许这种错误键入的语法,您才应该尝试在语法级别修复它。正如我想你在谈论 Cassandra CQL 的语法,我想有不止一种类型的语句(例如选择、插入等),所以涉及标识符的黑客被解释为关键字不符合语法歧义(除了从他们的丑陋 ;-) )。所以我想你必须列出你愿意接受的所有单词作为替换。在这种情况下,我建议创建一个 Data Type Rule对于每个关键字的错误输入变体和标识符的另一个数据类型规则,包括错误输入的变体,因为我猜你不想禁止“美国”作为标识符。例如:
Use:
('USE' | MistypedUseKeyword) keyspaceName=Identifier ';';
CreateTable:
MistypedUseKeyword:
'US' | 'USW' | 'USEE';
MistypedCreateKeyword:
'CREAT' | 'CREATW' | 'CERATE' | 'CRATE';
MistypedTableKeyword:
'TABL' | 'TALBE' | 'TBLE' | 'TBALE' | 'TABEL';
MistypedKeyword:
MistypedUseKeyword | MistypedCreateKeyword | MistypedTableKeyword;
Identifier:
ID | MistypedKeyword;
关于antlr - xtext 如何容忍解析错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18798144/
让我们考虑以下 ANTLR4 语法(最小示例): grammar Foo; expr : a? b? c? ; 我如何指定 a、b 或 c 中的至少一个 必须出现在表达式? 基本上我正在寻
我为字符串变量声明写了下面的语法。字符串的定义类似于单引号之间的任何内容,但必须有一种方法可以通过使用 $ 字母转义将单引号添加到字符串值。 grammar test; options {
我最近创建了一个 ANTLR3 解析器规则 options : foo bar; 它没有编译,我花了一些时间才发现 options是一个保留字(AntlrWorks 指出了错误,但没有指出原因)。 A
我正在从“The Definitive Antlr reference”一书中学习 Antlr。我还处于起步阶段。我喜欢动手做东西,所以我认为做一个好的示例项目会是一个很好的学习经验。 我正在寻找一个
我们有一个为 antlr V2 编写的语法,我想迁移到 antlr v4。有迁移指南吗?我还想知道对现有 V2 语法的修改,以便我们更好地利用 v4 功能。 最佳答案 我通过编写一个新的 Antlr
介绍 查看文档,ANTLR 2 曾经有一个叫做 predicated lexing 的东西。 ,有这样的例子(受 Pascal 启发): RANGE_OR_INT : ( INT ".."
我已经开始学习 ANTLR,并且拥有 2007 年的书《The Definitive ANTLR Reference》和 ANTLRWorks(用于创建语法的交互式工具)。而且,作为这样的人,我从第三
我正在开发 D 语言的解析器,当我尝试添加“切片”运算符规则时遇到了麻烦。你可以找到它的ANTLR语法here 。基本上问题是,如果词法分析器遇到这样的字符串:“1..2”,它就会完全丢失,并且最终成
在 ANTLR 语法中,我们如何区分变量名和标识符? VAR: ('A'..'Z')+ DIGIT* ; IDENT : ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'
我想在 ANTLR 语法中解析 ISO 8601 日期。 2001-05-03 我的语法文件中有以下条目: date : FOUR_DIGIT ('-')? TWO_DIGIT ('-')? T
我们有一个为 antlr V3 编写的语法,我想迁移到 antlr v4。有没有迁移指南。我还想知道对现有 V3 语法的修改,以便我们很好地利用 v4 的功能。 最佳答案 如果您在 v3 或更早版本中
我正在尝试在一台新计算机上使用 ANTLR v4 语法插件在 IntelliJ 中运行一个简单的语法文件。我已经按照在线步骤在 IntelliJ 中安装插件,插件看起来安装正确。我在 .g4 语法文件
我正在使用 ANTLR 为旧的专有报告规范编写一个解析器,目前我正在尝试实现生成的解析树的访问者,以扩展自动生成的抽象访问类。 我对 ANTLR(我最近才学会)和一般的访问者模式都没有什么经验,但是如
我知道插入符号后缀在 antlr 中的含义(即 make root)但是当插入符号是我一直在阅读的以下语法中的前缀时呢(该语法是全新的,由学习 antlr 的新团队完成)。 .. selectClau
我不知道这个问题是否有效,因为我对源代码解析不是很熟悉。我的目标是为一种现有的编程语言(语言“X”)编写一个源代码完成函数,以供学习之用。 Antlr(v4) 是否适合这样的任务,还是应该手动完成必要
请查看源代码:https://gist.github.com/1684022 . 我定义了两个 token : ID : ('a'..'z' | 'A'..'Z') ('0'..'9' | 'a
我知道“+”、“?”和 '*'。但是,如果我希望某事重复 5 次,该怎么办?例如,如果标识符必须是长度为 5 的十六进制数字符串? 更具体地说,我正在考虑定义一个无限长度的通用词法分析器规则,然后在解
如何控制切换Antlr来自解析器操作的词法分析器模式? 我扩展了生成的 Parser 和 Lexer,所以我可以调用 pushMode和 popMode从解析器女巫依次调用合适的pushMode和 p
我正在使用 ANTLR 来标记一个简单的语法,并且需要区分一个 ID: ID : LETTER (LETTER | DIGIT)* ; fragment DIGIT : '
我有一个这样的 ANTLR 规则 receive returns[Evaluator e,String message] : RECEIVE FILENAME {$e= new ReceiveEv
我是一名优秀的程序员,十分优秀!