java - ANTLR3 语法与谓词不匹配规则-6ren

java - ANTLR3 语法与谓词不匹配规则

转载作者：行者123 更新时间：2023-11-30 06:05:53

30

4

我有一个组合语法，需要提供两个标识符词法分析器规则。两个标识符可以同时使用。在语法中，Identifier1 位于 Identifer2 之前。

第一个标识符是静态的，而第二个标识符规则根据某些标志而变化。(使用谓词)。

我希望第二个标识符在解析器规则中匹配。但由于两个标识符都可能匹配一些常见的输入，因此它不属于 identifer2。

我创建了一些小语法以使其易于理解。语法如下:

@lexer::members
{
  private boolean flag;

  public void setFlag(boolean flag)
  {
    this.flag = flag;
  }
}


identifier1 :
 ID1
 ;

identifier2 :
ID2
; 


ID1 : (CHARS) *;


ID2 : (CHARS | ({flag}? '_'))* ;


fragment CHARS 
: 
  ('a' .. 'z')
;

如果我尝试将 identifer2 规则匹配为:

    ANTLRStringStream in = new ANTLRStringStream("abcabde");
    IdTestLexer lexer = new IdTestLexer(in);
    lexer.setFlag(true);
    CommonTokenStream tokens = new CommonTokenStream(lexer);
    IdTestParser parser = new IdTestParser(tokens);
    parser.identifier2();

显示错误:第 1:0 行在“abcabde”处缺少 ID2

最佳答案

ID1 : (CHARS) *;
ID2 : (CHARS | ({flag}? '_'))* ;

对于 ANTLR 这两条规则意味着:

如果输入只是字符，则为ID1
如果输入混合字符和_和flag == true，则为ID2

请注意，如果flag == false，ID2将永远不会匹配。

<小时/>

词法分析器遵循的两个基本规则是:

它匹配覆盖输入的最长子序列的标记
如果多个标记可以匹配相同的输入，请使用语法中第一个标记

<小时/>

我相信您的核心问题是误解了词法分析器和解析器之间的区别及其用法。您应该问自己的问题是:何时应将 'abcabde' 匹配为 ID1，何时应匹配 ID2？

始终ID1 - 那么您的语法就和现在一样正确。
始终ID2 - 那么您应该切换这两个规则 - 但请注意，在这种情况下，ID1 将永远不会匹配。
这取决于flag - 那么您需要根据您的逻辑修改谓词，仅切换下划线是不够的。
这取决于输入中标识符的使用位置 - 那么这不是词法分析器可以决定的，您需要在解析器而不是词法分析器中区分这两种标识符。形式上，词法分析器使用 regular language当您需要context-free language时来决定这样的标识符。

关于java - ANTLR3 语法与谓词不匹配规则，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51359630/

30

4

0

文章推荐： java - 使用 fop 2.3 版本时找不到 FOP 图像

文章推荐： Java-接口(interface)方法命名约定

文章推荐： java - RequestBody 将属性值传递到集合中

语法
在此处回答的另一个问题中，我发现了以下 JavaScript代码: function _dom_trackActiveElement(evt) { if (evt && evt.target)
语法
if (A == 0) OR (B == 0) 怎么说？最佳答案只是为了讽刺: if (A === 0 || B === 0) 关于语法，我们在Stack Overflow上找到一个类似的问题：
语法
var ret = [] ,xresult = document.evaluate(exp, rootEl, null, X
语法
我一直在寻找一些类似于下例的 JavaScript。有人可以解释一下吗，因为我以前从未见过这样编写的 JavaScript。 “SomethingHere”和冒号代表什么？我习惯于看到函数 myFun
mysql程序: syntax,语法，语法……太难找了
这是我的程序: delimiter // drop procedure if exists migContactToActor; create procedure migContactToActor(
c - 从 icc 获取 Intel 语法 asm 输出，而不是默认的 AT&T 语法？
我遇到了一个问题。我一直在使用 gcc 编译/汇编我的 C 代码一段时间，并且习惯了阅读 Intel 汇编语法。我在生成程序集文件时使用了 -masm=intel 标志。但是最近因为公司迁移，拿到了
语法:自上而下和自下而上的区别？
自上而下和自下而上语法有什么区别？举个例子就太好了。最佳答案首先，语法本身不是自上而下或自下而上的，解析器是(尽管有些语法可以被其中一个解析，但不能被另一个解析)。从实践的角度来看，主要区别在于
AppleScript 语法
我知道这是草率的代码，但它是: display dialog ("Start Screensaver. Please type: matrix, coffee, waffles, star, wate
Java 语法 ": "
这个问题已经有答案了: Giving name to a loop (6 个回答) 已关闭 8 年前。我见过这个字符在 C# 中使用，就像 Java 中的扩展一样，但最近我在代码中发现了这个 loo
在函数中通过指针调用字符串(语法)
我正在尝试编写一个函数来检查字符串是否为回文，但我认为在使用字符串指针时存在一些错误。这段代码有什么问题？ #include #include #define MAX 1000 int IsPalin
Javascript "for"语法
所以在this question我询问了一些 Javascript 是如何被压缩的。问题已得到解答，但以下片段让我非常困惑，以至于我不得不问另一个问题。在这里: for (Y = 0; $ = 'zx
调用函数指针(语法)
假设我有一个接受这些参数的函数。 int create(Ptr * p,void * (*insert)(void *, void *)) { //return something later } 结
C语言未知&语法
这个问题已经有答案了: Bitwise '&' operator (6 个回答) 已关闭 5 年前。我在代码中找到了这个，但我从未遇到过像 & 这样的事情，仅 && if ((code & 1) =
使用继承的c++语法
我在处理继承类及其中的构造函数和方法的语法时遇到了问题。我想实现一个类日期和一个子类 date_ISO，它们将按特定顺序设置给定的日、月、年，并通过一种方法将其写入字符串。我觉得我的基类日期工作正常
MySQL IF THEN AS 语法
我正在尝试通过存储过程填充表，如下所示: SET @resultsCount = (SELECT COUNT(*) FROM tableA); SET @i = 0; WHILE @i THEN
Bash 语法 : What is the "<<"?
谁能解释一下下面代码中的“<<”？ mysql test<
MySQL OR AND 语法
刚刚开始学习 MySQL，这是一个菜鸟问题，也是我在 StackOverflow 上的第一个问题。假设我有 12 个订单状态，我想从其中的 5 个中选择总计。我会使用: SELECT SUM(tot
JavaScript 语法
我的编程背景是在学校学过一点Java。由于某些原因，JavaScript 语法往往让我感到困惑。下面的 JavaScript 代码是一种我不知道如何构成的语法模式: foo.ready = funct
JavaScript 语法 $
我正在阅读 javascript 源代码，并且我以前没有编写过 javascript。我对它的一些语法感到困惑。 $(function () { window.onload=function
JavaScript 语法？
我什至不知道如何命名我想要的东西。那么让我举个例子来解释一下。虽然火狐使用textContent，但其他浏览器支持innerText属性。顺便说一句，如果我使用了错误的术语，请纠正我。无论如何，到目

首页

博学

6Ren·AI

商城

java - ANTLR3 语法与谓词不匹配规则