parsing - 解决 LALR 歧义-6ren

parsing - 解决 LALR 歧义

转载作者：行者123 更新时间：2023-12-02 21:02:52

我最近对 LALR 的研究足以写一篇 LALR generator ，并且我正在尝试为其构造一个 java 或 c# 风格的语法(其开头指定为 here )。

我知道编写解析器生成器需要额外的努力，就像重新发明轮子一样(为什么不使用 Antlr？)，但我的目标是引导一个业余爱好操作系统，它可以在不依赖第三方工具链的情况下自行编译。我的问题不在于生成器，而在于语法。

我在语句和表达式方面遇到了reduce/reduce 歧义。

我知道如何解决某些类型的歧义，例如 dangling-else，但这些对我来说并不直观，它们让我难住了。

解决这些问题的最佳方法是什么？另外，是否有可以用来帮助可视化解决方案的原型(prototype)设计工具？或者，我应该回到第一步并尝试为语法实现 GLR 解析器生成器吗？

这些声明是合法的:

Generic.List<int> myVar1 = x + 4, myVar2; // stmt -> var-decl ;
                                          // var-decl -> type-name var-decl-list

t = 99;                           // simple-stmt -> assign

i++;                              // simple-stmt -> incr-decr
                                  // incr-decr -> primary-expr ++

json.deserialize<list<int>>(obj); // simple-stmt -> call
                                  // call -> primary-expr ( params )
                                  // ...  -> primary-expr . basic-name ( params )
                                  // ...  -> basic-name . basic-name ( params )

设置方式如下:

basic-name : ident < type-list >
           | ident

nested-name : nested-name . basic-name
            | basic-name

basic-type : int | bool | ...

type-name : nested-name
          | basic-type

stmt : var-decl ;
     | simple-stmt ;
     | ...

var-decl : type-name var-decl-list

var-decl-list : var-decl-list , var-init
              | var-init

var-init : ident assign-op expression
         | ident

simple-stmt : assign
            | call
            | incr-decr

expr : assign-expr

assign-expr : assign
            | cond-expr

assign : unary-expr assign-op expr

...
rel-expr : rel-expr < shift-expr
         ...
         | shift-expr

...
unary-expr : unary-op primary-expr
           | primary-expr

unary-op : + - ! ~ ++ --  // Prefix operators
         | ( type-name )  // Conversion operator

primary-expr : call
             | primary-expr . basic-name
             | primary-expr ++
             | ( expr )
             ...
             | basic-name

call : primary-expr ( params )

incr-decr : primary-expr ++
          | -- primary-expr
          | ...

因此，当解析器等待语句时，*LR(k) 项集内核为 method-body -> { * stmts-opt }该状态的完整项目集如下所示:

method-body -> { * stmts-opt }
stmts-opt -> * stmts
stmts-opt -> *
stmts -> * stmts stmt
stmt -> * var-decl ;
stmt -> * simple-stmt ;
var-decl -> * type-name var-decl-list
simple-stmt -> * assign
simple-stmt -> * call
simple-stmt -> * incr-decr
type-name -> * nested-name
type-name -> * basic-type
nested-name -> * nested-name . basic-name
nested-name -> * basic-name
basic-name -> * ident < type-list >
basic-name -> * ident
assign -> * unary-expr assign-op expr
unary-expr -> * unary-op primary-expr
unary-expr -> * primary-expr
unary-op -> * ( typename )
unary-op -> * ! | ~ | ...
primary-expr -> * call
primary-expr -> * primary-expr . basic-name
primary-expr -> * primary-expr ++
primary-expr -> * basic-name
primary-expr -> * ( expr )
call -> * primary-expr ( params )
incr-decr -> * primary-expr ++
...

当标识符发生移位时，下一个状态是:

basic-name -> ident *
basic-name -> ident * < type-list >

被解析或减少，并将下一个状态带到:

nested-name -> basic-name *
primary-expr -> basic-name *

潜在的冲突。在父状态中，前瞻没有帮助，因为nested-name中有一个点。和primary-expr 。哦，太好了，让我们尝试通过嵌套名称来减少:

type-name -> nested-name *
nested-name -> nested-name * . basic-name

这里没什么可看的...现在，减少 primary-expr 怎么样？相反:

unary-expr -> primary-expr *
primary-expr -> primary-expr * . basic-name
primary-expr -> primary-expr * ++
call -> primary-expr * ( params )
incr-decr -> primary-expr * ++
...

现在当我们移动++ 时，我们得到:

primary-expr -> primary-expr ++ *
incr-decr -> primary-expr ++ *

...另一个归约-归约冲突。

让我们尝试移动 (而不是 ident :

primary-expr -> ( * expr )
unary-op -> ( * type-name )
expr -> * assign-expr
assign-expr -> * assign
assign-expr -> * cond-expr
assign -> * unary-expr assign-op expr
unary-expr -> * unary-op primary-expr
unary-expr -> * primary-expr
unary-op -> * ( typename )
unary-op -> * ! | ~ | ...
primary-expr -> * call
primary-expr -> * primary-expr . basic-name
primary-expr -> * primary-expr ++
primary-expr -> * basic-name
primary-expr -> * ( expr )
call -> * primary-expr ( params )
cond-expr -> * ...
...
rel-expr -> * rel-expr < shift-expr
rel-expr -> * shift-expr
...
type-name -> * nested-name
type-name -> * basic-type
nested-name -> * nested-name . basic-name
nested-name -> * basic-name
basic-name -> * ident < type-list >
basic-name -> * ident

转移 ident 时出现同样的问题或(入栈。

这些只是我到目前为止遇到的。自 basic-name优先于rel-expr ，我假设类似 x < n将被解释为 basic-name -> ident < type-list * ，如果它实际上是一个关系表达式，则会出错。

我的大脑已经达到了我真正需要帮助的地步。

最佳答案

您的帖子中有一些问题，这使得它对于 SO 来说并不理想。但我会尝试对每一项提出一些想法。在我看来，您面临三个问题:

区分表达式语句和非语句表达式。
解析声明中的分层命名类型，而不与表达式语句中的字段访问表达式发生冲突
区分使用 < 作为比较运算符和模板括号。

<小时/>

1。区分表达式语句和非语句表达式。

据我了解，我们的愿望是只允许具有(或可能具有)某种副作用的 as 语句:赋值、增量突变和子例程调用。粗略地说，这对应于Java，其语法包括:

StatementExpression:
  Assignment
  PreIncrementExpression
  PreDecrementExpression
  PostIncrementExpression
  PostDecrementExpression
  MethodInvocation
  ClassInstanceCreationExpression

为 StatementExpression 列出的每个替代方案也出现在 Expression 的派生树中的某个位置，它们已从列表中分解出来的可能性。这是一个非常简洁的示例:

Expression:
  LambdaExpression
  AssignmentExpression

AssignmentExpression:
  ConditionalExpression
  Assignment

Assignment:
  LeftHandSide AssignmentOperator Expression

...

UnaryExpression:
  PreIncrementExpression
  + UnaryExpression
  UnaryExpressionNotPlusMinus

PreIncrementExpression:
  ++ UnaryExpression

UnaryExpressionNotPlusMinus:
  PostfixExpression
  ~ UnaryExpression

PostfixExpression:
  Primary
  ExpressionName
  PostIncrementExpression

PostIncrementExpress:
  PostfixExpression ++

请注意 ExpressionStatement 右侧使用的非终结符在每个优先级上的特殊情况。在 C++ 语法中，不限制哪些表达式可以是语句，因此不需要单独的赋值非终结符:

assignment-expression:
  conditional-expression
  logical-or-expression assignment-operator initializer-clause

但在 Java 中，这是行不通的。它需要创建不派生 ConditionalExpression 的附加非终结符，正是为了允许 Assignment 成为 Statement 和 赋值表达式是一个表达式。

2。解析声明中的分层命名类型，而不与表达式语句中的字段访问表达式发生冲突

与上面类似，这里有必要从其他形式的字段访问表达式中放置分层名称(必须以 basic-name 开头)，该表达式可能以任何(其他)主表达式。前者可以是类型名称或主表达式；后者只能是类型名称。为了做出这种区分，我们需要拆分 primary-expr 产生式:

primary-expr : field-access-expr
             | nested-name

non-field-access-expr:
               call
             | post-increment-expression  // was primary-expr ++
             | ( expr )
             ...

field-access-expr :
               non-field-access-expr
             | field-access-expr . basic-name

3。区分使用 `<` 作为比较运算符和模板括号。

与其他两个问题不同，这个问题实际上可能是语言中的歧义。例如，在 C++ 中，模板括号肯定是不明确的；它们只能通过知道(或被告知)特定名称是否是模板名称来解决。另一方面，在 Java 中，有时要求类型参数位于通用名称之前，从而解决了歧义。例如:

ConstructorDeclarator:
  [TypeParameters] SimpleTypeName ( [FormalParameterList] )

或

MethodInvocation:
  Primary . [TypeArguments] Identifier ( [ArgumentList] )

在 C# 中，还有一个不同的规则，它需要查看 > 后面的字符，该字符可能与开头的 < 匹配。该算法在 C# 手册的 §7.6.4.2 中有描述；我不知道如何在 LALR(1) 解析器中实现它。

关于parsing - 解决 LALR 歧义，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31909960/

文章推荐： asp.net - 如何将行跨度添加到 GridView 中的第一列？

文章推荐： sql - 将表中缺失的列从一个数据库添加到另一数据库

文章推荐： sql-server - 如何在sql中按文本求和或分组

文章推荐： gnuradio - 如何使用 PyBombs 安装特定的 gnuradio 版本？

parse-platform - Parse Image + Parse httpRequest 替换——从 Parse Cloud Code 迁移到 Parse Server on Node (Heroku/AWS/DO)
我发现在使用parse-node包时，不能再使用Parse.Cloud.httpRequest了。我也知道 Parse 的 Image 对象将不可用。到目前为止，我已经能够用原生的替换一些 Pars
parsing - 'parse' 的反义词是什么？
关闭。这个问题是opinion-based 。目前不接受答案。已关闭 9 年前。已锁定。这个问题及其答案是locked因为这个问题是题外话，但却具有历史意义。目前不接受新的答案或互动。我有一个函
parse-platform - Parse Server - 用于配置新 Parse 实例的架构 API
开源 Parse Server 是否包含用于配置新 Parse 实例的 Schema API？我试图消除手动创建应用程序的需要。这是通过 Parse.com 提供的架构 API http://blo
parse-platform - 如何从客户端正确创建 Parse.com Parse.Cloud.httpRequest？
我想从我的云代码发出一个 http 请求，该请求在我的客户端被调用。最佳答案一开始我发现这有点令人困惑，所以希望这会有所帮助。在您的云代码中main.js Parse.Cloud.define(
parsing - *** 异常 : Prelude. 读取 : no parse in Haskell - Parsing, 表达式和递归
这部分代码应该读入两个或更多数字(省略主 io 函数)，然后是一个“+”来给出总和。使用有理数是因为稍后我将进行乘法和其他此类操作。 data Expression = Number Rationa
parse-platform - Parse.Config 在 Parse Server 上不起作用？
我似乎找不到任何关于此的官方信息:Does Parse.Config work on Parse Server?它曾经在 Parse.com 上工作，但是当我尝试迁移到 Parse.Server 时，
passwords - Parse.com 在 Parse.Cloud.beforeSave(Parse.User
我正在尝试找到使用 Parse.com 添加密码要求的最佳程序。似乎最简单的方法是在保存用户数据之前使用云功能执行。我唯一的警告是，只有当密码与数据库中存储的密码不同或者用户不存在于数据库中时，我才想
android - Parse 中的初始化 (com.parse.Parse.Configuration) 无法应用于 MainActivity 错误？
我是 android 开发、应用程序开发和一般开发的初学者，我正在尝试为我的 android 应用程序设置后端数据库。我决定使用一个名为 back4app 的服务，以便获得更加用户友好的数据库体验，因
android - 编译com.parse :parsefacebookutils leads to com. parse.Parse Class not found异常
我目前正在尝试将 Facebook 登录功能添加到我的应用程序。根据Android文档，当我添加 compile 'com.parse:parsefacebookutils-v4-android:1
parsing - 如何使用 PARSE 从字符串中解析货币值
我正在尝试使用 Rebol 2/3 从字符串中解析货币值，货币值的格式为: 10,50 欧元或 10,50 欧元我在浏览了所有 PARSE 文档后想出了这段代码，我可以在 Red 中找到它，但在 R
parsing - DateTimeFormat.parse() 失败
代码: DateTimeFormat dateFormat = DateTimeFormat .getFormat("EEE MMM dd HH:mm:ss zzz y
parse-platform - Parse 上不再有导入按钮
我不再在 Parse 上看到用于导入 JSON 或 CSV 文件的导入按钮。他们是否将其移动到某个地方，或者不再可能导入这些文件类型？最佳答案官方原因是这样的: “[导入类按钮] 几天前被删除，因
parsing - JSON.parse() 是必要的吗？
我正在使用 PHP 从我的服务器检索一些数据。我想在 javascript 应用程序中使用这些数据，所以我正在做这样的事情: var polylines = ; $polylines 只是一个 PHP
parsing - BigInteger.Parse() 对十六进制数给出负数
我已经开始使用 .NET 4 System.Numerics.BigInteger Structure我遇到了一个问题。我正在尝试解析一个包含无符号(正数)的十六进制数字的字符串。我得到一个负数。
parsing - JSON.parse() 是必要的吗？
我正在使用 PHP 从我的服务器检索一些数据。我想在 javascript 应用程序中使用这些数据，所以我正在做这样的事情: var polylines = ; $polylines 只是一个 PHP
parsing - time.Parse 行为
在 Go 中，尝试将字符串转换为 time.Time 时，使用时间包的 Parse 方法不会返回预期结果。似乎问题出在时区。我想更改为 ISO 8601 结合 UTC 日期和时间。 package m
parsing - time.Parse 自定义布局
我正在尝试将此字符串模式 "4-JAN-12 9:30:14" 解析为 time.Time。尝试了 time.Parse("2-JAN-06 15:04:05", inputString) 和许多其
parse-platform - "Please refrain from creating a Parse project inside another Parse project."
从云代码和解析开始。使用this . 如何删除所有 Parse 项目以便开始创建新项目？我收到以下错误: “您想要创建一个新应用程序，还是将 Cloud Code 添加到现有应用程序中？输入“(n)e
parse-platform - parse.com cloudcode 查询，如何告诉 parse 只返回在表中找到的 PFObject 的某些列？
我在解析云代码时有这个功能: Parse.Cloud.define("testfunction", function(request, response) { var username = r
parse-platform - 一个 Parse.Object.saveAll 请求可以保存多少数据？以及一个 Parse.Object.saveAll 将使用多少请求
最近，我在 parse.com 上做了一些测试。我现在面临在后台作业中使用 Parse.Object.saveAll 的问题。从 parse.com 的文档来看，后台作业可以运行 15 分钟。我现在

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城