bison - 解决Shift/Reduce冲突的语法规范-6ren

bison - 解决Shift/Reduce冲突的语法规范

转载作者：行者123 更新时间：2023-12-04 13:28:13

25

4

我正在使用Jison(Bison)创建一种简单的标记语言。我显然是新来的，但是稍有变化的效果很好。我只是不了解S/R冲突的根源。

由两个词法分析器操作(具有不同的开始条件)返回“文本”似乎并不重要，我喜欢这一点，因为它似乎允许语法具有更少的规则，并且发给用户的错误消息是一致的。我尝试过不管上下文如何都通用“文本”规则，并且还尝试为每个 token 赋予不同的名称，但是当它们在一起时，似乎对S/R冲突没有任何影响。

该解析器可以创建一个具有纯文本，子数组和各种特殊节点的json对象。

规范:

/* lexical grammar */
%lex

%s bracketed

%%

<bracketed>(\\.|[^\\\,\[\]])+       { yytext = yytext.replace(/\\(.)/g, '$1'); return 'Text'; }
<INITIAL>(\\.|[^\\\[])+             { yytext = yytext.replace(/\\(.)/g, '$1'); return 'Text'; }
"["                                 { this.begin('bracketed'); return '['; }
"]"                                 { this.popState(); return ']'; }
","                                 return ','
<<EOF>>                             return 'END'

/lex

%start template

%%    

template
    : sentence END
    ;

sentence
    : /* empty */
    | sentence Text
    | sentence '[' ']'
    | sentence '[' dynamic ']'
    ;

dynamic
    : sentence
    /*| dynamic ',' sentence*/
    ;

警告:

Conflict in grammar: multiple actions possible when lookahead token is ] in state 5
- reduce by rule: sentence ->
- shift token (then go to state 6)

States with conflicts:
State 5
  sentence -> sentence [ .] #lookaheads= END Text [ ]
  sentence -> sentence [ .dynamic ] #lookaheads= END Text [ ]
  dynamic -> .sentence #lookaheads= ]
  sentence -> . #lookaheads= ] Text [
  sentence -> .sentence Text
  sentence -> .sentence [ ]
  sentence -> .sentence [ dynamic ]

不同的生成器算法或多或少有麻烦，但是它们似乎都有麻烦。

谢谢!

最佳答案

冲突从根本上来自以下两个规则:

sentence: sentence '[' Text ']'
        | sentence '[' sentenceList ']'

原因是，在看到 sentence和 [并查看了下一个标记为 Text之后，解析器不知道是否要移动 Text，匹配第一个规则，还是将那个 Text视为朝向的 sentenceList的开始符合第二条规则。

现在，如果您有一个使用2 token 先行的解析器生成器，这将不成问题，但是bison是LALR(1)(1是一个 token 先行)。

您可以尝试以下几种方法:

在词法分析器中进行了额外的前瞻，以将Text-followed-by-和Text-not-followed-]区别为两个不同的标记，然后重写规则以使用这两个标记。

使用野牛的％glr-parser功能使用GLR解析器。这将双向解析该句子，然后丢弃与

不匹配的句子

重构语法，无需提前2个 token 。

在您的情况下，一种有效的重构方法是重写 sentence规则，使它们全部向右递归，而不是向左递归:

sentence: /* empty */
        | Text sentence 
        | '[' ']' sentence
        | '[' Text ']' sentence
        | '[' sentenceList ']' sentence
        ;

这样可以避免 sentence(或其他以 sentence开头的规则，例如 sentenceList)以 sentence: /*empty*/规则的空值开头。因此，在有问题的情况下，解析器可以自由地移动 Text，从而将缩减推迟到看到下一个标记之前。但是，它确实涉及内存使用问题，因为它会导致解析器，该解析器实际上会将整个输入移至解析器堆栈，然后一次将其减少一个句子。

您可以做的另一种重构是将 [Text]和 []构造包含在 [sentenceList]中:

sentence: /* empty */
        | sentence Text 
        | sentence '[' sentenceList ']'
        ;

sentenceList: sentence
            | sentenceList ',' sentence

因此，现在 sentenceList是由逗号分隔的一个或多个句子(而不是两个或多个)，在 sentence '[' sentenceList ']'规则的操作中，您将检查 sentenceList是否为两个或多个句子并采取适当的措施。

关于bison - 解决Shift/Reduce冲突的语法规范，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12715961/

25

4

0

文章推荐： svg - Safari 6 svg标签使用问题

文章推荐： text - AutoHotKey:即时文本替换

文章推荐： Qt QCompleter 多重匹配

文章推荐：工具按钮下的Qt设置文本

bison - Yacc/Bison 单引号和双引号文字之间的区别
我有一个使用 Yacc 编写的语法。语法的相关部分摘录在这里 postfix : primary | postfix '[' expr ']' | postfix '[' ex
bison - bison/yacc 中的继承属性
如何在 bison/yacc 中使用继承的属性？说，我有这样的语法 - 程序 -> stmts 我想做的是在 Bison 身上: 程序:stmts {$$.next = newLabel(); $1
bison - 更改 Bison 错误消息的格式？
有什么方法可以更改 Bison 错误消息的格式？例如，不要说 syntax error, unexpected T_ID, expected ';' or T_IMPORT说 unexpected i
bison - 用 Bison 解决悬空其他问题
我的语法有这两个标记声明: %token RP %token ELSE 而这两条规则: Statement : IF LP Exp RP Statement; Statement : IF LP
bison - 我如何说服 Bison 解析文件的一部分？
如果有一个表单的输入文件: BEGIN stuff.... END BEGIN stuff ... END 我的 .y 文件是这样的 %token BEGIN %token END %star
bison - 了解 Bison/Jison
我希望为现有语言创建一个 JavaScript 解析器，该语言目前具有笨拙的“手工制作”C# 和 Java 解析器。我想使用 Jison，并且也一直在尝试学习 Bison 的基础知识。我不确定如何回
bison - 使 bison 使用除开始规则以外的规则开始解析
目前我正在研究一个源到源编译器，我已经编写了一个野牛解析器，可以正确地为输入创建 AST。我现在需要对语法树进行多次转换，因此我需要向树中插入许多节点。我可以手动创建所有要添加到语法树中的结构体/联
bison - 我如何说服 Bison 解析文件的一部分？
如果有一个表单的输入文件: BEGIN stuff.... END BEGIN stuff ... END 我的 .y 文件是这样的 %token BEGIN %token END %star
bison - 了解 Bison/吉森
我正在寻找为现有语言创建 JavaScript 解析器的方法，该语言目前具有笨拙的“手工制作”C# 和 Java 解析器。想用Jison，也在努力学习Bison的基础。一个我不确定如何回答的问题是
bison - flex/bison 解析器编译时出现段错误
我正在使用 flex/bison 编写解析器(我可以用 Python 编写解析器，但我总是更喜欢经典。) 当我用这个编译代码时: gcc -lfl -ly chance.tab.c lex.yy.c
bison - 警告 Bison 编译
正在使用 flex/bison 开发编译器。我的构建输出中有此警告。警告:在默认操作中键入冲突 ('s' '') 请问有什么帮助吗？最佳答案它似乎与源中的 %token 和 %type 声明有关
bison - flex/bison 中的半保留字处理
考虑这个 lex.l 文件: %{ #include "y.tab.h" %} digit [0-9] letter [a-zA-Z] %% "+"
bison - 如何在 Bison 中显示语法的抽象语法树？
我正在为 bison 中的一个简单的 Pascal 编译器编写语法，我想可视化我在 pascal.y 中指定的语法的解析树。是否可以基于我的 pascal.y 文件以图形方式显示语法树？最佳答案野
bison - Flex/bison 语法错误
我正在尝试编写一个能够使用以下输入的语法: begin #this is a example x = 56; while x > 0 do begin point 15
bison - BNF 到 Flex/Bison
我正在尝试使用 BNF 语法编写 Flex/Bison 文件。但是，当我尝试编译时出现错误，而且我不确定如何调试它们。 BNF语法: ::= | head() ::=:: | @ | tail() |
bison - 弹性 Bison : how to create Keywords?
我正在用 Flex/Bison 编写一个小程序来标记/解析我创建的查询语言。我想知道是否有任何方法可以在 Flex/Bison 中创建任何关键字。我的意思是:flex 将输入分解成一个标记列表，但
bison - flex 究竟是如何支持 Bison 定位的？
我正在尝试使用 flex 和 bison 创建过滤器，因为我想从复杂的语言中获取某些语法元素。我的计划是使用 flex + bison 来识别语法，并转储出感兴趣元素的位置。 (然后使用脚本根据转储的
bison - flex/bison 将数字解释为 float
我正在尝试实现一个可以进行浮点运算的 Flex/bison 计算器。我的 Flex 代码如下所示 %{ #include "calc.tab.h" #include void yyerror(cha
bison - 柔性/Bison : Why my rule is not regonized?
我正在尝试使用 FLEX 和 BISON 进行一些练习。这是我写的代码: calc_pol.y %{ #define YYSTYPE double #include "calc_pol.tab.h"
bison - 如何在 yacc/bison 中找到用于错误报告的不平衡分隔符？
我有一个使用括号和方括号作为分隔符的语法。当由 bison 生成的解析器输入带有不平衡分隔符的输入时，传递给 yyerror 的 YYLTYPE* 中的错误位置是输入的结尾。所以，例如，在输入 x

首页

博学

6Ren·AI

商城

bison - 解决Shift/Reduce冲突的语法规范