- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
因此,在我不到 24 小时的 bison/flex 调查中,我看到很多文档表明左递归优于右递归。有些地方甚至提到,对于左递归,您需要 Bison 解析器堆栈上的常量空间,而右递归则需要 N 阶空间。但是,我找不到任何可以明确解释正在发生的事情的来源。
举个例子(只加减法的解析器):
扫描器:
%%
[0-9]+ {return NUMBER;}
%%
解析器:
%%
/* Left */
expression:
NUMBER
| expression '+' NUMBER { $$ = $1 + $3; }
| expression '-' NUMBER { $$ = $1 - $3; }
;
/* Right */
expression:
NUMBER
| NUMBER '+' expression { $$ = $1 + $3; }
| NUMBER '-' expression { $$ = $1 - $3; }
;
%%
对于 1+5-2 的例子,它似乎是左递归,解析器从词法分析器接收到 '1' 并看到 '1' 匹配 expression: NUMBER
并推送表达式值 1 到解析器堆栈。它看到 + 并插入。然后它看到 5 和表达式 (1),+ 和 5 匹配 expression: expression '+' NUMBER
所以它弹出两次,进行数学计算并将一个值为 6 的新表达式压入堆栈,然后重复减法。在任何一点,堆栈中最多有 3 个符号。所以它就像一个就地计算,从左到右运算。
对于右递归,我不确定为什么它必须将所有符号加载到堆栈上,但我将尝试描述为什么会出现这种情况。它看到 1 并与 expression: NUMBER
匹配,因此它将值为 1 的表达式压入堆栈。它将“+”压入堆栈。当它看到 5 时,我的第一个想法是 5 本身可以匹配 expression: NUMBER
,因此是一个值为 5 的表达式,然后它加上堆栈中的最后两个符号可以匹配 expression: NUMBER '+' expression
但我的假设是因为 expression
在规则的右边,所以它不能抢先将 5 作为表达式求值NUMBER 因为使用 LALR(1),它已经知道更多符号即将到来,所以它必须等到到达列表末尾?
长话短说;
有人可以详细解释一下 Bison 如何管理其解析堆栈,以及它如何使用解析器语法规则进行移位/归约?欢迎愚蠢/人为的例子!
最佳答案
使用 LR(自下而上)解析,每个非终结符在遇到其最后一个标记时被精确地减少。 (LALR 解析是一种简化的 LR 解析,它处理前瞻的精确度略低。)在减少非终端之前,它的所有组件都存在于堆栈中。所以如果你使用正确的递归并且你正在解析
NUMBER + NUMBER + NUMBER + NUMBER
在你到达结尾之前不会开始减少,因为每个 NUMBER
开始一个 expression
并且所有表达式都在最后一个 NUMBER
.
如果您使用左递归,每个 NUMBER
都会终止一个 expression
,因此每次遇到 NUMBER
时都会进行归约。
但这不是使用左递归的原因。您使用左递归是因为它准确地描述了语言。如果您有 7 - 2 - 1
,您希望结果为 4,因为这是代数规则所要求的:表达式被解析为 (7 - 2) - 1
,所以必须先减少 7 - 2
。使用右递归,您会错误地将其计算为 6,因为 2 - 1
会先减少。
大多数运算符关联到左侧,因此您使用左递归。对于偶尔向右关联的运算符,您需要正确的递归并且必须忍受堆栈的增长。没什么大不了的。您的机器有大量内存。
例如,考虑赋值。 a = b = 42
表示 a = (b = 42)
。如果你这样做是左关联的,你首先将 a
设置为 b
,然后尝试将某些东西设置为 42; (a = b) = 42
在大多数语言中都没有意义,这肯定不是预期的操作。
LL(自上而下)解析使用前瞻性来预测哪些生产将减少。它根本无法处理左递归,因为预测以递归循环结束:expression
以 expression
开头,而 expression
以 expression
... 并且解析器永远无法预测 NUMBER
。因此,对于 LL 解析器,您必须使用右递归,然后您的语法无法正确描述语言(假设该语言具有左关联运算符,通常是这种情况)。有些人不介意这一点,但我认为语法实际上应该指示正确的解析,而且我发现使语法可被自上而下的解析器解析所必需的修改是困惑且难以阅读的。您的里程可能会有所不同。
顺便说一下,“强制你的喉咙”是对试图给你好的建议的文档的一种非常吝啬的描述。持怀疑态度是件好事——如果你努力弄清楚事情为什么会这样运作,你就会更好地理解事情——但许多人只是想要好的建议。
关于recursion - 左/右递归和 Bison 解析堆栈行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48604590/
我有一个使用 Yacc 编写的语法。语法的相关部分摘录在这里 postfix : primary | postfix '[' expr ']' | postfix '[' ex
如何在 bison/yacc 中使用继承的属性? 说,我有这样的语法 - 程序 -> stmts 我想做的是在 Bison 身上: 程序:stmts {$$.next = newLabel(); $1
有什么方法可以更改 Bison 错误消息的格式?例如,不要说 syntax error, unexpected T_ID, expected ';' or T_IMPORT说 unexpected i
我的语法有这两个标记声明: %token RP %token ELSE 而这两条规则: Statement : IF LP Exp RP Statement; Statement : IF LP
如果有一个表单的输入文件: BEGIN stuff.... END BEGIN stuff ... END 我的 .y 文件是这样的 %token BEGIN %token END %star
我希望为现有语言创建一个 JavaScript 解析器,该语言目前具有笨拙的“手工制作”C# 和 Java 解析器。我想使用 Jison,并且也一直在尝试学习 Bison 的基础知识。 我不确定如何回
目前我正在研究一个源到源编译器,我已经编写了一个野牛解析器,可以正确地为输入创建 AST。我现在需要对语法树进行多次转换,因此我需要向树中插入许多节点。 我可以手动创建所有要添加到语法树中的结构体/联
如果有一个表单的输入文件: BEGIN stuff.... END BEGIN stuff ... END 我的 .y 文件是这样的 %token BEGIN %token END %star
我正在寻找为现有语言创建 JavaScript 解析器的方法,该语言目前具有笨拙的“手工制作”C# 和 Java 解析器。想用Jison,也在努力学习Bison的基础。 一个我不确定如何回答的问题是
我正在使用 flex/bison 编写解析器(我可以用 Python 编写解析器,但我总是更喜欢经典。) 当我用这个编译代码时: gcc -lfl -ly chance.tab.c lex.yy.c
正在使用 flex/bison 开发编译器。我的构建输出中有此警告。 警告:在默认操作中键入冲突 ('s' '') 请问有什么帮助吗? 最佳答案 它似乎与源中的 %token 和 %type 声明有关
考虑这个 lex.l 文件: %{ #include "y.tab.h" %} digit [0-9] letter [a-zA-Z] %% "+"
我正在为 bison 中的一个简单的 Pascal 编译器编写语法,我想可视化我在 pascal.y 中指定的语法的解析树。是否可以基于我的 pascal.y 文件以图形方式显示语法树? 最佳答案 野
我正在尝试编写一个能够使用以下输入的语法: begin #this is a example x = 56; while x > 0 do begin point 15
我正在尝试使用 BNF 语法编写 Flex/Bison 文件。但是,当我尝试编译时出现错误,而且我不确定如何调试它们。 BNF语法: ::= | head() ::=:: | @ | tail() |
我正在用 Flex/Bison 编写一个小程序来标记/解析我创建的查询语言。 我想知道是否有任何方法可以在 Flex/Bison 中创建任何关键字。 我的意思是:flex 将输入分解成一个标记列表,但
我正在尝试使用 flex 和 bison 创建过滤器,因为我想从复杂的语言中获取某些语法元素。我的计划是使用 flex + bison 来识别语法,并转储出感兴趣元素的位置。 (然后使用脚本根据转储的
我正在尝试实现一个可以进行浮点运算的 Flex/bison 计算器。我的 Flex 代码如下所示 %{ #include "calc.tab.h" #include void yyerror(cha
我正在尝试使用 FLEX 和 BISON 进行一些练习。 这是我写的代码: calc_pol.y %{ #define YYSTYPE double #include "calc_pol.tab.h"
我有一个使用括号和方括号作为分隔符的语法。当由 bison 生成的解析器输入带有不平衡分隔符的输入时,传递给 yyerror 的 YYLTYPE* 中的错误位置是输入的结尾。所以,例如,在输入 x
我是一名优秀的程序员,十分优秀!