- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我最近试图自学解析器(用于语言/上下文无关语法)如何工作,除了一件事之外,大多数内容似乎都是有意义的。我特别关注 LL(k) 语法,其中两个主要算法似乎是 LL parser (使用堆栈/解析表)和 Recursive Descent parser (简单地使用递归)。
据我所知,递归下降算法适用于所有 LL(k) 语法,甚至可能更多,而 LL 解析器适用于所有 LL(k) 语法。然而,递归下降解析器的实现显然比 LL 解析器简单得多(就像 LL 解析器比 LR 解析器简单一样)。所以我的问题是,使用这两种算法时可能会遇到哪些优点/问题?为什么人们会选择 LL 而不是递归下降,因为它适用于同一组语法并且实现起来更棘手?
最佳答案
LL 通常是比递归下降更有效的解析技术。事实上,在最坏的情况下,一个简单的递归下降解析器实际上将是 O(k^n) (其中 n 是输入大小)。一些技术,例如内存(产生 Packrat 解析器)可以改进这一点,并扩展解析器接受的语法类,但总是存在空间权衡。 LL 解析器(据我所知)始终是线性时间。
另一方面,您的直觉是正确的,即递归下降解析器可以处理比 LL 更大的语法类。递归下降可以处理任何 LL(*) 语法(即无限前瞻)以及一小组模糊语法。这是因为递归下降实际上是 PEG 的直接编码实现,或 Parser Expression Grammar(s) 。具体来说,析取运算符 (a | b
) 不可交换,这意味着 a | b
b 不等于 b |一个。递归下降解析器将按顺序尝试每个替代方案。因此,如果
a
与输入匹配,即使 b
与输入匹配,它也会成功。这使得经典的“最长匹配”歧义(例如悬空 else
问题)只需通过正确排序析取即可得到处理。
综上所述,使用递归下降实现 LL(k) 解析器是可能的,这样它就能以线性时间运行。这是通过本质上内联预测集来完成的,以便每个解析例程在恒定时间内确定给定输入的适当产生式。不幸的是,这种技术消除了对整个语法类的处理。一旦我们进入预测解析,像悬挂
else
这样的问题就不再那么容易解决了。
至于为什么选择LL而不是递归下降,主要是效率和可维护性的问题。递归下降解析器明显更容易实现,但它们通常更难维护,因为它们表示的语法不以任何声明形式存在。大多数重要的解析器用例都会使用解析器生成器,例如 ANTLR 或 Bison。有了这样的工具,算法是直接编码的递归下降还是表驱动的 LL(k) 并不重要。
出于兴趣,也值得研究一下recursive-ascent ,这是一种按照递归下降方式直接编码的解析算法,但能够处理任何 LALR 语法。我还会深入研究 parser combinators ,这是一种将递归下降解析器组合在一起的函数方式。
关于parsing - LL 和递归下降解析器之间的区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1044600/
我想循环遍历 gpx 文件并计算总上升和下降。我有一个函数可以计算两组经纬度点之间的高程差异,我已经设置了 simplexml 来读取和循环遍历 gpx 文件 trkseg 点。 问题是,这不准确(实
我有两个在不同时间段拍摄的数组。如何通过将新玩家标记为上升来检查哪些玩家在列表中上升/下降? 附言- 数组已经根据分数排序。 pastData:[ { playerName:'Jo
我想捕获 ctrl/alt/etc 键的起伏,无论表单上的哪个控件获取 keyup 或 keydown 事件。由于我的表单上有大约 100 个控件,如果我要为每个单独的控件添加代码,那将非常难看。我怎
vector1 = c(2, 2, 2, 2, 2, 2) vector2 = c(2, 2, 3, 3, 3, 3) vector3 = c(2, 2, 1, 2, 2, 2) 我想知道向量中的数字
我不知道如何遵循编译器的建议:consider using a let binding to create a longer lived value。 Playground #![allow(unus
我希望有人能帮助我理解 AngularJS 中的 $scope 遇到的一个恼人的问题。请参阅下面我的代码中的注释: app.controller('MyController', function ($
我有一个 flex 搜索集群,其中有2个节点在2核CPU 8GB ram实例上运行。每个节点都传入了参数“ES_JAVA_OPTS = -Xms3g -Xmx3g”。我有4个索引,每个索引有2个分片和
我正在学习 R(及其通过 quantmod lib 在交易任务中的应用)并定期浏览社区以从这里获得许多新知识和技巧。我对 R 的总体印象和特别是 quantmod lib 的印象 - 它很棒。 在这一
当我们点击屏幕时,我正在绘制纹理正方形。我正在使用相同的纹理。在新 ios 设备中点击几次后,FPS 从 120 下降到 4 左右。每次手指点击时,我都会将点击的点以及纹理和纹理的大小传递给着色器。
只有当对象被点击并且需要从列表中移除时它才会掉落。这是代码: if(event.type == TouchEvent.TOUCH_DOWN){ for(Bottle bottl
我有一个基于SpriteKit的小游戏。 在这个游戏中,我使用了很多带有字母(或字母组合)的节点,用户可以四处移动来构建单词。 这些节点基本上是带有 SKLabelNode 的 SKSpriteNod
我有一个简单的CSS布局 wrapper header left-sidebar / main-content / right-sidebar footer 但我的主要内容似乎下降了(float dr
在标题中,我给出了四个不同的部分,并使用 float 属性使所有内容都显示在一条水平线上。 当我调整浏览器窗口大小时,最后一个 div 位于黑色边框线下方。 如何解决。 http://jsfiddle
CSS: .desc{ text-align: center; color:#60A8D5; padding-top: 17px;
这是一段简单的代码,但我为这个问题尝试过的解决方案都没有奏效。 #ONE { float: left; border: 1
我有一个 SceneKit 设置,其中有一个 Sphere 设置为 Dynamic body。 我能够运行该应用程序并看到球体落在静态 body 地板上。 我想做的是设置场景,这样 sfere 最初就
首先,我的类(class): export class FooBar { ... isFavorite: boolean = false; constructor() { this.isF
我正在尝试删除所有端口上的所有传出 RST 和传入 RST。我正在使用 Debian Linux。我尝试了互联网上列出的所有可能的命令组合,但似乎没有任何效果。 例如,我试过: iptables -A
我正在做这样的事情: fn main() { //[1, 0, 0, 0, 99]; // return [2, 0, 0, 0, 99] //[2, 3, 0, 3, 99]; //
我正在使用 Rusqlite,它可以让你做这样的查询: statement.query_row(params!([1, 2, 3]), ...); params!()定义如下: macro_rules
我是一名优秀的程序员,十分优秀!