- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
似乎 GCC 和 LLVM-Clang 使用的是手写递归下降解析器,不是机器生成的、基于 Bison-Flex 的、自下而上的解析。
这里有人可以确认是这种情况吗?如果是这样,为什么主流编译器框架使用手写解析器?
最佳答案
有一个民间定理说 C 很难解析,而 C++ 基本上是不可能的。
这不是真的。
事实是,C 和 C++ 很难使用 LALR(1) 解析器进行解析,而无需破解解析机制和纠缠在符号表数据中。事实上,GCC 曾经使用 YACC 和其他像这样的 hackery 来解析它们,是的,它很丑陋。 现在 GCC 使用手写解析器,但仍然使用符号表 hackery。 Clang 人员从未尝试过使用自动解析器生成器;据我所知,Clang 解析器一直是手工编码的递归下降。
事实是,C 和 C++ 相对容易用更强大的自动生成的解析器解析,例如 GLR parsers ,而且您不需要任何技巧。 Elsa C++ 解析器就是其中一个例子。我们的C++ Front End是另一个(就像我们所有的“编译器”前端一样,GLR 是非常棒的解析技术)。
我们的 C++ 前端不如 GCC 的快,而且肯定比 Elsa 慢;我们没有投入多少精力仔细调整它,因为我们还有其他更紧迫的问题(尽管它已被用于数百万行 C++ 代码)。 Elsa 可能比 GCC 慢,因为它更通用。考虑到如今的处理器速度,这些差异在实践中可能并不重要。
但是今天广泛分布的“真正的编译器”的根源是 10 年或 20 年前或更早的编译器。那时效率低下更为重要,而且没有人听说过 GLR 解析器,因此人们按照他们知道的方式去做。 Clang 肯定是最近才出现的,但是民间定理在很长一段时间内都保持着“说服力”。
您不必再这样做了。您可以非常合理地使用 GLR 和其他此类解析器作为前端,同时提高编译器的可维护性。
是的事实是,很难获得符合友好社区编译器行为的语法。虽然几乎所有的 C++ 编译器都实现了(大部分)原始标准,但它们也往往有很多暗角扩展,例如 MS 编译器中的 DLL 规范等。如果你有一个强大的解析引擎,你可以花时间尝试使最终语法符合现实,而不是尝试改变语法以符合解析器生成器的限制。
2012 年 11 月编辑:自撰写此答案以来,我们改进了 C++ 前端以处理完整的 C++11,包括 ANSI、GNU 和 MS 变体方言。虽然有很多额外的东西,但我们不必更改解析引擎;我们刚刚修改了语法规则。我们确实必须改变语义分析; C++11 在语义上非常复杂,这项工作淹没了让解析器运行的努力。
2015 年 2 月编辑:...现在可以处理完整的 C++14。 (请参阅 get human readable AST from c++ code 了解一些简单代码的 GLR 解析,以及 C++ 臭名昭著的“最令人烦恼的解析”)。
2017 年 4 月编辑:现在处理(草案)C++17。
关于c - GCC 和 Clang 解析器真的是手写的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6319086/
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
枚举类型的值是该类型的静态变量。 据我所知,变量是由引用变量引用的,但没有新的运算符来实例化枚举对象。但这就像初始化数组一样吗? 这是对还是错? 最佳答案 是的,枚举类型的文字是 public sta
我阅读了有关关闭 zsh 自动更正以完成命令的所有提示。但是,它们并没有完全发挥作用。我试过 DISABLE_CORRECTION="true", unsetopt correct, unsetopt
我知道这个问题是 answered before ,但给出的答案并不是完整的故事: 我进入了 Firefox 的 Options->Content 并删除了除德语/德国之外的所有语言,navigato
我知道用汇编语言编写任何内容或将汇编语言添加到任何程序都会损害其可移植性。但是,有多糟糕呢?我的意思是,现在基本上所有 PC 都是 x86 或 x64,对吧?那么,如果我将汇编嵌入到 C 程序中,为什
我正计划构建一个 Web 服务客户端,它始终检查数据库中的某些记录,并根据数据库内容的结果在每个时刻及时执行某些决策。 所以我在想,我怎样才能让客户端一直运行呢? 我唯一想到的就是无限循环。像这样的东
我无法获取小部件的实际背景颜色。在我的特殊情况下,我在使用 QTabWidget 中的小部件时遇到了问题。 这是在 Windows7 上。所以经典小部件有一些灰色背景,而选项卡中的小部件通常用白色背景
请不要将我指向How to wrap preference title?因为它不适用于(正如我评论的那样)您使用 @strings/ 的情况对 strings.xml 文件的引用。 如果你使用 and
情况如下: 已知hdfs是仅附加的(本身没有更新)。 配置单元将数据写入其位于hdfs中的仓库。 可以在配置单元中执行更新 这意味着写入了新数据,旧数据应该以某种方式标记为已弃用,然后在某个时间将其清
在javascript中删除cookies的方法是将过期日期设置为过去。现在这实际上并没有删除 cookie,至少在 Firefox 中是这样。这只是意味着 cookie 将在浏览器关闭时被删除。 这
我需要终止一个卡住的线程,我将 IsBackground 设置为 true 但它仍然存在。线程的属性: ThreadState = AbortRequested IsBackground = true
在逻辑中,以及在 *ahem* 正确设计的编程语言中,将 boolean 值与 true 进行比较总是多余的,即 a == True 应该简单地替换为 a 。 (类似地, a == False 由 n
我一直在努力寻找一个好的定义,并理解线程到底是什么。 看来我一定错过了一些明显的东西,但是每次我读到什么是线程时,它几乎是一个循环定义,la“线程是一个执行线程”或“一种划分运行任务的方法” ”。呃呃
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
是否可以在 MAC 上以真正的全屏模式运行 IntelliJ Idea? 没有工具栏、侧边栏、按钮,只有代码。 如果可以,请告诉我。 最佳答案 您可以通过禁用以下项目在 View 菜单中执行此操作:
考虑以下代码: case class Vector3(var x: Float, var y: Float, var z: Float) { def add(v: Vector3): Unit =
我试图确认这个说法是否属实: 模型包括: 持久层:本质上是 DAO + 表示表的类 + DTO 服务层:DAOS + 一些逻辑的组合 您能否也引用/支持您的回答?我相信我在Spring Framewo
给定代码: #include struct X {}; struct Y1: virtual X {}; struct Y2: virtual X {}; struct Y3: virtual X
从这个其他QUESTION他们谈论 Bjarne Stroustrup 是如何说的,就像比 int 窄的整数数据类型(例如 short)被提升为 int,float 被提升为 double。但是,与i
我是一名优秀的程序员,十分优秀!