c - 解析后的符号表总体；编译器构建-6ren

c - 解析后的符号表总体；编译器构建

转载作者：行者123 更新时间：2023-11-30 14:26:02

24

4

创建解析树后，我现在必须填充符号表。

我必须存储诸如

之类的信息

标识符的类型、范围、偏移量等。

现在我如何知道标识符的类型和范围，因为我所知道的只是该特定 ID 的词位值和行号(在词法分析之后)。

我是如何了解整件事的？谢谢。

最佳答案

Now how do i know the type, scope of the identifiers , since all i know is the lexeme value and line number for that particular ID (after lexical analysis).

正如 EJP 提到的，您需要单步执行解析树。您的树应该已创建，以便您可以进行中序遍历，以与计算源代码语句和表达式相同的顺序访问每个节点。您的树节点还应该与特定的语言构造相对应，例如WhileStmtNode、MethodDeclNode 等

假设我正在构建符号表，递归地单步遍历树，并且我刚刚进入了方法体节点。我可能有类似以下内容:

public void doAction(MethodBodyNode methodBody) {
    currScope = 2;
    methodBody.getExpr().applyAction(this);
    currScope = 2;
}

我保留一个全局变量来管理范围。每次我进入范围发生变化的 block 时，我都会增加 currScope。同样，我将维护 currClass 和 currMethod 变量来存储符号名称、类型、偏移量等，以供后续阶段使用。

更新:

Now say, i am traversing the tree, everytime i come across an ID i would have to enter the value to symbol table along with the type, scope and others, say for scope i check if i come across '{' or function name, but how do i know what type of ID is this.

每个树节点应包含整个构造的所有必要信息。如果您使用解析器生成器(例如 CUP 或 Bison)，则可以指定如何在语法操作中构建树。例如

variableDeclaration::= identifier:i identifier:i2 SEMICOLON {: RESULT = new VarDeclNode(i, i2, null); :};
identifier::= ID:i {: RESULT = new IdNode(i.getLineNum(), i.getCharNum(), i.getStringValue()); :};

这些产生式将匹配 Foo f; 并将变量声明节点附加到树中。该节点封装了两个标识符节点，其中包含词位的行号、字符号和字符串值。第一个标识符节点是类型，第二个标识符节点是变量名称。 ID 是词法分析器在匹配标识符时返回的终止符号。我假设您在某种程度上熟悉这一点。

public class VarDeclNode extends StmtNode {

    private IdNode id;
    private IdNode type;
    private ExprNode expr;

    public VarDeclNode(IdNode id, IdNode type, ExprNode expr) {
        super();
        this.id = id;
        this.type = type;
        this.expr = expr;
    }

}

当您拥有包含这样的节点的语法树时，您就获得了所需的所有信息。

第二次更新:

无论您使用的是自定义解析器还是生成的解析器，都有一个不同的点，即在匹配产生式时将节点添加到树中。您使用什么语言并不重要。 C 结构体就可以了。

if it is a non terminal has the info as Nonterminals name, and if it is a terminal i.e. a token, then the info in token i.e. lexeme value, token name and line number are stored

树中必须有专门的节点，例如ClassNode、TypeNode、MethodDeclNode、IfStmtNode、ExprNode。你不能只存储一种类型的节点，然后将非终结符和终结符放入其中。非终结符表示为树节点，除了组成它的部分之外没有其他信息可存储，这些部分通常本身就是非终结符。您不会存储任何 token 信息。只有少数情况下您会实际存储词素的字符串值:用于标识符和字符串/ bool /整数文字。

看看this例子。在第一次归约期间，当 S 归约到 (S + F) 时，您将一个 ParenExprNode 附加到树根。您还可以附加一个 AddExprNode 作为 ParenExprNode 的子节点。当应用语法规则 2 的归约时，必须将该逻辑硬编码到解析器中。

树:

    ExprNode (root)
       |
  ParenExprNode
       |
   AddExprNode
   /         \
ExprNode   ExprNode

代码:

struct ExprNode { void* exprNode; };
struct ParenExprNode { void* exprNode; };
struct AddExprNode { void* op1, * op2; };
struct IdNode { char* val; int line; int charNum; };
struct IntLiteralNode { int val; int line; int charNum; };

void reduce_rule_2(ExprNode* expr) {

    //remove stack symbols

    //create nodes
    struct ParenExprNode* parenExpr = malloc(sizeof(struct ParenExprNode));
    struct AddExprNode* addExpr = malloc(sizeof(struct AddExprNode));
    addExpr->op1 = malloc(sizeof(struct ExprNode));
    addExpr->op2 = malloc(sizeof(struct ExprNode));

    //link them
    parenExpr->exprNode = (void*)addExpr;
    expr->exprNode = (void*)parenExpr;
}

在下一步中，将从输入中删除左括号。之后，S 位于堆栈顶部，并根据规则 1 将其减少为 F。由于 F 是标识符的非终结符，它由 IdNode 表示。

树:

    ExprNode
       |
  ParenExprNode
       |
   AddExprNode
   /         \
ExprNode   ExprNode
   |
 IdNode

代码:

reduce_rule_2(addExpr->op1);

void reduce_rule_1(ExprNode* expr) {
    //reduce stack symbols
    struct IdNode* id = malloc(sizeof(struct IdNode));
    id->val = parser_matched_text();
    id->lineNum = parser_line_num();
    id->charNum = parser_char_num();
    expr->exprNode = (void*)id;
}

等等...

关于c - 解析后的符号表总体；编译器构建，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9703227/

24

4

0

文章推荐： c - 为什么以下不将数组内容写入文件

文章推荐： javascript - 上传前验证音频文件的持续时间

文章推荐： javascript - 在作用域插槽中传递 Prop 不起作用

文章推荐： catopen() 在某些情况下失败时不会设置 errno

c++ - 内存对齐 - Sparc(Sun) cc 编译器、Intel(Linux) g++ 编译器、Intel(Windows) MVSC 编译器
我的问题由两部分组成。我注意到使用 cc 编译器的 sparc(sun) 上的 memalign(block_size,bytes) 不检查字节是否为 2 的幂，这与使用 mvsc 编译器的 int
c# - 什么是好的 C# 编译器-编译器/解析器生成器？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 6 年前。
java - Maven 无法定位 Javac 编译器 - 无法在 : 中定位 Javac 编译器
当我尝试在我的 gwt-maven Projekt 上进行 maven-install 时，我得到了这个错误: [ERROR] Failed to execute goal org.apache.ma
c# - 如何使用 csc(C# 编译器)或 dmcs(mono C# 编译器)生成 IL 源代码？
gcc 有一个选项 -s 来生成汇编源代码。 csc(MS C# 编译器)或 dmcs(mono C# 编译器)是否等价？我的意思是那些编译器是否提供了一个选项来生成可以读取而不是执行二进制文件的 I
c - Matlab simulink 无法找到 Stateflow 和 MATLAB Function 模块所需的 C 编译器。使用 'mex -setup' 选择支持的 C 编译器
我在 matlab simulink 中有一个模型。我把matlab安装在D盘了。当我运行模型时，出现以下错误: Unable to locate a C-compiler required by S
c++ - Visual Studio 2012 : Compiler setup (possible to use Compiler from SDK eg. VC++2008-编译器 VC++2010-编译器)
我非常喜欢 Visual Studio 2012，因为 GUI 非常快速和灵活。问题是我需要 VS2010 的 VC++-Compiler。在 VS 2012 中设置旧的编译器、SDK 有什么可能吗？
编译器/语言运行时与中间件
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
"if"语句的代码生成 - 编译器
我正在为类似 C 的语言开发编译器，但在语义分析和代码生成阶段遇到了一些困难。我的问题如下:1) 对于 if 语句，语法如下: if (expression) then statement1; sta
PHP解释器/编译器
我想了解 php 编译器/解释器的工作原理。我试图下载 php 源代码并试图了解它是如何工作的。我找不到合适的文档。如果有人可以阐明制作 php 编译器的模块以及 apache 服务器如何使用 ph
python 编译器
我有一些关于 python 的问题为什么没有 python 编译器来创建本地代码？我找到了 py2exe 等，但它们只是随附了一个 python 解释器，因此，它又是执行代码的解释器。是否无法创建
Java虚拟机JVM性能优化（二）:编译器
本文将是JVM 性能优化系列的第二篇文章(第一篇：传送门)，Java 编译器将是本文讨论的核心内容。本文中，作者（Eva Andreasson）首先介绍了不同种类的编译器，并对客户端编译，服务器
flash - ActionScript 编译器
在 *nix 之类的系统或适当的工具包下是否有任何用于 ActionScript 3 的编译器来处理 Flash？最佳答案 Flex SDK编译器 — mxmlc — 还将编译普通的 ActionS
cmake - 让CMake不检测C++编译器
我正在做一个C项目。但是其他人告诉我，由于没有C++编译器，所以无法构建它。我不知道如何禁用C++的检测。这该怎么做？最佳答案检测C和C++工具链是CMake的默认行为。要禁用此行为，您需要手动
用于数学的 JIT 编译器
我正在寻找可以嵌入到我的程序中的 JIT 编译器或小型编译器库。我打算用它来编译动态生成的执行复数运算的代码。生成的代码在结构上非常简单:没有循环，没有条件，但它们可能很长(由 GCC 编译时只有几
.NET 编译器——调试与发布
多年来，我一直在 VB.NET 中使用 DEBUG 编译器常量将消息写入控制台。我也一直在以类似的方式使用 System.Diagnostics.Debug.Write。我一直认为，当 RELEASE
architecture - 编译器——前端后端
我了解编译器的前端和后端结构。但是，我不确定为什么编译器经常分为前端和后端。我相信有很多原因，你能给我几个吗？因为，大多数书籍/网站会告诉您它们是什么，但无法告诉您原因! 谢谢你。最佳答案前端处理
Javascript 编译器/依赖管理器？
我有很多 JS 文件。其中一些相互依赖。其中许多依赖于 jQuery。我需要一种工具，它可以接受一个文件作为参数，传递地获取其所有依赖项，并以正确的顺序将它们编译成一个文件(基于依赖项) 依赖信息并不
parsing - 编译器，找到语法的第一组
我正在阅读著名的紫龙书第二版，但无法从第 65 页获取有关创建第一组的示例: 我们有以下语法(终端以粗体显示): stmt → expr; | if ( expr ) stmt | for ( opt
C#(仅限语言)编译器
我正在寻找将 C# 语法编译为 native 代码(或者可能编译为 C++？)的选项。我对拥有正式成为该语言一部分的所有库不感兴趣，只是能够像编写 C++ 程序一样编写程序，但使用语言结构，例如部分类
编译器 -march 标志基准测试？
编译器(例如:gcc)中的 -march 标志真的很重要吗？如果我使用 -march=my_architecture 而不是 -march=i686 编译所有程序和内核，会不会更快最佳答案是的，

首页

博学

6Ren·AI

商城

c - 解析后的符号表总体；编译器构建