- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在用 C++ 编写一个手工制作的词法分析器和一个解析器。我以这样的方式编写词法分析器,如果它找到例如 ;
,它会打印 "SEMICOLON",如果它找到 while
,它会打印"KEYWORD",如果它找到 hello
,它会打印 "IDENTIFIER" 等等。但是现在我需要将这些标记传递给解析器。例如,如何使用列表来做到这一点?而且我发现我需要存储 token 类型和 token 值
最佳答案
您显然没有使用经典方法,其中解析器调用扫描器来获取下一个标记。通常使用拉式解析器。意思是,解析器通过调用相应的函数从扫描器(Lexer)中提取标记。最常见的扫描器/解析器生成器 Lex/Yacc 或 Flex/Bison 使用这种方法。因此,解析器调用类似 getNextToken 的方法,然后扫描器从输入流中读取字节,直到找到标记。它不会在检测到 token (或错误)之前返回。
还有推送解析器。这里输入流由解析器或其他东西(例如套接字)读取,然后塞入扫描器,直到可以识别 token ,然后将其返回。这有点复杂,因为扫描器需要维护状态。最新的 Bison 版本支持此方法。
两者的共同点是使用类或结构 (POD)“ token ”。此类通常包含 token 类型和一个或多个属性,如值。还有许多经常重载的 setter 和 getter。这通常是解析器和扫描器之间的主要接口(interface)。
据我了解您的方法,您首先运行扫描器,使用整个输入并收集所有 token 。也有可能。然后,您会将所有标记(如上所述)存储在 std::vector(或其他 STL::container)中。然后解析器将访问该 vector 。
对于这种通信,您可以使用中介模式,或者您可以将容器嵌入“上下文”类中,并在扫描器和解析器之间交换它。
您还可以向扫描器类 (getToken) 添加一个成员函数,该函数返回 token 容器的一个元素。为此,您需要维护状态。您的扫描器的迭代器基本上会调用底层容器的迭代器,这也是一个很好的建议。有了它,您可以轻松地遍历您的标记并实现(可能)必要的操作,例如阅读前瞻符号或“取消”某些内容。
以上应该基本上回答了你的问题。
并且,对于简单的语法,这将起作用。但对于更复杂的语法,我会推荐经典方法。可能需要上下文相关扫描。例如。相同的关键字可能会产生不同的标记。这无法通过您的方法处理。
我建议阅读 Lex 和 Yacc,不是因为你应该使用它们,而是为了获得更深入的理解。或者,当然,阅读 Dragon 书或诸如“使用 C 编写编译器”之类的东西
您可能还想查看 2 个编译器示例 here
希望我能帮上一点忙。
关于c++ - 将标记从词法分析器传递到解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23583872/
我试图了解传递给 setTimeout 的箭头函数如何记住上一个执行上下文中的 this 的值。我知道在执行箭头函数时会使用词法作用域规则查找 this 值。这是否意味着箭头函数关闭变量和 this
这个问题已经有答案了: How does the "this" keyword in Javascript act within an object literal? [duplicate] (4 个
我已阅读 this问题,我想我已经理解了投票最多的答案,但他说 since basically every programming language in wide use today uses le
如何让这段宏发挥预期的作用? -- 我想从词法环境中捕获 p 而不必将其作为参数发送给宏。 (define-syntax-rule (fi a b) (if p a b)) ;--->capt
Program A() { x, y, z: integer; procedure B() { y: integer; y=0;
我正在用 Java 实现自己的链表。节点类只有一个名为“name”的字符串字段和一个名为“link”的节点。现在我有一个测试驱动程序类,它只按顺序插入几个名字。现在,我正在尝试编写一种排序方法来按字母
考虑到这个question SO,其中调用了整个 C# 内存中编译器。只有lexical and syntactic analyzing时是必需的:将文本解析为词素流,检查它们并退出。 在System
我有 2 个场景。 这失败了: class F { public X X { get; set; } } 错误 CS0102:类型“F” ' 已经包含 ' X 的定义| ' 这个有效: class
我有一个用 NodeJS 执行的 .js 文件。这是我的文件的内容: var ctry = "America"; function outer(msg) { console.log(msg +
我对编写汇编程序的概念非常陌生,即使在阅读了大量 Material 之后,我仍然很难理解几个概念。 将源文件实际分解为 token 的过程是什么?我相信这个过程称为词法分析,我已经到处搜索有意义的真实
在 static scoping,标识符可以通过分析/解析源代码来确定(与动态作用域不同,动态作用域或多或少需要了解调用者环境)。 我的问题是这样的,因为静态作用域只需要解析源代码以了解作用域和标识符
编辑:我在第一个答案后更改了示例代码,因为我想出了一个简单的版本来回避相同的问题。 我目前正在学习 Common Lisp 的作用域属性。在我认为我有一个坚实的理解之后,我决定编写一些我可以预测结果的
考虑这段代码: class Bar(object): pass class Foo(object): def bar(self): return Bar() f = Foo() def Bar
将 ES6 箭头函数与词法 this 绑定(bind)结合使用非常棒。 但是,我刚才在使用典型的 jQuery 单击绑定(bind)时遇到了一个问题: class Game { foo() {
将 ES6 箭头函数与词法 this 绑定(bind)结合使用非常好。 但是,我刚才在将它与典型的 jQuery 点击绑定(bind)一起使用时遇到了一个问题: class Game { foo(
我是一名优秀的程序员,十分优秀!