- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在为 IMAP 协议(protocol)编写一个词法分析器以用于教育目的,但我不知道应该在哪里划定词法分析器和解析器之间的界限。以 IMAP 服务器响应为例:
* FLAGS (\Answered \Deleted)
mailbox-data = "FLAGS" SP flag-list
flag-list = "(" [flag *(SP flag)] ")"
flag = "\Answered" / "\Deleted"
(TknAnsweredFlag)
(TknSpace)
(TknDeletedFlag)
(TknBackSlash)
(TknString "Answered")
(TknSpace)
(TknBackSlash)
(TknString "Deleted")
\Answered
在两种不同的上下文中具有两种含义,词法分析器不会发出正确的标记。作为一个人为的例子(这种情况不会发生,因为电子邮件地址用引号括起来),词法分析器将如何处理像\Answered@googlemail.com 这样的电子邮件地址?或者,形式语法是否旨在永远不允许出现这种歧义?
最佳答案
作为一般规则,您不希望词法语法传播到语法中,因为它只是细节。例如,像 C 这样的计算机编程语言的词法分析器当然可以识别数字,但生成 HEXNUMBER 和 DECIMALNUMBER 标记通常是不合适的,因为这对语法并不重要。
我认为您想要的是最抽象的标记,使您的语法能够区分与您的目的相关的感兴趣的案例。您可以通过在语法的一部分中引起的困惑以及您可能在其他部分中做出的选择来调解这一点。
如果您的目标只是读取标志值,那么实际上您不需要区分它们,没有关联内容的 TknFlag 就足够了。
如果您的目标是单独处理标志值,则需要知道您是否获得了 ANSWERED 和/或 DELETED 指示。它们的词汇拼写方式无关紧要。所以我会选择你的 TknAnsweredFlag 解决方案。我会转储 TknSpace,因为在任何标志序列中,都必须有中间空格(您的规范是这样说的),所以我会尝试使用您的词法分析器提供的任何空格抑制机制来消除。
有时,我会遇到有几十个类似旗帜的东西的情况。然后,如果您对每个语法都有一个标记,那么您的语法就会开始变得困惑。如果语法不需要知道特定的标志,那么你应该有一个带有相关字符串值的 TknFlag。如果语法需要一小部分标志来区分,但大多数都不需要,那么您应该妥协:为那些对语法重要的标志使用单独的标记,并捕获所有 TknFlag 以及其余的相关字符串.
关于有两种不同解释的困难:这是其中一种权衡。如果你有这个问题,那么你的标记要么需要在语法中需要它们的两个地方都有足够的细节,所以你可以区分。如果“\”作为语法中其他地方的标记是相关的,那么您当然可以同时生成 TknBackSlash 和 TknAnswered。但是,如果在语法的一部分中处理某些内容的方式与另一部分不同,您通常可以使用模式驱动的词法分析器来解决这个问题。将模式视为一个有限状态机,每个模式都有一个关联的(子)词法分析器。模式之间的转换由作为提示的 token 触发(您必须有一个 FLAGS token ;正是这样一个提示,您将要获取标志值)。在一种模式中,您可以生成其他模式不会生成的 token ;因此在一种模式下,您可能会产生“\”标记,但在您的标志模式下,您不需要这样做。模式支持在词法分析器中很常见,因为这个问题比您预期的更常见。有关示例,请参阅 Flex 文档。
您提出这个问题的事实表明您在做出正确选择的道路上是正确的。您需要平衡最小化标记的可维护性目标(从技术上讲,您可以使用标记来解析永远的 ASCII 字符!)与基本要求以充分区分您的需求。在您构建了十几个语法之后,这种权衡似乎很容易,但我认为我提供的经验法则非常好。
关于parsing - 我应该在哪里划清词法分析器和解析器之间的界限?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5362078/
我正在尝试在Elasticsearch中返回的值中考虑地理位置的接近性。我希望近距离比某些字段(例如legal_name)重要,但比其他字段重要。 从文档看来,当前的方法是使用distance_fea
我是Elasticsearch的初学者,今天在进行“多与或”查询时遇到问题。 我有一个SQL查询,需要在Elastic中进行转换: WHERE host_id = 999 AND psh_pid =
智能指针应该/可以在函数中通过引用传递吗? 即: void foo(const std::weak_ptr& x) 最佳答案 当然你可以通过const&传递一个智能指针。 这样做也是有原因的: 如果接
我想执行与以下MYSQL查询等效的查询 SELECT http_user, http_req_method, dst dst_port count(*) as total FROM my_table
我用这两个查询进行测试 用must查询 { "size": 200, "from": 0, "query": { "bool": { "must": [ { "mat
我仍在研究 Pro Android 2 的简短服务示例(第 304 页)同样,服务示例由两个类组成:如下所示的 BackgroundService.java 和如下所示的 MainActivity.j
给定标记 like this : header really_wide_table..........................................
根据 shouldJS 上的文档网站我应该能够做到这一点: ''.should.be.empty(); ChaiJS网站没有使用 should 语法的示例,但它列出了 expect 并且上面的示例似乎
我在 Stack Overflow 上读到一些 C 函数是“过时的”或“应该避免”。你能给我一些这种功能的例子以及原因吗? 这些功能有哪些替代方案? 我们可以安全地使用它们 - 有什么好的做法吗? 最
在 C++11 中,可变参数模板允许使用任意数量的参数和省略号运算符 ... 调用函数。允许该可变参数函数对每个参数做一些事情,即使每个参数的事情不是一样的: template void dummy(
我在我从事的项目之一上将Shoulda与Test::Unit结合使用。我遇到的问题是我最近更改了此设置: class MyModel :update end 以前,我的(通过)测试看起来像这样: c
我该如何做 or使用 chai.should 进行测试? 例如就像是 total.should.equal(4).or.equal(5) 或者 total.should.equal.any(4,5)
如果您要将存储库 B 中的更改 merge 到存储库 A 中,是否应该 merge .hgtags 中的更改? 存储库 B 可能具有 A 中没有的标签 1.01、1.02、1.03。为什么要将这些 m
我正在尝试执行X AND(y OR z)的查询 我需要获得该代理为上市代理或卖方的所有已售属性(property)。 我只用 bool(boolean) 值就可以得到9324个结果。当我添加 bool
我要离开 this教程,尝试使用 Mocha、Supertest 和 Should.js 进行测试。 我有以下基本测试来通过 PUT 创建用户接受 header 中数据的端点。 describe('U
我正在尝试为 Web 应用程序编写一些 UI 测试,但有一些复杂的问题希望您能帮助我解决。 首先,该应用程序有两种模式。其中一种模式是“训练”,另一种是“现场”。在实时模式下,数据直接从我们的数据库中
我有一个规范: require 'spec_helper' # hmm... I need to include it here because if I include it inside desc
我正在尝试用这个测试我在 Rails 中的更新操作: context "on PUT to :update" do setup do @countdown = Factory(:count
我还没有找到合适的答案: onclick="..." 中是否应该转义 &(& 符号)? (或者就此而言,在每个 HTML 属性中?) 我已经尝试在 jsFiddle 和 W3C 的验证器上运行转义和非
import java.applet.*; import java.awt.*; import java.awt.event.*; public class Main extends Applet i
我是一名优秀的程序员,十分优秀!