- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试为正则表达式构建一个语法树。我使用类似于算术表达式求值的策略(我知道有递归下降之类的方法),即使用两个堆栈,OPND堆栈和OPTR堆栈,然后进行处理。
我使用不同类型的节点来表示不同类型的 RE。例如SymbolExpression
、CatExpression
、OrExpression
和StarExpression
,它们都是从正则表达式
。
因此 OPND 堆栈存储 RegularExpression*
。
while(c || optr.top()):
if(!isOp(c):
opnd.push(c)
c = getchar();
else:
switch(precede(optr.top(), c){
case Less:
optr.push(c)
c = getchar();
case Equal:
optr.pop()
c = getchar();
case Greater:
pop from opnd and optr then do operation,
then push the result back to opnd
}
但我的主要问题是,在典型的 RE 中,cat
运算符是隐式的。a|bc
代表a|b.c
,(a|b)*abb
代表(a|b)*.a.b.b
。那么在遇到非接线员时,如何判断是否有猫接线员呢?我应该如何处理 cat 运算符以正确实现转换?
现在我知道有一种文法叫做“运算符优先文法”,它的求值类似于算术表达式。它要求文法的模式不能有S -> ...AB...的形式(A和B是非终结符)。所以我想我不能直接使用这种方法来解析正则表达式。
我尝试设计一个 LL(1) 语法来解析基本的正则表达式。这是原始语法。(\|是转义字符,因为 |是语法模式中的特殊字符)
E -> E \| T | T
T -> TF | F
F -> P* | P
P -> (E) | i
要删除左递归,导入新变量
E -> TE'
E' -> \| TE' | ε
T -> FT'
T' -> FT' | ε
F -> P* | P
P -> (E) | i
现在,对于模式 F -> P* | P,导入P'
P' -> * | ε
F -> PP'
但是,模式 T' -> FT' | ε
有问题。考虑案例 (a|b):
E => TE'
=> FT' E'
=> PT' E'
=> (E)T' E'
=> (TE')T'E'
=> (FT'E')T'E'
=> (PT'E')T'E'
=> (iT'E')T'E'
=> (iFT'E')T'E'
在这里,我们的人类知道我们应该用 T' -> ε
替换变量 T'
,但程序只会调用 T' -> FT '
,这是错误的。
那么,这个语法有什么问题呢?我应该如何重写它以使其适合递归派生方法。
最佳答案
我没有发现您的 LL(1) 语法有任何问题。你正在解析字符串
(a|b)
你已经走到这一步了:
(a T'E')T'E' |b)
前瞻符号是|,你有两种可能的产生式:
T' ⇒ FT'
T' ⇒ ε
第一个(F) 是{<kbd>(</kbd>, <kbd>i</kbd>}
,所以第一个产品显然是不正确的,对于人类和 LL(1) 解析器都是如此。 (没有前瞻的解析器无法做出决定,但没有前瞻的解析器对于实际解析几乎毫无用处。)
你在技术上是正确的。您的原始语法不是运算符语法。然而,用一个小的状态机来增加运算符优先级解析器是很正常的(否则包括一元减号在内的代数表达式无法被正确解析),一旦你这样做了,隐式连接运算符必须去哪里就很清楚了。
状态机在逻辑上等同于预处理输入以在必要时插入显式连接运算符——也就是说,在a
之间。和 b
每当a
在{<kbd>), <kbd>*</kbd>, <kbd>i</kbd>}</kbd>
和 b
在{<kbd>)</kbd>, i}
.
您应该注意,您的原始语法并不真正处理正则表达式,除非您使用显式 ε 基元来扩充它以表示空字符串。否则,您无法表达可选选择,通常在正则表达式中表示为隐式操作数(例如 (a|)
,也常写为 a?
)。然而,状态机也很容易检测隐式操作数,因为在实践中隐式连接和隐式 epsilon 之间没有冲突。
关于parsing - 如何在为 RE 构建语法树时处理隐式 'cat' 运算符(使用堆栈评估),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53211961/
我在使用 gradle 构建一个特定应用程序时遇到问题。该应用程序可以用 eclipse 编译和构建,它在平板电脑上运行良好。当我尝试使用 Gradle 构建它时,“compileDebugJava”
我有一个 C 程序,是一位离开的开发人员留给我的。我试图弄清楚他到底在做什么,并将软件重新安排成更合乎逻辑的东西,这样我就可以更轻松地构建它。我正在使用 CMake 构建,而他使用的是 Make。 有
我刚开始阅读“Pro Spring MVC with web flow”,它附带了一个我想遵循的代码示例。 我要什么 - 我想像书中那样构建应用程序,使用 Gradle 有什么问题 - 我没用过 Gr
我希望有人已经这样做了。我正在尝试为我的一个 angular 2 项目在 teamcity 中建立一个连续的构建。在做了一些研究之后,我按照以下步骤操作: 构建步骤 1:为 teamcity 安装 j
我有一个旧的 ASP.Net 网站解决方案,看起来像: 当我在 Visual Studio 中构建解决方案时,我得到以下输出: ------ Build started: Project: C:\..
我使用 gulp-usref、gulp-if、gulp-uglify、gulp-csso 和 gulp-file-include 来构建我的应用程序。除了 HTML 保持原样外,构建中的一切都运行良好
我正在使用 ionic2 开发内部移动应用程序。我可以通过以下方式成功构建 ios: ionic build ios and ionic build ios --prod 但当我这样做时,它一直失败
我是一位经验丰富的 .NET/C# 开发人员,但对这里的几乎所有技术/库(包括 SQL/DB 工作)都是新手。 我正在开发一个具有 Azure/Entity Framework .NET 后端和可移植
我正在使用 VS 2008。我可以使用 IDE 成功编译我的解决方案。但是,当我尝试使用 devenv.com 构建它时,它失败并提示“错误:找不到项目输出组'(无法确定名称)的输出”。该组、其配置或
版本: ember.js 2.7,ember-data 2.7 ember-cli 2.9.1//同样适用于 ember-cli 2.7 node 6.9.1, npm 3.10.9//也适用于 no
我第一次修补 AzureDevops,设置一些 CI 任务。 我有一个公共(public)存储库(开源)和一个包含 3 个 F# 项目的解决方案(.sln)。该解决方案在 Windows/Mac/Li
目前 5.1.5 版本或 STLPort CVS 存储库似乎仍不支持 VS2008。如果有人已经完成了这项工作,那么如果可能的话,分享会很有用:) 同样,了解 VS2005 或 2008 x64 构建
我有一个 Python 2.7 项目,到目前为止一直使用 gfortran 和 MinGW 来构建扩展。我使用 MinGW,因为它似乎支持 Fortran 代码中的写入语句和可分配数组,而 MSVC
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
我想知道为什么在 Zimbra Wiki 中只列出了构建过程的特定平台。这意味着不可能在其他 Linux 发行版上构建 Zimbra? Zimbra 社区选择一个特殊的 Linux 发行版来构建 Zi
我将在 Swift 中构建一个 CLI 工具。我用这个命令创建了项目 swift package init --type executable当我构建我的项目并解析 时读取别名 Xcode 中的参数并
我想为添加到 docker 镜像的文件设置文件权限。我有这个简单的 Dockerfile: FROM ubuntu:utopic WORKDIR /app RUN groupadd -g 1000 b
当我使用 clBuildProgram在我的 OpenCl 代码中,它失败并显示错误代码 -11,没有任何日志信息。 这是我的代码的样子: ret = clBuildProgram(program
我有一个底部导航栏,它有一个列表页面,该页面使用状态块。 class _MainPageState extends State { int _index = 0; @override Wi
我在本地计算机上使用Jenkins(Jenkins URL未通过Internet公开,但该计算机上已启用Internet。) 我进行了以下配置更改: 在Jenkins工具上安装了Git和Github插
我是一名优秀的程序员,十分优秀!