python - 如何最好地解析一个简单的语法？-6ren

python - 如何最好地解析一个简单的语法？

转载作者：IT老高更新时间：2023-10-28 22:15:38

26

4

好的，我已经问了一些关于这个项目的小问题，但我仍然对我提出的设计没有太大信心，所以我要问一个更广泛的问题规模。

我正在解析类(class)目录的先决条件描述。描述几乎总是遵循某种形式，这让我觉得我可以解析大部分。

从文本中，我想生成一张类(class)先决条件关系图。 (在我解析数据之后，这部分会很容易。)

一些示例输入和输出:

"CS 2110" => ("CS", 2110) # 0

"CS 2110 and INFO 3300" => [("CS", 2110), ("INFO", 3300)] # 1
"CS 2110, INFO 3300" => [("CS", 2110), ("INFO", 3300)] # 1
"CS 2110, 3300, 3140" => [("CS", 2110), ("CS", 3300), ("CS", 3140)] # 1

"CS 2110 or INFO 3300" => [[("CS", 2110)], [("INFO", 3300)]] # 2

"MATH 2210, 2230, 2310, or 2940" => [[("MATH", 2210), ("MATH", 2230), ("MATH", 2310)], [("MATH", 2940)]] # 3

如果整个描述只是一个类(class)，直接输出。
如果类(class)是连体的(“and”)，它们都在同一个列表中输出
如果类(class)不连续(“或”)，则它们位于单独的列表中
这里，我们有“and”和“or”。

一个使它更容易的警告:“and”/“or”短语的嵌套似乎永远不会大于示例 3 中所示的。

最好的方法是什么？我从 PLY 开始，但我不知道如何解决减少/减少冲突。 PLY 的优点是很容易操纵每个解析规则生成的内容:

def p_course(p):
 'course : DEPT_CODE COURSE_NUMBER'
 p[0] = (p[1], int(p[2]))

使用 PyParse，如何修改 parseString() 的输出就不太清楚了。我正在考虑基于@Alex Martelli 的想法，即在对象中保持状态并从中构建输出，但我不确定如何最好地做到这一点。

 def addCourse(self, str, location, tokens):
  self.result.append((tokens[0][0], tokens[0][1]))

 def makeCourseList(self, str, location, tokens):

  dept = tokens[0][0]
  new_tokens = [(dept, tokens[0][1])]
  new_tokens.extend((dept, tok) for tok in tokens[1:])

  self.result.append(new_tokens)

例如，处理“或”的情况:

    def __init__(self):
            self.result = []
            # ...
  self.statement = (course_data + Optional(OR_CONJ + course_data)).setParseAction(self.disjunctionCourses)



 def disjunctionCourses(self, str, location, tokens):
  if len(tokens) == 1:
   return tokens

  print "disjunction tokens: %s" % tokens

disjunctionCourses() 如何知道要分离哪些较小的短语？它得到的只是token，但是目前解析出来的都保存在result中，那么函数怎么知道result中的哪些数据对应了token的哪些元素？我想我可以搜索 token ，然后找到具有相同数据的 result 元素，但这感觉很复杂......

此外，还有许多包含杂项文本的描述，例如:

"CS 2110 or permission of instructor"
"INFO 3140 or equivalent experience"
"PYSCH 2210 and sophomore standing"

但我解析该文本并不重要。

有什么更好的方法来解决这个问题？

最佳答案

def parse(astr):
    astr=astr.replace(',','')
    astr=astr.replace('and','')    
    tokens=astr.split()
    dept=None
    number=None
    result=[]
    option=[]
    for tok in tokens:
        if tok=='or':
            result.append(option)
            option=[]
            continue
        if tok.isalpha():
            dept=tok
            number=None
        else:
            number=int(tok)
        if dept and number:
            option.append((dept,number))
    else:
        if option:
            result.append(option)
    return result

if __name__=='__main__':
    tests=[ ("CS 2110" , [[("CS", 2110)]]),
            ("CS 2110 and INFO 3300" , [[("CS", 2110), ("INFO", 3300)]]),
            ("CS 2110, INFO 3300" , [[("CS", 2110), ("INFO", 3300)]]),
            ("CS 2110, 3300, 3140", [[("CS", 2110), ("CS", 3300), ("CS", 3140)]]),
            ("CS 2110 or INFO 3300", [[("CS", 2110)], [("INFO", 3300)]]),
            ("MATH 2210, 2230, 2310, or 2940", [[("MATH", 2210), ("MATH", 2230), ("MATH", 2310)], [("MATH", 2940)]])]

    for test,answer in tests:
        result=parse(test)
        if result==answer:
            print('GOOD: {0} => {1}'.format(test,answer))
        else:
            print('ERROR: {0} => {1} != {2}'.format(test,result,answer))
            break

产量

GOOD: CS 2110 => [[('CS', 2110)]]
GOOD: CS 2110 and INFO 3300 => [[('CS', 2110), ('INFO', 3300)]]
GOOD: CS 2110, INFO 3300 => [[('CS', 2110), ('INFO', 3300)]]
GOOD: CS 2110, 3300, 3140 => [[('CS', 2110), ('CS', 3300), ('CS', 3140)]]
GOOD: CS 2110 or INFO 3300 => [[('CS', 2110)], [('INFO', 3300)]]
GOOD: MATH 2210, 2230, 2310, or 2940 => [[('MATH', 2210), ('MATH', 2230), ('MATH', 2310)], [('MATH', 2940)]]

关于python - 如何最好地解析一个简单的语法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2945357/

26

4

0

文章推荐： c++ - 如何在字符串中使用编译时常量 __LINE__？

文章推荐： android - 如何将蓝牙设备作为列表获取？

语法
在此处回答的另一个问题中，我发现了以下 JavaScript代码: function _dom_trackActiveElement(evt) { if (evt && evt.target)
语法
if (A == 0) OR (B == 0) 怎么说？最佳答案只是为了讽刺: if (A === 0 || B === 0) 关于语法，我们在Stack Overflow上找到一个类似的问题：
语法
var ret = [] ,xresult = document.evaluate(exp, rootEl, null, X
语法
我一直在寻找一些类似于下例的 JavaScript。有人可以解释一下吗，因为我以前从未见过这样编写的 JavaScript。 “SomethingHere”和冒号代表什么？我习惯于看到函数 myFun
mysql程序: syntax,语法，语法……太难找了
这是我的程序: delimiter // drop procedure if exists migContactToActor; create procedure migContactToActor(
c - 从 icc 获取 Intel 语法 asm 输出，而不是默认的 AT&T 语法？
我遇到了一个问题。我一直在使用 gcc 编译/汇编我的 C 代码一段时间，并且习惯了阅读 Intel 汇编语法。我在生成程序集文件时使用了 -masm=intel 标志。但是最近因为公司迁移，拿到了
语法:自上而下和自下而上的区别？
自上而下和自下而上语法有什么区别？举个例子就太好了。最佳答案首先，语法本身不是自上而下或自下而上的，解析器是(尽管有些语法可以被其中一个解析，但不能被另一个解析)。从实践的角度来看，主要区别在于
AppleScript 语法
我知道这是草率的代码，但它是: display dialog ("Start Screensaver. Please type: matrix, coffee, waffles, star, wate
Java 语法 ": "
这个问题已经有答案了: Giving name to a loop (6 个回答) 已关闭 8 年前。我见过这个字符在 C# 中使用，就像 Java 中的扩展一样，但最近我在代码中发现了这个 loo
在函数中通过指针调用字符串(语法)
我正在尝试编写一个函数来检查字符串是否为回文，但我认为在使用字符串指针时存在一些错误。这段代码有什么问题？ #include #include #define MAX 1000 int IsPalin
Javascript "for"语法
所以在this question我询问了一些 Javascript 是如何被压缩的。问题已得到解答，但以下片段让我非常困惑，以至于我不得不问另一个问题。在这里: for (Y = 0; $ = 'zx
调用函数指针(语法)
假设我有一个接受这些参数的函数。 int create(Ptr * p,void * (*insert)(void *, void *)) { //return something later } 结
C语言未知&语法
这个问题已经有答案了: Bitwise '&' operator (6 个回答) 已关闭 5 年前。我在代码中找到了这个，但我从未遇到过像 & 这样的事情，仅 && if ((code & 1) =
使用继承的c++语法
我在处理继承类及其中的构造函数和方法的语法时遇到了问题。我想实现一个类日期和一个子类 date_ISO，它们将按特定顺序设置给定的日、月、年，并通过一种方法将其写入字符串。我觉得我的基类日期工作正常
MySQL IF THEN AS 语法
我正在尝试通过存储过程填充表，如下所示: SET @resultsCount = (SELECT COUNT(*) FROM tableA); SET @i = 0; WHILE @i THEN
Bash 语法 : What is the "<<"?
谁能解释一下下面代码中的“<<”？ mysql test<
MySQL OR AND 语法
刚刚开始学习 MySQL，这是一个菜鸟问题，也是我在 StackOverflow 上的第一个问题。假设我有 12 个订单状态，我想从其中的 5 个中选择总计。我会使用: SELECT SUM(tot
JavaScript 语法
我的编程背景是在学校学过一点Java。由于某些原因，JavaScript 语法往往让我感到困惑。下面的 JavaScript 代码是一种我不知道如何构成的语法模式: foo.ready = funct
JavaScript 语法 $
我正在阅读 javascript 源代码，并且我以前没有编写过 javascript。我对它的一些语法感到困惑。 $(function () { window.onload=function
JavaScript 语法？
我什至不知道如何命名我想要的东西。那么让我举个例子来解释一下。虽然火狐使用textContent，但其他浏览器支持innerText属性。顺便说一句，如果我使用了错误的术语，请纠正我。无论如何，到目

首页

博学

6Ren·AI

商城

python - 如何最好地解析一个简单的语法？