python - pyparsing只能找到一个实例-6ren

python - pyparsing只能找到一个实例

转载作者：太空宇宙更新时间：2023-11-03 17:16:20

我想用pyparsing解析Windows资源文件，因为菜单可以有深层嵌套结构。 用正则表达式解析这样的结构是非常困难的。

一切正常，但今天我发现我的代码只能找到一个实例。为了让我清楚，这里是 *.rc 文件的内容(E:\tool\res\my.rc，为了节省空间只显示容易出错的部分):

#include "../include/resource.h"

IDR_MENU_OPTION MENU BEGIN
    POPUP "Options"
    BEGIN
        MENUITEM "List Layers for &All Pages",  IDM_SHOW_ALL
        MENUITEM "List Layers for &Visible Pages", IDM_SHOW_VISIBLE
        MENUITEM SEPARATOR
        MENUITEM "&Reset to Initial Visibility", IDM_RESET_INIT
        MENUITEM SEPARATOR
        MENUITEM "E&xpand All",                 IDM_EXPAND_ALL
        MENUITEM "C&ollapse All",               IDM_COLLAPSE_ALL
    END
    POPUP ""
    BEGIN
        MENUITEM "List Layers for &All Pages",  IDM_LIST_ALL
        MENUITEM "List Layers for &Visible Pages", IDM_LIST_VISIBLE
        MENUITEM SEPARATOR
        MENUITEM "&Reset to Initial Visibility", IDM_RESET_INIT
        MENUITEM SEPARATOR
        MENUITEM "E&xpand All",                 IDM_EXPAND_ALL
        MENUITEM "C&ollapse All",               IDM_COLLAPSE_ALL
        MENUITEM SEPARATOR
        MENUITEM "Layer &Properties...",        IDM_LAYER_PROPERTIES
    END END

IDR_MENU_PRPPERTIES MENU BEGIN // the menu block is skiped by pyparsing
    POPUP ""
    BEGIN
        MENUITEM "&Show Layers",                IDM_SHOW
        MENUITEM "&Properties...",              IDM_PROPERTIES
    END
    MENUITEM "",                            65535 END

#endif    // not APSTUDIO_INVOKED

我的Python代码找不到IDR_MENU_PRPPERTIES MENU，现在的输出是:

IDM_COLLAPSE_ALL
IDM_EXPAND_ALL
IDM_LAYER_PROPERTIES
IDM_LIST_ALL
IDM_LIST_VISIBLE
IDM_RESET_INIT
IDM_SHOW_ALL
IDM_SHOW_VISIBLE
IDR_MENU_OPTION

但预期输出应该是:

IDM_COLLAPSE_ALL
IDM_EXPAND_ALL
IDM_LAYER_PROPERTIES
IDM_LIST_ALL
IDM_LIST_VISIBLE
IDM_RESET_INIT
IDM_SHOW_ALL
IDM_SHOW_VISIBLE
IDR_MENU_OPTION
IDR_MENU_PRPPERTIES
IDM_SHOW
IDM_PROPERTIES

这是我的代码:

import re
import os
import codecs
import fnmatch
from bs4 import UnicodeDammit
from pyparsing import restOfLine, cStyleComment, Word, alphanums, alphas, \
    Optional, SkipTo, ZeroOrMore, Group, Keyword, quotedString, delimitedList, \
    nums, commaSeparatedList, Forward, Combine


class RcParser:
    def __init__(self, rc_file):
        self.rc_file = rc_file
        handle = open(rc_file, 'rb')
        binary_data = handle.read()
        handle.close()
        dammit = UnicodeDammit(binary_data)
        self.rc_src = dammit.unicode_markup
        self.encoding = dammit.original_encoding
        self.string_table_id = set()
        self.dialog_id = set()
        self.menu_id = set()
        self.img_id = set()

        self.parse(self.rc_src)

    def get_rc_header(self):
        inx = self.rc_file.rfind('\\')
        path = self.rc_file[: inx + 1]
        file_lists = [path + file for file in os.listdir(path) if file.lower().endswith('resource.h')]
        if not file_lists:
            return None
        return file_lists[0]

    def id_by_parsing_rc(self):
        rc_id = self.img_id | self.menu_id | self.dialog_id | self.string_table_id
        return rc_id

    def rc_statement(self):
        """ Generate a RC statement parser that can be used to parse a RC file

        :rtype: pyparsing.ParserElement
        """

        one_line_comment = '//' + restOfLine
        comments = cStyleComment ^ one_line_comment
        precompiler = Word('#', alphanums) + restOfLine
        language_definition = "LANGUAGE" + Word(alphas + '_').setResultsName(
            "language") + Optional(',' + Word(alphas + '_').setResultsName("sublanguage"))
        block_start = (Keyword('{') | Keyword("BEGIN")).setName("block_start")
        block_end = (Keyword('}') | Keyword("END")).setName("block_end")
        reserved_words = block_start | block_end
        name_id = ~reserved_words + \
                  Word(alphas, alphanums + '_').setName("name_id")
        numbers = Word(nums)
        integerconstant = numbers ^ Combine('0x' + numbers)
        constant = Combine(
            Optional(Keyword("NOT")) + (name_id | integerconstant), adjacent=False, joinString=' ')
        combined_constants = delimitedList(constant, '|')
        block_options = Optional(SkipTo(
            Keyword("CAPTION"), failOn=block_start)("pre_caption") + Keyword("CAPTION") + quotedString(
            "caption")) + SkipTo(
            block_start)("post_caption")
        undefined_control = Group(name_id.setResultsName(
            "id_control") + delimitedList(quotedString ^ constant ^ numbers ^ Group(combined_constants)).setResultsName(
            "values_"))
        block = block_start + \
                ZeroOrMore(undefined_control)("controls") + block_end
        dialog = name_id(
            "block_id") + (Keyword("DIALOGEX") | Keyword("DIALOG"))("block_type") + block_options + block
        string_table = Keyword("STRINGTABLE")(
            "block_type") + block_options + block
        menu_item = Keyword(
            "MENUITEM")("block_type") + (commaSeparatedList("values_") | Keyword("SEPARATOR"))
        popup_block = Forward()
        popup_block <<= Group(Keyword("POPUP")("block_type") + Optional(quotedString("caption")) + block_start +
                              ZeroOrMore(Group(menu_item | popup_block))("elements") + block_end)("popups*")
        menu = name_id("block_id") + \
               Keyword("MENU")("block_type") + block_options + \
               block_start + ZeroOrMore(popup_block) + block_end
        statem = comments ^ precompiler ^ language_definition ^ dialog ^ string_table ^ menu
        return statem

    def generate_menu_pre_name(self, block_type, block_id):
        """Return the pre-name generated for elements of a menu."""
        return "%s.%s" % (block_type, block_id)

    def generate_popup_pre_name(self, pre_name, caption):
        """Return the pre-name generated for subelements of a popup.

        :param pre_name: The pre_name that already have the popup.
        :param caption: The caption (whitout quotes) of the popup.

        :return: The subelements pre-name based in the pre-name of the popup and
                 its caption.
        """
        return "%s.%s" % (pre_name, caption.replace(" ", "_"))

    def add_popup_units(self, pre_name, popup):
        """Transverses the popup tree making new units as needed."""
        for element in popup.elements:
            if element.block_type and element.block_type == "MENUITEM":
                if element.values_ and len(element.values_) >= 2:
                    var = element.values_[1]
                    if not var.isdigit():
                        self.menu_id.add(var)
                        # Else it can be a separator.
            elif element.popups:
                for sub_popup in element.popups:
                    self.add_popup_units(self.generate_popup_pre_name(pre_name, popup.caption[1:-1]), sub_popup)

    def parse(self, rcsrc):
        """Read the source of a .rc file in and include them as units."""
        # Parse the strings into a structure.
        results = self.rc_statement().searchString(rcsrc)
        for statement in results:
            if not statement.block_type:
                continue
            if statement.block_type in ("DIALOG", "DIALOGEX"):
                helper = statement.block_id[0]
                self.dialog_id.add(statement.block_id[0])
                control_type = [
                    "AUTOCHECKBOX", "AUTORADIOBUTTON", "CAPTION", "CHECKBOX"
                    , "CTEXT", "CONTROL", "DEFPUSHBUTTON", "GROUPBOX"
                    , "LTEXT", "PUSHBUTTON", "RADIOBUTTON", "RTEXT"
                    , "COMBOBOX"
                ]
                for control in statement.controls:
                    fk = (control.id_control[0] in control_type)
                    flag = (control.values_[0].startswith('"') or control.values_[0].startswith("'"))
                    if control.id_control[0] in control_type:
                        if flag:
                            self.dialog_id.add(control.values_[1])
                        else:
                            self.dialog_id.add(control.values_[0])
                continue

            if statement.block_type in ("MENU"):
                pre_name = self.generate_menu_pre_name(statement.block_type, statement.block_id[0])
                self.menu_id.add(statement.block_id[0])
                for popup in statement.popups:
                    self.add_popup_units(pre_name, popup)
                continue

            if statement.block_type in ("STRINGTABLE"):
                for text in statement.controls:
                    self.string_table_id.add(text.id_control[0])
                continue

        lines = rcsrc.splitlines()
        for line in lines:
            line = line.rstrip()
            m = re.match(r'(\w+)\s+(\bBITMAP\b|\bPNG\b|\bXML\b|\bICON\b)\s+(\".*\")$', line)
            if not m:
                continue
            self.img_id.add(m.group(1))


def main():
    x = RcParser(r'E:\tool\res\my.rc')
    print('\n'.join(sorted(x.id_by_parsing_rc())))


if __name__ == "__main__":
    main()

最佳答案

您对菜单的定义是:

menu = name_id("block_id") + \
       Keyword("MENU")("block_type") + block_options + \
       block_start + ZeroOrMore(popup_block) + block_end

在您的 block_start/block_end 中，您只允许 popup_blocks。在不匹配的菜单中，菜单中有一个不属于 popup_block 的 menu_item。您可能需要类似的东西:

menu = name_id("block_id") + \
       Keyword("MENU")("block_type") + block_options + \
       block_start + ZeroOrMore(popup_block | menu_item) + block_end

关于python - pyparsing只能找到一个实例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33643452/

文章推荐： python PIL 保存图像不同大小的原始图像

文章推荐： Python for 循环和数组

文章推荐： ruby - 如何按数组中每个单词的第二个字母对列表/数组进行排序

文章推荐： php - OPcache 不缓存任何东西

python - Python 中的集群或合并集群以减少组数 (Python)
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库，但没有成功。我猜它只是通过 knn 聚类
python - python 列表的子集基于同一列表的元素组，pythonically
我有一个扁平数字列表，这些数字逻辑上以 3 为一组，其中每个三元组是 (number, __ignored, flag[0 or 1])，例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
python - 激活 Python 虚拟环境并在另一个 Python 脚本中调用 Python 脚本
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
python - 在焕然一新的 Python 环境中以编程方式从 Python 内部执行 Python 文件
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
python - 从 python 脚本但在 python 脚本之外运行 python 脚本
这听起来像是谜语或笑话，但实际上我还没有找到这个问题的答案。问题到底是什么？我想运行 2 个脚本。在第一个脚本中，我调用另一个脚本，但我希望它们继续并行，而不是在两个单独的线程中。主要是我不希望第
python - 使用不同的 python 从 python 运行 python 脚本
我有一个带有 python 2.5.5 的软件。我想发送一个命令，该命令将在 python 2.7.5 中启动一个脚本，然后继续执行该脚本。我试过用 #!python2.7.5 和http://re
python - 为什么从 Python 命令行调用 Python 时 Python 无法找到并运行我的脚本？
我在 python 命令行(使用 python 2.7)中，并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹，使用: os.chdir("
python - 使用动态版本的 Python 执行嵌入的 Python 代码时出现致命的 Python 错误
剧透:部分解决(见最后)。以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
python - python 中识别 python 数组或列表中最大累积差异的最快方法是什么？
假设我有以下列表，对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
python - (Python) 通过单选按钮 python 更新背景
所以我试图在选择某个单选按钮时更改此框架的背景。我的框架位于一个类中，并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
python - python 中的字符串与正则表达式比较在 python 中失败
我正在尝试将字符串与 python 中的正则表达式进行比较，如下所示， #!/usr/bin/env python3 import re str1 = "Expecting property name
python - python 如何加载Boost.Python 库？
考虑以下原型(prototype) Boost.Python 模块，该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
python - python 检查模块 python 的问题
如何编写一个程序来“识别函数调用的行号？” python 检查模块提供了定位行号的选项，但是， def di(): return inspect.currentframe().f_back.f_l
python - 系统 python 与用户 python
我已经使用 macports 安装了 Python 2.7，并且由于我的 $PATH 变量，这就是我输入 $ python 时得到的变量。然而，virtualenv 默认使用 Python 2.6，除
python - [Python] : Python re. 长字符串行的搜索速度优化
我只想问如何加快 python 上的 re.search 速度。我有一个很长的字符串行，长度为 176861(即带有一些符号的字母数字字符)，我使用此函数测试了该行以进行研究: def getExe
python - 编辑字符串 python 正则表达式 python
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
python - Python 映射中的副作用(Python "do" block )
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。告
python - 使用其值逻辑组合两个 python 列表 - Python
我想用 Python 将两个列表组合成一个列表，方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
python - Boost.Python python 链接错误
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
python - 在 Python 中仅使用内置库制作一个基本的网络抓取工具 - Python
学习 Python，我正在尝试制作一个没有任何第 3 方库的网络抓取工具，这样过程对我来说并没有简化，而且我知道我在做什么。我浏览了一些在线资源，但所有这些都让我对某些事情感到困惑。 html 看起来

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - pyparsing只能找到一个实例