python - 如何按括号顺序将字符串分成 block ？-6ren

python - 如何按括号顺序将字符串分成 block ？

转载作者：行者123 更新时间：2023-12-04 14:49:17

程序描述:我正在尝试创建一个函数 breakInChunks()，它接受一个参数 temp_s: string，其中 temp_s 是一个数学表达式，例如1+(3-e^(x-6))-8+(99-4)*10。该函数然后搜索左括号和右括号，并用以下格式的“ block ”替换其中的表达式:[i$j](其中 i 是左括号的索引，j -最后一个)。如果在一整 block [m$n] 中有多个 block ，程序应该只将字符串中从 m 到 n 的字符替换为[m$n]。最后函数返回 keypairs 字典，其中键应该是 block ，值应该是从初始字符串中剪切出来的实际字符串，例如{'23$28': '23 和 28 个字符以内的字符串'}。所有剩余的符号(括号外的)应该以相同的 chunk: string 方式最后附加到字典中。

breakInChunks() 输入: (7+x+8*(9+10(11+12)+14))-(2*(34))

breakInChunks() 输出: {'12$18': '11+12', '7$22': '9+10[12$18]+14', '0$23 ': '7+x+8*[7$22]', '28$31': '34', '25$32': '2*[28$31]', '24:25': '-'}

问题:当尝试读取更复杂的字符串时，我开始得到非常奇怪的结果。例如:

Input: (7+y+(66+7)+(32+(78*19-(32-0)))+(32-9))+8+9+(9-10)-(9/7)-10
Output: {'5$10': '66+7', '23$28': '32-0', '16$29': '78*19-[23$28', '12$30': 
'32+[16$29]))+8+9+', '32$37': '32-9', '0$38': '7+y+(66+7)+(32+[16$29][23$28]]37]])+8',
'44$49': '9-10', '51$55': '9/7', '11:0': '', '31:0': '', '39:44': '+8+9+', '50:51': '-'}

基本上，当一个 block 中有不同的独立 block 时，程序会开始组合它们，而不是只留下一个外部 block 。我一直试图了解其背后的原因，但每次我尝试更改程序时，问题总是保持不变。我将不胜感激任何帮助，在此先感谢。

代码:

def findall(sstr, substr):
    gen = sstr.find(substr)
    while gen != -1:
        yield gen
        gen = sstr.find(substr, gen + 1)


def findclosest(l: list, el: list):  # find closest string from L to string from EL
    j = el[ 1 ]
    minimum = j
    min_index = 0
    for i in range(len(l)):
        if l[ i ][ 0 ] - j < minimum:
            minimum = l[ i ][ 0 ] - j
            min_index = l[ i ][ 0 ]
    return min_index


def breakInChunks(temp_s):  # main
    list_of_additions = [ ]
    list_of_opened = list(findall(temp_s, '('))
    list_of_closed = list(findall(temp_s, ')'))
    if sum(list_of_opened) < sum(list_of_closed) and len(list_of_opened) == len(
            list_of_closed):
        n = 0
        # <WHILE>
        while len(
                list_of_closed) != 0:  # read strings-expressions from the most inner ones to the most outer ones
            minimum = list_of_closed[ len(list_of_closed) - 1 ]
            j = list_of_closed.pop(0)
            for i in range(len(list_of_opened)):  # find the closest opening bracket to the most inner closing one
                diff = j - list_of_opened[ i ]
                if diff > 0:
                    if diff <= minimum:
                        pop_index = i
                        minimum = j - list_of_opened[ i ]
                else:
                    break
            starting_index = list_of_opened.pop(pop_index)
            # start filling KEYPAIRS
            if len(keypairs) == 0:  # if KEYPAIRS is empty
                keypairs[ f'{starting_index}${j}' ] = temp_s[ starting_index + 1:j ]
            else:  # if KEYPAIRS has at least one key-value pair
                keys = [ key.split('$') for key in
                         keypairs.keys() ]  # reading and unpacking key-value pairs (reading indecies)
                innerSeq = temp_s
                min_index_i = None
                min_index_j = None
                prevExtracted_i = 0
                prevExtracted_j = 0
                for p in range(len(keys) - 1, -1, -1):
                    k = keys[ p ]
                    extracted_i, extracted_j = int(k[ 0 ]), int(k[ 1 ])
                    if starting_index < extracted_i:  # if the chunk we are checking contains another one, we are checking if it's in fact the closest one to the chunk we are checking
                        if (
                                extracted_i < prevExtracted_i and prevExtracted_j < extracted_j) or prevExtracted_i == 0:
                            min_index_i = extracted_i
                            min_index_j = extracted_j
                            if prevExtracted_i == 0:
                                if extracted_i > int(keys[ p - 1 ][ 0 ]) and extracted_j < int(keys[ p - 1 ][ 1 ]):
                                    pass
                                else:
                                    innerSeq = innerSeq[
                                               :extracted_i ] + f'[{extracted_i}${extracted_j}]' + innerSeq[
                                                                                                   extracted_j + 1: ]
                        else:
                            if min_index_i is not None:
                                innerSeq = innerSeq[ :min_index_i ] + f'[{min_index_i}${min_index_j}]' + innerSeq[
                                                                                                         min_index_j + 1: ]
                                min_index_i = None
                                min_index_j = None
                            else:
                                innerSeq = innerSeq[
                                           :prevExtracted_i ] + f'[{prevExtracted_i}${prevExtracted_j}]' + innerSeq[
                                                                                                           prevExtracted_j + 1: ]
    
                        prevExtracted_i = extracted_i
                        prevExtracted_j = extracted_j
                        n += 1
    
                keypairs[ f'{starting_index}${j}' ] = innerSeq[ starting_index + 1:j ]
    
        # </WHILE>
    
        # checking if there are any strings outside parentheses left
        temp = [ [ int(key.split('$')[ 0 ]), int(key.split('$')[ 1 ]) ] for key in sorted(keypairs.keys(),
                                                                                          key=lambda el: int(
                                                                                              el.split('$')[
                                                                                                  1 ])) ]  # sort from the most inner to the most outer
        for i in range(len(temp) - 1):
            if temp[ i ][ 1 ] < temp[ i + 1 ][
                0 ]:  # if there is a gap between parentheses
                # find the closest difference in order to find actual string outside chunks with the help of findclosest()
                # add new chunk to LIST_OF_ADDITIONS
                list_of_additions.append([ temp[ i ][ 1 ] + 1, findclosest(temp[ i + 1: ], temp[ i ]) ])
    
        if len(list_of_additions) > 0:  # if something is inside LIST_OF_ADDITIONS
            # add remaining strings to KEYPAIRS
            for addition in list_of_additions:
                keypairs[ f'{addition[ 0 ]}:{addition[ 1 ]}' ] = self.s[ addition[ 0 ]:addition[ 1 ] ]
    
        return keypairs  # return KEYPAIRS
    else:
        raise RuntimeError(f'Amount of closing and opening brackets does not match')

最佳答案

使用堆栈在嵌套括号的每一层累积子表达式是解决此问题的常用方法。存储左括号的位置和每一层累积的表达式字符串。遇到左括号时添加一个级别。遇到右括号时，弹出当前级别并将其添加到结果中。在这一点上，替换标记被添加到上一级别的表达式(成为当前级别)。

def parGroups(S):
    result = dict()
    stack  = [[0,""]]*2           # parenthesis position, expression
    for i,c in enumerate(S+")"):  # extra ")" to force out main expression
        if c=="(":                
            stack.append([i,""])  # stack up new group
            continue
        if c==")":
            start,expr      = stack.pop(-1)    # unstack current group
            c               = f"[{start}${i}]" # token
            result[c[1:-1]] = expr             # build result
        stack[-1][-1] += c        # accumulate expression in current group
    return result

输出:

S = "(7+y+(66+7)+(32+(78*19-(32-0)))+(32-9))+8+9+(9-10)-(9/7)-10"
print(parGroups(S))

{'5$10' : '66+7',
 '23$28': '32-0',
 '16$29': '78*19-[23$28]',
 '12$30': '32+[16$29]',
 '32$37': '32-9',
 '0$38' : '7+y+[5$10]+[12$30]+[32$37]',
 '44$49': '9-10',
 '51$55': '9/7',
 '0$59' : '[0$38]+8+9+[44$49]-[51$55]-10'}

关于python - 如何按括号顺序将字符串分成 block ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69325754/

文章推荐： gnuplot - 如何在 gnuplot 中设置统计功能的范围？

文章推荐： pytorch - Pytorch NLLLOSS的理解

emacs 分成 3 个偶数窗口
简单问题:如何指定分割窗口中的字符数？ C-x-3 将我的窗口均匀分割为两个窗口，但随后的分割会将其中一个窗口分成两半。我想要 3 个大小相同的 window 。文档说我应该能够指定左缓冲区的字符数作
javascript - 分成 40 组
我需要一个程序，可以接受用户输入的数据数量和长度(英尺和英寸或仅英寸)，并将这些项目分为 40 组。我最初尝试在 Excel 中完成此任务，但我不确定是否可以完成。 var cutList = [
java - 分成 double 不起作用
这个问题已经有答案了: Why does the division of two integers return 0.0 in Java? [duplicate] (6 个回答) 已关闭 5 年前。
java - MigLayout 分成 2 行
我想知道在使用布局 (MigLayout) 时我可以分成 2 行而不是两列吗？ panel.add(fname,"split 2"); panel.add(Fname,"wrap, pushx, gr
php - 将 mysql_num_rows 分成 6x4
我几乎有一个像下面这样的代码，我正在尝试添加每 6 个结果之后。 echo ""; $query="SELECT * WHERE id='$id' ORDER BY date ASC"; $resu
android - 现有 Activity 分成 fragment
我在 android 2.2 中创建了一个选项卡 fragment ，带有 android 兼容性支持库，现在在我的应用程序中我几乎没有 Activity ，其中一些是扩展 Activity 类和其
python - Pandas Dataframe 分成 session
这是我的 question 的扩展. 为了让它更简单让我们假设我有一个 pandas 数据框，如下所示。 df = pd.DataFrame([[1.1, 1.1, 2.5, 2.6, 2.5, 3.
xaml - 如何将 stackpanel 分成 7 个等高的矩形
我正在开发 Windows Phone 8 应用程序，其中我有一个 Stackpanel，我想在其中放置 7 个矩形。我希望这些矩形具有相同的高度，无论屏幕尺寸如何。我尝试设置 Height="*"
java - UTF-16 分成 2 个字符
我一直相信java使用UTF-16在内部对其字符进行编码。它使用 u+xxxx 的事实证实了这一点。表示字符代码的格式以及它使用 16 位存储 char 的事实。 . 但有时UTF-16需要超过 2
xaml - 如何将 stackpanel 分成 7 个等高的矩形
我正在开发 Windows Phone 8 应用程序，其中我有一个 Stackpanel，我想在其中放置 7 个矩形。我希望这些矩形具有相同的高度，无论屏幕尺寸如何。我尝试设置 Height="*"
c - 将 sbrk 分成 2 个
为了重新编码 malloc 函数，我执行了 sbrk(stack) 其中: void *malloc(size_t size) { stack = 0; while (stack start
jquery - 将表 td 分成 6 行或更少行的解决方案
寻找一个 css 或 jquery 解决方案来将这些动态加载的表分解为每行最多 6 个，创建表的脚本将它们全部内联，有时一行中显示多达 32 个 td.tables。我怎样才能在最多只有 6 个内联显
swift utf16 数据流 - 分成 block 的问题
我可以请求帮助将 UTF-16 数据流拆分成 block 吗？不幸的是，很难找到字母边界。任何帮助表示赞赏，已经花了几个晚上在这上面，很想了解这个问题。运行良好的 Java 版本(是否有任何自动
php - 将一个 div 分成 1 列以上
我正在使用 Contact Forms 7在 wordpress 安装中创建联系表单。创建的表单位于 here Contact Form 扩展是免费、灵活且易于使用的。但问题是，无论一个表单包含多少个
java - 根据我的数据库 varchar 大小分割字符串(分成 block )
我想将一个字符串拆分为一系列子字符串以适合我的数据库，假设我的数据库 varchar 大小为 50。如果将原始字符串切割为最多 50 个字符，那么我需要在该字符串中包含尾随 (逗号)。例如，我的原始
css - 将一个 div 分成 3 个部分
我必须用 css 做一个足球队盾牌，我的想法是用球队的颜色做一个圆圈，我已经用 1 种或 2 种颜色为盾牌做了圆圈，但我在使用 3 种颜色的盾牌时遇到了麻烦我将其用于 2 种颜色的防护罩 .equi
c# - 按数量递减将 x 分成 y 部分
如果我有 1000 美元(可变)，我想把这笔钱分给 20(可变)人，但不是平均地给每个人，我想给第一个人更多，然后第二人称等所以第 20 个人得到的最少，第 5 个人得到的第 5 多。我将如何实现
algorithm - 有限制地将 n 分成 k 个部分
我需要一种算法，将数字 n 分成 k 部分，并增加限制，即每个分区元素必须在 a 0 and k > 0: for x in range(a, b+1): fo
java - 我如何将 JPanel 分成 70% 30%
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Swing: How do I set a component height to the containe
Android - 如何将 View 分成 4 个相等的部分？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何按括号顺序将字符串分成 block ？