gpt4 book ai didi

c# - 我应该如何重构这个正则表达式反转算法以允许重复字符类?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:11:37 24 4
gpt4 key购买 nike

我写了this algorithm生成正则表达式匹配的字符串。工作得很好,但它仍然缺少一些功能。

例如,当反转 \d{3} 时,它首先选择一个数字,然后将同一个数字重复 3 次。我想选择 3 个不同的号码。

我认为解决此问题的最简单方法是将 \d 插入标记列表并在量词之后对其求值,而不是在量词之前。

这一切都很好,但是解析像 (a(b)){2}|(c)\3 这样的东西怎么样?假设我遵循“稍后评估”策略,这将被标记为“(a(b)),(a(b))( c),\3”。这实际上会导致一些问题。我不能只将 (a(b)) 视为一个整体并重复它,实际上我必须在 \3 之前的某个时间对其进行评估,以便我可以计算编号引用(ab\1b\2c\3)。

另一个问题是,如果我真的重复这样的字符串,(a(b)),(a(b)) 两次...那么当我去给它编号,它会被重复计算,因为我丢失了量词信息。除非我不保留一个字符串列表,而是一个更复杂的结构来指示它是否被计算在内。那个,或者我立即将它塞进反向引用列表......但是如果我把它放在未评估的位置,它将需要被评估两次,这是行不通的,所以我必须在将它放入之前评估它反向引用列表...

但是如果我有像 (a|b){2}\1 这样的东西呢?我 think \1 指的是最后 捕获。所以我不能立即评估 (a|b) 然后将结果扔到反向引用列表中,因为它可能被量化......我也许可以在量化后立即评估它。

我在想a different structure会帮我解决这一切。但我仍然不知道如何考虑量词......我只是想在找到量词时立即复制节点,但我不确定这是否是最好的方法。也许如果我在节点上添加 repeat-min、repeat-max 变量?

最佳答案

我认为您已经达到了正则表达式的极限。我认为您需要做的是经典解析,从您的输入字符串生成一个解析树,然后在树分析步骤中执行您在帖子中谈到的分析类型。

关于c# - 我应该如何重构这个正则表达式反转算法以允许重复字符类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4382365/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com