gpt4 book ai didi

javascript - 匹配括号内的内容

转载 作者:行者123 更新时间:2023-12-02 17:51:19 24 4
gpt4 key购买 nike

我的问题实际上非常简单:如何将字符串中外括号的内容与嵌套括号匹配,如下所示:

Lorem (ipsum (dolor) sit) amet

我在很多场合都在努力解决这个问题,在我看来应该有一个非常简单的解决方案,因为很多语言都使用基于树的结构(HTML/XML 使用 <tag><tag></tag></tag> ,JSON 使用[[]]{"a":{}} )。

这里的主要问题是,使用任何正则表达式,匹配都会在第一个右括号处结束,而不是在正确的括号处结束。我也考虑过使用String.split('(') ,或者甚至创建一个带有左括号和右括号索引的数组,但这些最终也没有让我得到任何结果(也许我忽略了这些策略的使用方式)。

到目前为止,我最好的尝试就是遍历每个字符,测试该字符是否是括号,然后继续,直到剩下 0 个打开的括号:

var str = 'Lorem (ipsum (dolor) sit) amet';
var opened = 1;
var start = str.indexOf('(')+1
for (var i=start; i<str.length && opened; i++) {
if (str.charAt(i) == '(') opened++;
else if (str.charAt(i) == ')') opened--;
}
console.log(str.substring(start, i-1));

我真的很想知道,有没有一种更简单的方法来做到这一点,也许使用我没有想到的内置函数?在我看来应该有,但我自己还没有找到任何或想出一个简单的解决方案。

最佳答案

根本问题是正则表达式无法描述需要匹配括号的语言,因为这样的语言元素使语言上下文变得自由,这是一个经常被引用的下推自动机 (PDA) 增强功能的示例与有限状态自动机 (FA) 的比较。

最基本的是,您想要的产品所需的生产是

N = aNa

终端出现在非终端的两侧。这是上下文无关语法的签名示例,需要 PDA 才能识别它。与更简单的语法相反。

N = aN

表示正则表达式,只需要 FA 即可识别。

您需要比正则表达式更强大的识别类别。幸运的是,我可以推荐一个很好的 javascript 解析器生成器 pegjs

好的,完成了,我有说“一会儿吗?”我熟悉nodejs,所以这都是假设的。但 peg 也支持浏览器中的操作,因为它都是 javascript。

你知道,毕竟这一次,我不太确定这就是你想要的,但我已经做到了,以便保留至少用一对括号括起来的任何内容,否则将被忽略。我继续完成了这个,尽管这是一个用于说明目的的大型项目。但如果这不是您想要的,他们会查看生成的解析树,它都是 JSON...

我已将源代码存储在 github GIST 中,请随意下载,或者其他什么

pegjs source

driver javascript

generated parser source

Sample 1

Sample 2

cat input1
Lorem (ipsum (dolor) sit) amet
node match.js < input1
ipsum (dolor) sit

cat input2
Lorem (ipsum (dolor) sit) amet (a) a b s (asd f d a (a d d d a) asda )
node match.js < input2
ipsum (dolor) sit a asd f d a (a d d d a) asda

关于javascript - 匹配括号内的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21346101/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com