gpt4 book ai didi

javascript - 在 JavaScript 正则表达式匹配中移动索引

转载 作者:数据小太阳 更新时间:2023-10-29 05:04:23 27 4
gpt4 key购买 nike

我有这个正则表达式可以从文本中提取双字

/[A-Za-z]+\s[A-Za-z]+/g

还有这个示例文本

玛丽有一只小羊羔

我的输出是这样的

[0] - 玛丽有; [1] - 一点点;

而我的预期输出是这样的:

[0] - 玛丽有; [1] - 有一个; [2] - 一点点; [3] - 小羊羔

我怎样才能实现这个输出?据我了解,搜索索引移至第一场比赛的末尾。我怎样才能将它后移一个字?

最佳答案

滥用 String.replace 函数

我使用了一个小技巧使用 replace功能。由于 replace 函数循环匹配并允许我们指定函数,因此可能性是无限的。结果将在 output 中。

var output = [];
var str = "Mary had a little lamb";
str.replace(/[A-Za-z]+(?=(\s[A-Za-z]+))/g, function ($0, $1) {
output.push($0 + $1);
return $0; // Actually we don't care. You don't even need to return
});

由于输出包含输入字符串中的重叠部分,因此当我们使用look-ahead 匹配当前单词时,有必要不消耗下一个单词1.

正则表达式 /[A-Za-z]+(?=(\s[A-Za-z]+))/g 的作用与我上面所说的完全相同:它将[A-Za-z]+ 部分(正则表达式的开头)一次只消耗一个单词,并向前看下一个单词 (?=(\s [A-Za-z]+)) 2,同时捕获匹配的文本。

传递给 replace 函数的函数将接收匹配的字符串作为第一个参数,并在后续参数中接收捕获的文本。 (还有更多 - 检查 documentation - 我这里不需要它们)。由于前瞻是零宽度(不消耗输入),因此整个匹配也方便地是第一个单词。前瞻中的捕获文本将进入第二个参数。

使用 RegExp.exec 的正确解决方案

请注意,String.replace 函数会产生替换开销,因为根本不使用替换结果。如果这是 Not Acceptable ,您可以在循环中使用 RegExp.exec 函数重写上面的代码:

var output = [];
var str = "Mary had a little lamb";
var re = /[A-Za-z]+(?=(\s[A-Za-z]+))/g;
var arr;

while ((arr = re.exec(str)) != null) {
output.push(arr[0] + arr[1]);
}

脚注

  1. 在其他支持可变宽度负向后视的正则表达式中,可以检索前一个单词,但 JavaScript 正则表达式不支持负向后视!

  2. (?=pattern) 是向前看的语法。

附录

String.match 不能在这里使用,因为当使用 g 标志时它会忽略捕获组。捕获组在正则表达式中是必需的,因为我们需要环视以避免消耗输入和匹配重叠文本。

关于javascript - 在 JavaScript 正则表达式匹配中移动索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14081935/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com