gpt4 book ai didi

regex - 带有 FindAllStringSubmatch 的 Golang 复杂正则表达式

转载 作者:IT王子 更新时间:2023-10-29 01:56:45 26 4
gpt4 key购买 nike

我有一个 super 英雄字符串,所有他们都有名字,但不是所有他们都有属性。

它的格式为⛦name⛯attrName☾attrData☽,其中attrName☾attrData☽是可选的。

所以,superheroes 字符串是:

⛦超人⛯衬衫☾blue☽⛦ clown ⛯⛦蜘蛛侠⛯age☾15岁☽girlFriend☾Cindy☽

我想使用 Regex 提取字符串,并将结果填充到 map slice 中,如下所示:

[ {name: superman, shirt: blue},
{name: joker},
{name: spiderman, age: 15yo, girlFriend: Cindy} ]

我无法在 Go playground 中完成它。我使用正则表达式⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*,但它只能捕获单个属性,即正则表达式无法捕获age 属性。

我的代码是:

func main() {
re := regexp.MustCompile("⛦(\\w+)⛯(?:(\\w+)☾(\\w+)☽)*")
fmt.Printf("%q\n", re.FindAllStringSubmatch("⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽", -1))
}

Go Playground 代码在这里:https://play.golang.org/p/Epv66LVwuRK

运行结果为:

[
["⛦superman⛯shirt☾blue☽" "superman" "shirt" "blue"]
["⛦joker⛯" "joker" "" ""]
["⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽" "spiderman" "girlFriend" "Cindy"]
]

缺少年龄,知道吗?

最佳答案

您不能使用单个捕获组捕获任意数量的子字符串。您需要先匹配整个记录,然后再用另一个正则表达式匹配它的子部分。

看一个例子:

package main

import (
"fmt"
"regexp"
)

func main() {

str := "⛦superman⛯shirt☾blue☽⛦joker⛯⛦spiderman⛯age☾15yo☽girlFriend☾Cindy☽"

re_main := regexp.MustCompile(`⛦(\w+)⛯((?:\w+☾\w+☽)*)`)
re_aux := regexp.MustCompile(`(\w+)☾(\w+)☽`)
for _, match := range re_main.FindAllStringSubmatch(str, -1) {
fmt.Printf("%v\n", match[1])
for _, match_aux := range re_aux.FindAllStringSubmatch(match[2], -1) {
fmt.Printf("%v: %v\n", match_aux[1], match_aux[2])
}
fmt.Println("--END OF MATCH--")
}
}

参见 Go demo

输出:

superman
shirt: blue
--END OF MATCH--
joker
--END OF MATCH--
spiderman
age: 15yo
girlFriend: Cindy
--END OF MATCH--

在这里,⛦(\w+)⛯((?:\w+☾\w+☽)*) 是主要的正则表达式,它匹配并捕获到组 1 中的主要“键”和字符串其他键值被捕获到第 2 组。然后,您需要迭代找到的匹配项,并使用 (\w+)☾(\w+)☽ 从第 2 组收集所有键值>.

关于regex - 带有 FindAllStringSubmatch 的 Golang 复杂正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52725176/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com