gpt4 book ai didi

golang正则之命名分组方式

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章golang正则之命名分组方式由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

正则中有分组这个功能,在golang中也可以使用命名分组.

一次匹配的情况

  。

场景还原如下:

有一行文本,格式为:姓名 年龄 邮箱地址 。

请将其转换为一个map 。

代码实现如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
str := `Alice 20 alice@gmail.com`
// 使用命名分组,显得更清晰
re := regexp.MustCompile(`(?P<name>[a-zA-Z]+)\s+(?P<age>\d+)\s+(?P<email>\w+@\w+(?:\.\w+)+)`)
match := re.FindStringSubmatch(str)
groupNames := re.SubexpNames()
fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames))
result := make(map[string]string)
// 转换为map
for i, name := range groupNames {
     if i != 0 && name != "" { // 第一个分组为空(也就是整个匹配)
         result[name] = match[i]
     }
}
prettyResult, _ := json.MarshalIndent(result, "", "  ")
fmt.Printf("%s\n", prettyResult)

输出为:

?
1
2
3
4
5
6
[Alice 20 alice@gmail.com Alice 20 alice@gmail.com], [ name age email], 4, 4
{
   "age": "20",
   "email": "alice@gmail.com",
   "name": "Alice"
}

注意 [ name age email]有4个元素, 第一个为"".

多次匹配的情况

  。

接上面的例子,实现一个更贴近现实的需求:

有一个文件, 内容大致如下:

?
1
2
3
4
5
Alice 20 alice@gmail.com
Bob 25 bob@outlook.com
gerrylon 26 gerrylon@github.com
...
更多内容

和上面一样, 不过这次转出来是一个slice of map, 也就是多个map.

代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
// 文件内容直接用字符串表示
usersStr := `
     Alice 20 alice@gmail.com
     Bob 25 bob@outlook.com
     gerrylon 26 gerrylon@github.com
`
userRe := regexp.MustCompile(`(?P<name>[a-zA-Z]+)\s+(?P<age>\d+)\s+(?P<email>\w+@\w+(?:\.\w+)+)`)
// 这里要用FindAllStringSubmatch,找到所有的匹配
users := userRe.FindAllStringSubmatch(usersStr, -1)
groupNames := userRe.SubexpNames()
var result []map[string]string // slice of map
// 循环所有行
for _, user := range users {
     m := make(map[string]string)
     // 对每一行生成一个map
     for j, name := range groupNames {
         if j != 0 && name != "" {
             m[name] = strings.TrimSpace(user[j])
         }
     }
     result = append(result, m)
}
prettyResult, _ := json.MarshalIndent(result, "", "  ")
fmt.Println(string(prettyResult))

输出为:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
[
   {
     "age": "20",
     "email": "alice@gmail.com",
     "name": "Alice"
   },
   {
     "age": "25",
     "email": "bob@outlook.com",
     "name": "Bob"
   },
   {
     "age": "26",
     "email": "gerrylon@github.com",
     "name": "gerrylon"
   }
]

总结

  。

使用命名分组可以使正则表示的意义更清晰.

转换为map更加符合人类的阅读习惯,不过比一般的根据索引取分组值麻烦一些.

补充:golang 正则分组匹配多个值 。

看代码吧~

  。

?
1
2
3
4
5
import (
    "encoding/json"
    "fmt"
    "regexp"
)
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
str := `9x_xx:995:88`  // `9x_xx:995`
// 使用命名分组,一次匹配多个值
re := regexp.MustCompile(`(?P<fname>\w+):+(?P<mod>[1-9]*):*(?P<strlen>[0-9]*)`)
match := re.FindStringSubmatch(str)
groupNames := re.SubexpNames()
fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames))
 
result := make(map[string]string)
if len(match) == len(groupNames) {
    // 转换为map
    for i, name := range groupNames {
       if i != 0 && name != "" { // 第一个分组为空(也就是整个匹配)
          result[name] = match[i]
       }
    }
}
?
1
2
prettyResult, _ := json.MarshalIndent(result, "", "  ")
fmt.Printf("%s\n", prettyResult)

PS:我推荐两款在线的正则表达式工具.

 正则表达式在线测试工具 。

 正则表达式生成器 。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我。如有错误或未考虑完全的地方,望不吝赐教.

原文链接:https://gerrylon.blog.csdn.net/article/details/82532970 。

最后此篇关于golang正则之命名分组方式的文章就讲到这里了,如果你想了解更多关于golang正则之命名分组方式的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com