gpt4 book ai didi

groovy - Groovy 解析字符串的最有效方法?

转载 作者:行者123 更新时间:2023-12-02 06:38:14 25 4
gpt4 key购买 nike

在 Groovy 中解析以下字符串的最有效方法是什么?

 slt-5.16.1.0XYZ

这样我得到以下结果:

 slt-5.16

值 5 和 16 可以是 1-nnn。

始终感谢帮助。

最佳答案

我建议在这种情况下使用简单的正则表达式,但既然您要求最有效的方法,我尝试了几种方法。

TL;DR

使用substring()和几个嵌套的indexOf():

input.substring(0, input.indexOf('.', input.indexOf('.') + 1 ) )

长篇故事(已更新)

我使用 Tim Yates 的好建议更新了基准测试,还添加了一些有趣的变化。您可以在下面找到结果、一些注意事项以及用于生成它们的代码:

Environment
===========
* Groovy: 2.4.14
* JVM: OpenJDK 64-Bit Server VM (25.71-b00, Oracle Corporation)
* JRE: 1.8.0-internal
* Total Memory: 117 MB
* Maximum Memory: 1710.5 MB
* OS: Linux (4.13.0-37-generic, amd64)

Options
=======
* Warm Up: Auto (- 60 sec)
* CPU Time Measurement: On

user system cpu real

indexOf 329 0 329 330
regex, just not a dot 704 7 711 722
manual loop, int vars 885 0 885 896
tokenizeJoin 1074 0 1074 1079
manual loop, int vars and def i 1078 0 1078 1090
manual loop, Integer vars 1065 3 1068 1085
manual loop, def vars 1122 0 1122 1127
regex, restricting to number 2725 24 2749 2760
manual loop, int vars but index without type 33087 0 33087 33132
manual loop, without types 47600 286 47886 47944

一些简短的考虑:

  • 带有否定组的正则表达式比限制组的正则表达式更快(实际上排名第二)(慢 4 倍)

  • 如果使用静态类型,手动循环的速度正如我预期的那样快:int 是最快的。 Integer 速度较慢,与 def 相当。让它们不带任何类型是最慢的解决方案!

代码:

@Grab('org.gperfutils:gbench:0.4.3-groovy-2.4')

def input = 'slt-5.16.1.0XYZ'
def target = 'slt-5.16'

benchmark {
'indexOf' {
assert target == input.substring(0,
input.indexOf('.', input.indexOf('.') + 1)
)
}
'regex, just not a dot' {
assert input.find(/^[^.]+[.][^.]+/) == target
}
'manual loop, int vars' {
int index, counter = 0
for (int i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
'tokenizeJoin' {
assert input.tokenize('.').take(2).join('.') == target
}
'manual loop, int vars and def i' {
int index, counter = 0
for (def i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
'manual loop, Integer vars' {
Integer index, counter = 0
for (Integer i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
'manual loop, def vars' {
def index, counter = 0
for (def i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
'regex, restricting to numbers' {
assert (input =~ /(.+-\d+\.\d+)/)[0][1] == target
}
'manual loop, int vars but index without type' {
int index, counter = 0
for (i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
'manual loop, without types' {
counter = 0
for (i=0; i <input.size(); i++) {
if (input[i] == '.') { counter++ }
if (counter == 2) { index = i; break }
}
assert input.substring(0,index) == target
}
}.prettyPrint()

关于groovy - Groovy 解析字符串的最有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49414761/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com