gpt4 book ai didi

java - 在数字第一次出现时分割字符串的最有效方法?

转载 作者:行者123 更新时间:2023-12-01 18:23:17 24 4
gpt4 key购买 nike

JamesBond001.txt
JamesBond002.txt
JamesBond003.txt

我想将其分为两部分 {JamesBond|001} 、{JamesBond|002}、{JamesBond|003}

最佳答案

为了让您做出明智的决定,以下是两个竞争解决方案的基准。

@OutputTimeUnit(TimeUnit.NANOSECONDS)
@BenchmarkMode(Mode.AverageTime)
@OperationsPerInvocation(Measure.SIZE)
@Warmup(iterations = 10, time = 100, timeUnit=MILLISECONDS)
@Measurement(iterations = 5, time = 1000, timeUnit=MILLISECONDS)
@State(Scope.Thread)
@Threads(1)
@Fork(1)
public class Measure
{
public static final int SIZE = 1;

String toSplit;

@Setup public void setup() {
final Random rnd = ThreadLocalRandom.current();
toSplit = IntStream.range(0, 100)
.mapToObj(i -> String.valueOf((char)(i < 95? 'A'+rnd.nextInt(20) : '0'+rnd.nextInt(10))))
.collect(joining());
}

static final Pattern regex = Pattern.compile("(?<=\\D)(?=\\d)");

@Benchmark public String[] regex() {
return regex.split(toSplit);
}

@Benchmark public String[] loop() {
int i;
for (i = 0; i < toSplit.length(); i++)
if (toSplit.charAt(i) >= '0' && toSplit.charAt(i) <= '9')
break;
return new String[] { toSplit.substring(0, i), toSplit.substring(i, toSplit.length()) };
}
}

因此,我们正在使用 100 个字符的字符串进行测试,其中最后 5 个字符是数字。这是最坏的情况,因为我们必须搜索几乎整个较长的字符串才能找到分割点。

结果:

Benchmark            Mode  Samples     Score      Error  Units
o.s.Measure.loop avgt 5 96,772 ± 8,671 ns/op
o.s.Measure.regex avgt 5 3720,446 ± 1096,872 ns/op

尽管我们非常小心地编译了正则表达式,但自定义循环还是将正则表达式打得一塌糊涂。

关于java - 在数字第一次出现时分割字符串的最有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27035215/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com