gpt4 book ai didi

java - 子串检测性能?

转载 作者:行者123 更新时间:2023-12-01 18:31:26 24 4
gpt4 key购买 nike

我需要匹配一个子字符串,我想知道在匹配正则表达式时哪个更快?

if ( str.matches(".*hello.*") ) {
...
}


Pattern p = Pattern.compile( ".*hello.*" );
Matcher m = p.matcher( str );
if ( m.find() ) {
...
}


如果不需要正则表达式,我应该使用“包含”吗?

if ( str.contains("hello") ) {
...
}

谢谢。

最佳答案

虽然 matches() 和使用 Matcher 是相同的(matches() 在其实现中使用 Matcher),但如果缓存和重用,使用 Matcher 会更快已编译的Pattern。我做了一些粗略的测试,它的性能(就我而言)提高了 400% - 改进取决于正则表达式,但总会有一些改进。

虽然我还没有测试过它,但我希望 contains() 的性能优于任何正则表达式方法,因为该算法要简单得多,并且在这种情况下不需要正则表达式。

<小时/>

以下是测试包含子字符串的字符串的 6 种方法的结果,其中目标(“http”)位于标准 60 个字符输入中的不同位置:

|------------------------------------------------------------|
| Code tested with "http" in the input | µsec | µsec | µsec |
| at the following positions: | start| mid|absent|
|------------------------------------------------------------|
| input.startsWith("http") | 6 | 6 | 6 |
|------------------------------------------------------------|
| input.contains("http") | 2 | 22 | 49 |
|------------------------------------------------------------|
| Pattern p = Pattern.compile("^http.*")| | | |
| p.matcher(input).find() | 90 | 88 | 86 |
|------------------------------------------------------------|
| Pattern p = Pattern.compile("http.*") | | | |
| p.matcher(input).find() | 84 | 145 | 181 |
|------------------------------------------------------------|
| input.matches("^http.*") | 745 | 346 | 340 |
|------------------------------------------------------------|
| input.matches("http.*") | 1663 | 1229 | 1034 |
|------------------------------------------------------------|

两行选项是编译静态模式然后重用的地方。

关于java - 子串检测性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23975716/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com