& & < ;” 我想出了这个正则表达式模式:“&[a-zA-Z0-9]{2,7};”,效果很好-6ren">
gpt4 book ai didi

java - 正则表达式优化 - 在 Java 中转义&符号

转载 作者:搜寻专家 更新时间:2023-10-31 19:36:26 25 4
gpt4 key购买 nike

我需要替换不属于 HTML 实体的字符串中的所有 &。这样字符串 "This & entites > & <"将返回 "This & entites > & < ;

我想出了这个正则表达式模式:“&[a-zA-Z0-9]{2,7};”,效果很好。但我对正则表达式不是很熟练,当我测试超过 100k 次迭代的速度时,它使用的时间是以前使用的方法的两倍,没有使用正则表达式。 (但也没有 100% 地工作)。

测试代码:

long time = System.currentTimeMillis();
String reg = "&(?!&#?[a-zA-Z0-9]{2,7};)";
String s="a regex test 1 & 2 1&2 and &_gt; - &_lt;"
for (int i = 0; i < 100000; i++) {test=s.replaceAll(reg, "&amp;");}
System.out.println("Finished in:" + (System.currentTimeMillis() - time) + " milliseconds");

所以问题是是否有一些明显的方法可以优化此正则表达式以使其更有效?

最佳答案

s.replaceAll(reg, "&") 每次都在编译正则表达式。编译模式一次将提供一些性能提升(在这种情况下约为 30%)。

long time = System.currentTimeMillis();
String reg = "&(?!&#?[a-zA-Z0-9]{2,7};)";
Pattern p = Pattern.compile(reg);
String s="a regex test 1 & 2 1&2 and &_gt; - &_lt;";
for (int i = 0; i < 100000; i++) {
String test = p.matcher(s).replaceAll("&amp;");
}
System.out.println("Finished in:" +
(System.currentTimeMillis() - time) + " milliseconds");

关于java - 正则表达式优化 - 在 Java 中转义&符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/848231/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com