gpt4 book ai didi

java - 在字符串中使用正则表达式而不是 contains() 渲染速度较慢

转载 作者:行者123 更新时间:2023-12-02 11:27:10 25 4
gpt4 key购买 nike

我有一个代码块,其中在字符串中包含许多带有“contains()”的条件。我试图使用正则表达式使其变得更容易,但渲染需要花费大量时间 (SocketTimeoutException)。

旧代码:

if (!url.toLowerCase().contains("wikipedia")
&& !URL.toLowerCase().contains("vikidia")
&& !URL.toLowerCase().contains("wikimini")
&& !URL.toLowerCase().contains("dictionnaire")
&& !URL.toLowerCase().contains("dictionary")
&& !URL.toLowerCase().contains("traduction")
&& !URL.toLowerCase().contains("wiktionary")
&& !URL.toLowerCase().contains("academia.edu")
&& !URL.toLowerCase().contains("about.me")
&& !URL.toLowerCase().contains("facebook")
&& !URL.toLowerCase().contains("linkedin")
&& !URL.toLowerCase().contains("viadeo")
&& !URL.toLowerCase().contains("flickr")
&& !URL.toLowerCase().contains("google+")
&& !URL.toLowerCase().contains("plus.google")
&& !URL.toLowerCase().contains("instagram")
&& !URL.toLowerCase().contains("linkedin")
&& !URL.toLowerCase().contains("netlog")
&& !URL.toLowerCase().contains("orkut")
&& !URL.toLowerCase().contains("pinterest")
&& !URL.toLowerCase().contains("twitter")
&& !URL.toLowerCase().contains("tripadvisor")
&& !URL.toLowerCase().contains("youtube")
&& !URL.toLowerCase().contains("vimeo")
&& !URL.toLowerCase().contains("dailymotion")
&& !URL.toLowerCase().contains("pagesjaunes")
&& !URL.toLowerCase().contains("indeed")
&& !URL.toLowerCase().contains("jobteaser.com")
&& !URL.toLowerCase().contains("mappy.com")
&& !URL.toLowerCase().contains("slideshare")
&& !URL.toLowerCase().contains("meteofrance.com")
&& !URL.toLowerCase().contains("linternaute.com")
&& !URL.toLowerCase().contains("news.google")
&& !URL.toLowerCase().contains("persee.fr") // portail de revues en sciences humaines et sociales
&& !URL.toLowerCase().contains("/downloads") // the url for downloading
&& !URL.toLowerCase().contains("/streaming")
&& !URL.toLowerCase().contains("http://stackoverflow.com/")
&& !URL.endsWith("pdf")
&& !URL.endsWith("txt")
&& !URL.endsWith("ps")
&& !URL.endsWith("dwf")
&& !URL.endsWith("klm")
&& !URL.endsWith("kmz")
&& !URL.endsWith("xls")
&& !URL.endsWith("xlsx")
&& !URL.endsWith("ppt")
&& !URL.endsWith("pptx")
&& !URL.endsWith("doc")
&& !URL.endsWith("docx")
&& !URL.endsWith("rtf")
&& !URL.endsWith("swf")
&& !URL.contains(".en.")
&& !URL.contains("/en/")
&& !URL.contains("/en.")
&& !URL.contains("books.")
&& !URL.contains("forum.")
&& !URL.contains("forum")
&& !URL.contains("blog.")
&& !URL.contains("infogreffe.fr/") //to test
&& !URL.contains("bing.com/images")) {

if (!URL.matches(".*\\btraduction\\b.*")) {
...
}

重构一个:

if (!URL.toLowerCase().matches("^.*(wikipedia|vikidia|wikimini|dictionnaire|dictionary|traduction|wiktionary|(academia.edu)|(about.me)|facebook|linkedin|viadeo|flickr|(google+)|instagram|(plus.google)|linkedin|netlog|orkut|pinterest|twitter|tripadvisor|youtube|(vimeo+)|dailymotion|pagesjaunes|indeed|(jobteaser.com)|(mappy.com)|slideshare|(meteofrance.com)|(linternaute.com)|(news.google)|(persee.fr)|(/downloads)|(/streaming)|(stackoverflow.com)|pdf|txt|ps|dwf|klm||xls|xlsx|ppt|pptx|doc|docx|rtf|swf|(.en.)|(/en/)|(books.)|(forum.)|(blog.)|(infogreffe.fr/)|(bing.com/images)).*$")
) {...}

你有更好的想法来重构旧的吗?非常感谢

最佳答案

我可以提出一个建议,至少可以部分帮助解决有关 URL 结尾的逻辑。您可以将 URL 的末尾提取为字符串。然后,创建一个包含列入黑名单的字符串的映射,如下所示:

String URLend = "some_value";
Map<String, Integer> map = new HashMap<>();
map.put("pdf", 1);
map.put("txt", 1);
map.put("ps", 1);
map.put("dwf", 1);
// and other terms...

现在您可以轻松检查网址末尾是否与列入黑名单的术语匹配:

if (map.get(URLend) != null) {
// then the URL is blacklisted
}

这里的优点是查找时间是恒定的,比冗长的正则表达式可能要快得多。缺点是这仅涵盖您需要比较整个字符串的逻辑,这不会完全解决您的问题。

关于java - 在字符串中使用正则表达式而不是 contains() 渲染速度较慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49536065/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com