gpt4 book ai didi

java - 删除重复字符串 |正则表达式 |模式匹配器

转载 作者:行者123 更新时间:2023-12-02 11:44:48 27 4
gpt4 key购买 nike

我对 Java 编程还很陌生,仍在学习中。我已经成功删除了“?”通过正则表达式捕获 URL 之外的内容。但是,我从中提取图像的网站有多个同名图像实例,因此返回重复的字符串。

如何删除重复的字符串?

我用于从网站捕获图像和名称的代码:

字符串结果 = null;

    try {
result = task.execute("https://www.therichest.com/top-lists/top-100-richest-celebrities").get();
String[] splitResult = result.split("<div class='wp-pagenavi'>");

Pattern p = Pattern.compile("srcset=\"(.*?)\\?q");
Matcher m = p.matcher(splitResult[0]);


while (m.find()) {
celebURLs.add(m.group(1));
System.out.println(m.group(1));
}

p = Pattern.compile("alt=\'(.*?)Net");
m = p.matcher(splitResult[0]);

while(m.find()) {
celebNames.add(m.group(1));
System.out.println(m.group(1));
}

最佳答案

最简单的方法是将所有名称放入一个集合中,然后在完成后遍历该集合。集合的功能将过滤掉欺骗者。

关于java - 删除重复字符串 |正则表达式 |模式匹配器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48289322/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com