java - 如何有效(性能)从Java中的列表中删除许多项？-6ren

java - 如何有效(性能)从Java中的列表中删除许多项？

转载作者：IT老高更新时间：2023-10-28 21:07:45

我有一个相当大的List命名项(> = 1,000,000个项)，并且用表示的某些条件选择要删除的项，并且对于列表中的许多(也许一半)项都是正确的。

我的目标是有效地删除由选择的项目并保留所有其他项目，可以修改源列表，可以创建新列表-应该根据性能选择最佳方法。

这是我的测试代码:

    System.out.println("preparing items");
    List<Integer> items = new ArrayList<Integer>(); // Integer is for demo
    for (int i = 0; i < 1000000; i++) {
        items.add(i * 3); // just for demo
    }

    System.out.println("deleting items");
    long startMillis = System.currentTimeMillis();
    items = removeMany(items);
    long endMillis = System.currentTimeMillis();

    System.out.println("after remove: items.size=" + items.size() + 
            " and it took " + (endMillis - startMillis) + " milli(s)");

和天真的实现:

public static <T> List<T> removeMany(List<T> items) {
    int i = 0;
    Iterator<T> iter = items.iterator();
    while (iter.hasNext()) {
        T item = iter.next();
        // <cond> goes here
        if (/*<cond>: */i % 2 == 0) {
            iter.remove();
        }
        i++;
    }
    return items;
}

如您所见，我使用项索引模2 == 0作为删除条件( )-仅用于演示目的。

可以提供什么更好的 removeMany版本，为什么这个更好的版本实际上更好呢？

最佳答案

好的，现在该是提出的方法的测试结果了。这里是我测试过的方法(每种方法的名称在我的资源中也是类名):

NaiveRemoveManyPerformer-带有迭代器和remove的ArrayList-我的问题中给出的第一个天真的实现。

BetterNaiveRemoveManyPerformer-带有向后迭代并从头到尾删除的ArrayList。

LinkedRemoveManyPerformer-天真的迭代器，可以删除但可以使用LinkedList。缺点:仅适用于LinkedList。

CreateNewRemoveManyPerformer-ArrayList作为副本制作(仅添加保留的元素)，迭代器用于遍历输入的ArrayList。

SmartCreateNewRemoveManyPerformer-更好的CreateNewRemoveManyPerformer-结果ArrayList的初始大小(容量)设置为最终列表大小。缺点:启动时必须知道列表的最终大小。

FasterSmartCreateNewRemoveManyPerformer-更好(？)SmartCreateNewRemoveManyPerformer-使用项目索引(items.get(idx))代替迭代器。

MagicRemoveManyPerformer-就ArrayList而言就地工作(无列表副本)，并从列表末尾开始压缩孔(已删除项目)。缺点:此方法更改列表中项目的顺序。

ForwardInPlaceRemoveManyPerformer-适用于ArrayList-移动保留项以填充孔，最后返回subList(没有最终移除或清除)。

GuavaArrayListRemoveManyPerformer-用于Iterables.removeIf的Google Guava ArrayList-与ForwardInPlaceRemoveManyPerformer几乎相同，但最终删除列表末尾的项目。

完整的源代码在此答案的末尾给出。

使用不同的列表大小(从10,000到10,000,000个项目)和不同的删除因子(指定必须从列表中删除多少个项目)执行测试。

正如我在评论中发布的其他答案一样，我认为将项目从 ArrayList复制到第二个 ArrayList的过程比迭代 LinkedList并删除项目要快。 Sun的Java文档指出，与 ArrayList实现相比， LinkedList的常数因子较低，但是令人惊讶的是，我的问题并非如此。

实际上，在大多数情况下，具有简单迭代和删除功能的 LinkedList具有最佳性能(此方法在 LinkedRemoveManyPerformer中实现)。通常，只有 MagicRemoveManyPerformer的性能可与 LinkedRemoveManyPerformer相提并论，其他方法则要慢得多。 Google Guava GuavaArrayListRemoveManyPerformer比手工制作的类似代码慢(因为我的代码不会删除列表末尾的不必要项目)。

从1,000,000个源项目中删除500,000个项目的示例结果:

NaiveRemoveManyPerformer:未执行测试-我不是那个病人，但是它的表现比BetterNaiveRemoveManyPerformer差。

BetterNaiveRemoveManyPerformer:226080毫升

LinkedRemoveManyPerformer:69毫升

CreateNewRemoveManyPerformer:246毫升

SmartCreateNewRemoveManyPerformer:112毫升

FasterSmartCreateNewRemoveManyPerformer:202毫升

MagicRemoveManyPerformer:74毫升

ForwardInPlaceRemoveManyPerformer:69毫升

GuavaArrayListRemoveManyPerformer:118毫升

从1,000,000个源项目中删除1个项目的示例结果(已删除第一个项目):

BetterNaiveRemoveManyPerformer:34毫升

LinkedRemoveManyPerformer:41毫升

CreateNewRemoveManyPerformer:253毫升

SmartCreateNewRemoveManyPerformer:108毫升

FasterSmartCreateNewRemoveManyPerformer:71毫升

MagicRemoveManyPerformer:43毫升

ForwardInPlaceRemoveManyPerformer:73毫升

GuavaArrayListRemoveManyPerformer:78毫升

从1,000,000个源项目中删除333,334个项目的示例结果:

BetterNaiveRemoveManyPerformer:253206毫升

LinkedRemoveManyPerformer:69毫升

CreateNewRemoveManyPerformer:245毫升

SmartCreateNewRemoveManyPerformer:111毫米

FasterSmartCreateNewRemoveManyPerformer:203毫升

MagicRemoveManyPerformer:69毫升

ForwardInPlaceRemoveManyPerformer:72毫升

GuavaArrayListRemoveManyPerformer:102毫升

从1,000,000个源项目中删除1,000,000个(所有)项目的示例结果(所有项目都被删除，但经过一个接一个的处理，如果您先验地知道要删除所有项目，则应该简单地清除列表):

BetterNaiveRemoveManyPerformer:58毫升

LinkedRemoveManyPerformer:88毫升

CreateNewRemoveManyPerformer:95毫升

SmartCreateNewRemoveManyPerformer:91毫升

FasterSmartCreateNewRemoveManyPerformer:48毫升

MagicRemoveManyPerformer:61毫升

ForwardInPlaceRemoveManyPerformer:49毫升

GuavaArrayListRemoveManyPerformer:133毫米

我的最终结论是:使用混合方法-如果处理LinkedList-最好进行简单的迭代和删除，如果处理ArrayList-取决于项目顺序是否重要-然后使用ForwardInPlaceRemoveManyPerformer-如果可以更改项目顺序-最佳选择是MagicRemoveManyPerformer。如果先验地知道移除因子(您知道将要移除多少个项目还是保留了多少个项目)，那么在特定情况下可以采用更多条件来选择效果更好的方法。但是已知的去除因子不是通常的情况... Google Guava Iterables.removeIf是这样一种混合解决方案，但是假设稍有不同(必须更改原始列表，不能创建新列表，并且始终按项目顺序排列)-这些是最常见的假设，因此 removeIf在大多数现实生活中都是最佳选择。

还要注意，所有好的方法(天真的不好!)都足够好-在实际应用中，其中任何一个都做得很好，但是必须避免使用天真的方法。

最后-我的测试源代码。

package WildWezyrListRemovalTesting;

import com.google.common.base.Predicate;
import com.google.common.collect.Iterables;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;

public class RemoveManyFromList {

    public static abstract class BaseRemoveManyPerformer {

        protected String performerName() {
            return getClass().getSimpleName();
        }

        protected void info(String msg) {
            System.out.println(performerName() + ": " + msg);
        }

        protected void populateList(List<Integer> items, int itemCnt) {
            for (int i = 0; i < itemCnt; i++) {
                items.add(i);
            }
        }

        protected boolean mustRemoveItem(Integer itemVal, int itemIdx, int removeFactor) {
            if (removeFactor == 0) {
                return false;
            }
            return itemIdx % removeFactor == 0;
        }

        protected abstract List<Integer> removeItems(List<Integer> items, int removeFactor);

        protected abstract List<Integer> createInitialList();

        public void testMe(int itemCnt, int removeFactor) {
            List<Integer> items = createInitialList();
            populateList(items, itemCnt);
            long startMillis = System.currentTimeMillis();
            items = removeItems(items, removeFactor);
            long endMillis = System.currentTimeMillis();
            int chksum = 0;
            for (Integer item : items) {
                chksum += item;
            }
            info("removing took " + (endMillis - startMillis)
                    + " milli(s), itemCnt=" + itemCnt
                    + ", removed items: " + (itemCnt - items.size())
                    + ", remaining items: " + items.size()
                    + ", checksum: " + chksum);
        }
    }
    private List<BaseRemoveManyPerformer> rmps =
            new ArrayList<BaseRemoveManyPerformer>();

    public void addPerformer(BaseRemoveManyPerformer rmp) {
        rmps.add(rmp);
    }
    private Runtime runtime = Runtime.getRuntime();

    private void runGc() {
        for (int i = 0; i < 5; i++) {
            runtime.gc();
        }
    }

    public void testAll(int itemCnt, int removeFactor) {
        runGc();
        for (BaseRemoveManyPerformer rmp : rmps) {
            rmp.testMe(itemCnt, removeFactor);
        }
        runGc();
        System.out.println("\n--------------------------\n");
    }

    public static class NaiveRemoveManyPerformer
            extends BaseRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
            if (items.size() > 300000 && items instanceof ArrayList) {
                info("this removeItems is too slow, returning without processing");
                return items;
            }
            int i = 0;
            Iterator<Integer> iter = items.iterator();
            while (iter.hasNext()) {
                Integer item = iter.next();
                if (mustRemoveItem(item, i, removeFactor)) {
                    iter.remove();
                }
                i++;
            }
            return items;
        }

        @Override
        public List<Integer> createInitialList() {
            return new ArrayList<Integer>();
        }
    }

    public static class BetterNaiveRemoveManyPerformer
            extends NaiveRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
//            if (items.size() > 300000 && items instanceof ArrayList) {
//                info("this removeItems is too slow, returning without processing");
//                return items;
//            }

            for (int i = items.size(); --i >= 0;) {
                Integer item = items.get(i);
                if (mustRemoveItem(item, i, removeFactor)) {
                    items.remove(i);
                }
            }
            return items;
        }
    }

    public static class LinkedRemoveManyPerformer
            extends NaiveRemoveManyPerformer {

        @Override
        public List<Integer> createInitialList() {
            return new LinkedList<Integer>();
        }
    }

    public static class CreateNewRemoveManyPerformer
            extends NaiveRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
            List<Integer> res = createResultList(items, removeFactor);
            int i = 0;

            for (Integer item : items) {
                if (mustRemoveItem(item, i, removeFactor)) {
                    // no-op
                } else {
                    res.add(item);
                }
                i++;
            }

            return res;
        }

        protected List<Integer> createResultList(List<Integer> items, int removeFactor) {
            return new ArrayList<Integer>();
        }
    }

    public static class SmartCreateNewRemoveManyPerformer
            extends CreateNewRemoveManyPerformer {

        @Override
        protected List<Integer> createResultList(List<Integer> items, int removeFactor) {
            int newCapacity = removeFactor == 0 ? items.size()
                    : (int) (items.size() * (removeFactor - 1L) / removeFactor + 1);
            //System.out.println("newCapacity=" + newCapacity);
            return new ArrayList<Integer>(newCapacity);
        }
    }

    public static class FasterSmartCreateNewRemoveManyPerformer
            extends SmartCreateNewRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
            List<Integer> res = createResultList(items, removeFactor);

            for (int i = 0; i < items.size(); i++) {
                Integer item = items.get(i);
                if (mustRemoveItem(item, i, removeFactor)) {
                    // no-op
                } else {
                    res.add(item);
                }
            }

            return res;
        }
    }

    public static class ForwardInPlaceRemoveManyPerformer
            extends NaiveRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
            int j = 0; // destination idx
            for (int i = 0; i < items.size(); i++) {
                Integer item = items.get(i);
                if (mustRemoveItem(item, i, removeFactor)) {
                    // no-op
                } else {
                    if (j < i) {
                        items.set(j, item);
                    }
                    j++;
                }
            }

            return items.subList(0, j);
        }
    }

    public static class MagicRemoveManyPerformer
            extends NaiveRemoveManyPerformer {

        @Override
        public List<Integer> removeItems(List<Integer> items, int removeFactor) {
            for (int i = 0; i < items.size(); i++) {
                if (mustRemoveItem(items.get(i), i, removeFactor)) {
                    Integer retainedItem = removeSomeFromEnd(items, removeFactor, i);
                    if (retainedItem == null) {
                        items.remove(i);
                        break;
                    }
                    items.set(i, retainedItem);
                }
            }

            return items;
        }

        private Integer removeSomeFromEnd(List<Integer> items, int removeFactor, int lowerBound) {
            for (int i = items.size(); --i > lowerBound;) {
                Integer item = items.get(i);
                items.remove(i);
                if (!mustRemoveItem(item, i, removeFactor)) {
                    return item;
                }
            }
            return null;
        }
    }

    public static class GuavaArrayListRemoveManyPerformer
            extends BaseRemoveManyPerformer {

        @Override
        protected List<Integer> removeItems(List<Integer> items, final int removeFactor) {
            Iterables.removeIf(items, new Predicate<Integer>() {

                public boolean apply(Integer input) {
                    return mustRemoveItem(input, input, removeFactor);
                }
            });

            return items;
        }

        @Override
        protected List<Integer> createInitialList() {
            return new ArrayList<Integer>();
        }
    }

    public void testForOneItemCnt(int itemCnt) {
        testAll(itemCnt, 0);
        testAll(itemCnt, itemCnt);
        testAll(itemCnt, itemCnt - 1);
        testAll(itemCnt, 3);
        testAll(itemCnt, 2);
        testAll(itemCnt, 1);
    }

    public static void main(String[] args) {
        RemoveManyFromList t = new RemoveManyFromList();
        t.addPerformer(new NaiveRemoveManyPerformer());
        t.addPerformer(new BetterNaiveRemoveManyPerformer());
        t.addPerformer(new LinkedRemoveManyPerformer());
        t.addPerformer(new CreateNewRemoveManyPerformer());
        t.addPerformer(new SmartCreateNewRemoveManyPerformer());
        t.addPerformer(new FasterSmartCreateNewRemoveManyPerformer());
        t.addPerformer(new MagicRemoveManyPerformer());
        t.addPerformer(new ForwardInPlaceRemoveManyPerformer());
        t.addPerformer(new GuavaArrayListRemoveManyPerformer());

        t.testForOneItemCnt(1000);
        t.testForOneItemCnt(10000);
        t.testForOneItemCnt(100000);
        t.testForOneItemCnt(200000);
        t.testForOneItemCnt(300000);
        t.testForOneItemCnt(500000);
        t.testForOneItemCnt(1000000);
        t.testForOneItemCnt(10000000);
    }
}

关于java - 如何有效(性能)从Java中的列表中删除许多项？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2043783/

文章推荐： java - 比较 XML 时如何忽略某些元素？

文章推荐： python - 是否有推荐的多行导入格式？

文章推荐： Python字符串类，如C#中的StringBuilder？

文章推荐： java - Hibernate中带有命名查询的可选参数？

javascript - Ember.js，性能，性能 :
性能:数据存储写入与请求日志写入
我们希望通过我们的应用收集使用情况统计信息。因此，我们希望在服务器端的某个地方跟踪用户操作。就性能而言，哪个选项更合适: 在 App Engine 请求日志中跟踪用户操作。即为每个用户操作写入一个日
LINQ 性能
在针对对象集合的 LINQ 查询的幕后究竟发生了什么？它只是语法糖还是发生了其他事情使其更有效的查询？最佳答案您是指查询表达式，还是查询在幕后的作用？查询表达式首先扩展为“普通”C#。例如: v
WPF 性能
我正在构建一个简单的照片库应用程序，它在列表框中显示图像。 xaml 是:
java缓存系统和静态HashMap存储-性能
对于基于 Web 的企业应用程序，使用“静态 Hashmap 存储对象” 和 apache java 缓存系统有何优缺点？哪一个最有利于性能并减少堆内存问题例如: Map store=Applica
jquery存储变量类(性能)
我想知道在性能方面存储类变量的最佳方式是什么。我的意思是，由于 Children() 函数，存储一个 div id 比查找所有其他类名更好。还是把类名写在变量里比较好？例如这样: var $inne
Cassandra 性能
我已经阅读了所有这些关于 cassandra 有多快的文章，例如单行读取可能需要大约 5 毫秒。到目前为止，我不太关心我的网站速度，但是随着网站变得越来越大，一些页面开始需要相当多的查询，例如一个页
MySQL 性能
最近，我在缓存到内存缓存之前的查询一直需要很长时间才能处理!在这个例子中，它花费了 10 秒。在这种情况下，我要做的就是获得 10 个最近的点击。我感觉它加载了所有 125,592 行然后只返回 1
基本操作的C#性能
我找了几篇文章(包括SA中的一些问题)，试图找到基本操作的成本。但是，我尝试制作自己的小程序，以便自己进行测试。在尝试测试加法和减法时，我遇到了一些问题，我用简单的代码向您展示了这一点
Java远程调试——性能
这个问题在这里已经有了答案: Will Java app slow down by presence of -Xdebug or only when stepping through code? (
Javascript with() 性能
我记得很久以前读过 with() 对 JavaScript 有一些严重的性能影响，因为它可能对范围堆栈进行非确定性更改。我很难找到最近对此的讨论。这仍然是真的吗？最佳答案与其说 with 对性能有
MySQL 性能
我们有一个数据仓库，其中包含非规范化表，行数从 50 万行到 6 多万行不等。我正在开发一个报告解决方案，因此出于性能原因我们正在使用数据库分页。我们的报告有搜索条件，并且我们已经创建了必要的索引，但
mysql - 性能
我有一条有效的 SQL 语句，但需要很长时间才能处理我有一个 a_log 表和一个 people 表。我需要在 people 表中找到给定人员的每个 ID 的最后一个事件和关联的用户。 SELECT
JavaScript 性能
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
CSS 性能
通常当我建立一个站点时，我将所有的 CSS 放在一个文件中，并且一次性定义与一组元素相关的所有属性。像这样: #myElement { color: #fff; background-
CSS 性能
两者之间是否存在任何性能差异: p { margin:0px; padding:0px; } 并省略最后的分号: p { margin:0px; padding:0px } 提前致谢!
PHP高精数学-性能
我的应用程序 (PHP) 需要执行大量高精度数学运算(甚至可能出现一共100个数字) 通过这个论坛的最后几篇帖子，我发现我必须使用任何高精度库，如 BC Math 或 GMP，因为 float 类型不
Javamail 性能
我一直在使用 javamail 从 IMAP 服务器(目前是 GMail)检索邮件。 Javamail 非常快速地从服务器检索特定文件夹中的消息列表(仅 id)，但是当我实际获取消息(仅包含甚至不包含
ruby 性能
我非常渴望开发我的第一个 Ruby 应用程序，因为我的公司终于在内部批准了它的使用。在我读到的关于 Ruby v1.8 之前的所有内容中，从来没有任何关于性能的正面评价，但我没有发现关于 1.9 版
redis结构、性能
我是 Redis 的新手，我有一个包含数百万个成员(member) ID、电子邮件和用户名的数据集，并且正在考虑将它们存储在例如列表结构中。我认为 list 和 sorted set 可能最适合我的情

IT老高

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 如何有效(性能)从Java中的列表中删除许多项？