gpt4 book ai didi

java - 如何在没有 OutOfMemoryError 的情况下迭代大型 Mongo 集合

转载 作者:太空宇宙 更新时间:2023-11-04 12:13:43 24 4
gpt4 key购买 nike

在我的 Spring 应用程序中,我想迭代 Mongo 集合以对每个条目执行一些工作。该集合可能非常大,因此不能简单地获取所有条目的列表,因为这会导致 OutOfMemoryErrors。

我最近的尝试是这样的:

void m(MongoOperations ops, Set<String> ids) {
Query query = new Query().addCriteria(Criteria.where("id").in(ids));
CloseableIterator<Foo> it = ops.stream(query, Foo.class);
it.forEachRemaining(foo -> {
System.out.println(foo.getName());
}
}

令我惊讶的是,我在这里遇到了 OutOfMemoryErrors。看起来只要调用 it.forEachRemaining ,与查询匹配的 Foo 的所有条目都会加载到内存中。

Heapdump 显示 CloseableIteratorAdaptor 持有一个 DBCursor,后者持有一个 QueryResultIterator,而后者又持有一个包含所有条目的 ArrayList

我做错了什么吗?stream() 是否总是将所有条目加载到内存中?我必须实现分页吗?

这是我的堆转储的支配树的相关部分。

Class Name                                                                                                           | Shallow Heap | Retained Heap | Percentage
-----------------------------------------------------------------------------------------------------------------------------------------------------------------
org.example.server.OrganizationScopedThreadFactory$OrganizationScopedThread @ 0x81f71718 pool-1-thread-1 Thread| 128 | 1,453,308,456 | 87,50%
|- org.springframework.data.mongodb.core.MongoTemplate$CloseableIterableCursorAdapter @ 0x8b2df1c0 | 24 | 1,432,708,656 | 86,26%
| |- com.mongodb.DBCursor @ 0x8b3bb0f8 | 96 | 1,432,708,600 | 86,26%
| | |- com.mongodb.QueryResultIterator @ 0x8b5e7c70 | 72 | 1,431,064,320 | 86,16%
| | | |- java.util.ArrayList$Itr @ 0x8b5e7cb8 | 32 | 1,431,064,152 | 86,16%
| | | | '- java.util.ArrayList @ 0x8b5e7cd8 | 24 | 1,431,064,120 | 86,16%
| | | | '- java.lang.Object[30391] @ 0x8b5e8ed8 | 121,584 | 1,431,064,096 | 86,16%
| | | | |- com.mongodb.BasicDBObject @ 0x8c2eed70 | 64 | 123,528 | 0,01%
| | | | | |- java.util.LinkedHashMap$Entry @ 0x8c2eef18 | 40 | 122,240 | 0,01%
| | | | | | |- com.mongodb.BasicDBList @ 0x8c2eef78 | 32 | 122,144 | 0,01%
| | | | | | | '- java.lang.Object[10] @ 0x8c2eef98 | 56 | 122,112 | 0,01%
| | | | | | | '- com.mongodb.DBRef @ 0x8c2eefd0 | 32 | 122,056 | 0,01%
| | | | | | | |- com.mongodb.BasicDBObject @ 0xc5dbc778 | 64 | 121,992 | 0,01%
| | | | | | | |- org.bson.types.ObjectId @ 0x8c2eeff0 | 32 | 32 | 0,00%
| | | | | | | '- Total: 2 entries | | |
| | | | | | |- java.lang.String @ 0x8c2eef40 projects | 24 | 56 | 0,00%
| | | | | | '- Total: 2 entries | | |
| | | | | |- java.util.LinkedHashMap$Entry @ 0x8c2eee00 | 40 | 1,024 | 0,00%
| | | | | |- java.util.LinkedHashMap$Entry @ 0x8c2eeea0 | 40 | 120 | 0,00%
| | | | | |- java.util.HashMap$Node[16] @ 0x8c2eedb0 | 80 | 80 | 0,00%
| | | | | '- Total: 4 entries | | |
| | | | |- com.mongodb.BasicDBObject @ 0x8bcfd4c0 | 64 | 123,480 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8c48e2c8 | 64 | 113,520 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8c66f668 | 64 | 112,296 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8c87afe0 | 64 | 112,120 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8c521008 | 64 | 106,096 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8cdc68d0 | 64 | 99,576 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8c8efa40 | 64 | 90,456 | 0,01%
| | | | |- com.mongodb.BasicDBObject @ 0x8b8e0d18 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bbc5a30 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bc446e8 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bcc0ca0 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bda1d30 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8be46048 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8be462e8 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8beb24f8 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8beb2798 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bee79d0 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf04f38 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf0eae8 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf0ed88 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf14220 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf3edf0 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf78640 | 64 | 77,600 | 0,00%
| | | | |- com.mongodb.BasicDBObject @ 0x8bf7dd30 | 64 | 77,600 | 0,00%
| | | | '- Total: 25 of 30.276 entries; 30.251 more | | |
-----------------------------------------------------------------------------------------------------------------------------------------------------------------

更新:此后,我尝试通过设置查询限制并对其进行排序来实现分页,然后反复跳过条目,直到迭代完所有内容。虽然这确实解决了我的内存问题,但它显着降低了性能(大约慢了 100 倍),可能是因为需要排序。

我使用的是 Spring Boot 1.3.7

最佳答案

游标的内存限制为 16 MB,您可能需要编写应用程序级循环来通过使用跳过、限制和排序来选择 1000 个批处理。

先选1000,然后从1000到2000,以此类推,直到文档末尾,查询时一定要使用排序,使数据一致。

此外,如果您要修改正在查询和排序的字段,则必须小心,以免相同的数据不断弹出。

关于java - 如何在没有 OutOfMemoryError 的情况下迭代大型 Mongo 集合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39625601/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com