gpt4 book ai didi

mongodb - 计算工作集的过程是怎样的?

转载 作者:可可西里 更新时间:2023-11-01 10:44:40 27 4
gpt4 key购买 nike

如果我在 Mongo DB 上有一百万条记录,并且每条记录有 5 KB 大。假设我想对此数据运行 Map-Reduce,并想估计此应用程序所需的 RAM。在 map-reduce 操作期间,不会对该数据库进行读取或写入操作。 map-reduce 将聚合一些记录并对聚合记录进行逻辑比较。

我想了解 map-reduce 如何将数据带入 RAM,因此应该如何计算工作集(例如:我是否应该假设 1 MM x 5 Kb 将是我的工作集)。

最佳答案

据我了解,Map-Reduce 作业的工作集将是您将运行 map() 函数的整个数据集。例如,如果您的数据是 1M 个对象并且您的 map() 函数查看每个文档,那么工作集将为 1M x 5K。如果您将数据的某些子集(比如 500K 个对象)提供给 map() 函数,那么它将是 500K x 5K。在任何一种情况下,您都必须包括任何预定义索引的大小。

关于mongodb - 计算工作集的过程是怎样的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10483508/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com