gpt4 book ai didi

java - 能否以 map-reduce 的方式计算一组数据的百分位数?

转载 作者:搜寻专家 更新时间:2023-10-31 20:14:10 25 4
gpt4 key购买 nike

我的理解是计算百分位数,需要对数据进行排序。如果大量数据分布在多个服务器上而不四处移动,这是否可能?

最佳答案

虽然作为范例的 MapReduce 看起来不适合解决这个问题,但 hadoop 的 MR 实现却适合。
Hadoop 的 map reduce 实现基于分布式排序 - 这正是您所需要的。 Hadoop 通过在服务器之间只移动一次数据来进行排序——还不错。
我建议查看 hadoop terasort implementaiton,它说明了使用 hadoop 对海量数据进行排序的好(并且可能是最好的)方法。 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/examples/terasort/package-summary.html

关于java - 能否以 map-reduce 的方式计算一组数据的百分位数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12444099/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com