gpt4 book ai didi

hadoop - Hadoop 中的 (key,value) 对总是 ('text' ,1) 吗?

转载 作者:可可西里 更新时间:2023-11-01 15:32:51 27 4
gpt4 key购买 nike

我是 Hadoop 新手。

你能说说(键/值)对吗?值总是一个吗? reduce 步骤的输出总是一个(键/值)对吗?如果是,该(键/值)数据将如何进一步使用?

请帮帮我。

最佳答案

我猜你问的是由于 wordcount 导致的 (key,values) 对的“一个”值Hadoop 教程中的示例。所以,答案是否定的,它并不总是“一个”。

MapReduce 的 Hadoop 实现通过在整个工作流中传递(键,值)对来工作,从输入到输出:

  • 映射步骤:一般来说(还有其他特殊情况,取决于输入格式),映射器逐行处理分配给它们的拆分内的数据;这些行作为 (key,value) 对传递给 map 方法,说明拆分中行的偏移量(键)和行本身(值)。然后,它们在输出端产生另一个 (key,value) 对,其含义取决于您正在实现的映射函数;有时它会是一个可变键和一个固定值(例如,在 wordcount 中,键是单词,值始终是“一”);其他时候,该值将是行的长度,或者以前缀开头的所有单词的总和……无论您怎么想; key 可能是一个词,一个固定的自定义键...

  • Reduce 步骤:通常,reducer 会接收映射器生成的(键,值)对列表,这些映射器的键相同(这当然取决于您使用的组合器类,但这只是一般情况)。然后,它们在 poutput 中产生另一个(键,值)对,同样,这取决于您的应用程序的逻辑。通常,reducer 用于聚合关于同一键的所有值。

这是一个非常粗略的快速和不详细的解释,我建议您阅读一些关于它的官方文档,或专业文献,如 this .

关于hadoop - Hadoop 中的 (key,value) 对总是 ('text' ,1) 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29843492/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com