gpt4 book ai didi

java - 我可以通过 hadoop 中的代码明确地提前完成 map task 吗?

转载 作者:可可西里 更新时间:2023-11-01 15:25:34 26 4
gpt4 key购买 nike

在某些情况下,我不需要遍历 map task 中的每条输入记录。例如,我只发出最多 200 条满足每个映射器中特定条件的记录,然后它就可以退出。

我可以在 hadoop 中执行此操作吗? api文档中还没有找到相关的方法。

最佳答案

您可能可以通过覆盖 Mapper 中的 run 方法来实现此目的.

run 方法目前看起来像:

public void run(Context context) throws IOException, InterruptedException {
setup(context);
try {
while (context.nextKeyValue()) {
map(context.getCurrentKey(), context.getCurrentValue(), context);
}
} finally {
cleanup(context);
}
}

这就是调用标准 map() 方法的方式。您可以在其中添加一个计数器,并在它达到 200 时跳出 while 循环。

关于java - 我可以通过 hadoop 中的代码明确地提前完成 map task 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47525073/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com