gpt4 book ai didi

scala - 通过键写入多个输出 Scalding Hadoop,一个 MapReduce 作业

转载 作者:可可西里 更新时间:2023-11-01 14:16:40 24 4
gpt4 key购买 nike

如何在单个 Map Reduce 作业中使用 Scalding(/级联)写入依赖于键的多个输出。我当然可以对所有可能的键使用 .filter,但这是一个可怕的 hack,它会激发许多工作。

最佳答案

TemplatedTsv在 Scalding 中(从版本 0.9.0rc16 及更高版本),与 Cascading TemplateTsv 完全相同。

Tsv(args("input"), ('COUNTRY, 'GDP))
.read
.write(TemplatedTsv(args("output"), "%s", 'COUNTRY))
// it will create a directory for each country under "output" path in Hadoop mode.

关于scala - 通过键写入多个输出 Scalding Hadoop,一个 MapReduce 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23994383/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com