gpt4 book ai didi

java - 烫伤中的垂直分区

转载 作者:可可西里 更新时间:2023-11-01 16:45:14 24 4
gpt4 key购买 nike

我有一个 TypedTipe[(String, String, Long)]其中第一个 String 只能采用有限(~10)个值。我想对我的输出进行分区,以便为每种类型创建一个文件夹(即第一个字符串名称的 10 个文件夹)。这在 Hive 中很容易实现,但是我在 Scalding 中找不到一种优雅的方法来实现它。方法def partition(p: T => Boolean): (TypedPipe[T], TypedPipe[T])将管道分成两部分,但没有按照我的要求进行。

编辑

  • 我正在使用 Scalding v0.13.1
  • 我需要写一个PackedAvroSource

最佳答案

如果按要分区的字段分组,则可以使用 PartitionedDelimitedSource根据需要编写目录结构。例如:

val pipe: TypedPipe[(String, String, Long)] = ...
pipe
.groupBy(_._1)
.write(PartitionedDelimited[String, (String, String, Long)](args("output"), "%s"))

关于java - 烫伤中的垂直分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37349764/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com