gpt4 book ai didi

scala - Spark foreachPartition,如何获取每个分区的索引?

转载 作者:行者123 更新时间:2023-12-03 01:38:20 25 4
gpt4 key购买 nike

spark foreachPartition,如何获取分区的索引(或者序列号,或者识别分区的东西)?

val docs: RDD[String] = ...

println("num partitions: " + docs.getNumPartitions)

docs.foreachPartition((it: Iterator[String]) => {
println("partition index: " + ???)
it.foreach(...)
})

最佳答案

您可以使用TaskContext (How to get ID of a map task in Spark?):

import org.apache.spark.TaskContext

rdd.foreachPartition((it: Iterator[String]) => {
println(TaskContext.getPartitionId)
})

关于scala - Spark foreachPartition,如何获取每个分区的索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48383811/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com