gpt4 book ai didi

java - Scala - 如何返回这种 RDD 类型

转载 作者:可可西里 更新时间:2023-11-01 14:52:28 25 4
gpt4 key购买 nike

我尝试使返回 RDD 的方法引用 this ,但失败了,因为返回需要参数。根据 API (Java),这是我的代码:

def HBaseToRDD(_HBaseConfiguration:HBaseConfiguration, _sc:SparkContext) : RDD[(K, V)] = 
{
val HBaseRDD = _sc.newAPIHadoopRDD(_HBaseConfiguration, classOf[TableInputFormat],
classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
classOf[org.apache.hadoop.hbase.client.Result])
}

有解决这个问题的想法吗?提前致谢...

最佳答案

由于 Yuval Itzchakov 已经提到缺少关于 KV 的信息,此外我观察到以下内容:

  1. 您的方法中缺少返回值
  2. 即使您返回 val HBaseRDD 代码仍然无法编译,因为预期返回值的类型为 RDD[(K, V)] val HBaseRDD 的类型为 RDD[(org.apache.hadoop.hbase.io.ImmutableBytesWritable, org.apache.hadoop.hbase.client.Result)]

考虑到这一点和一些假设,工作代码示例可能如下所示:

def HBaseToRDD[K, V](_HBaseConfiguration:HBaseConfiguration, _sc:SparkContext) : RDD[(K, V)] =
{
def toK(key: org.apache.hadoop.hbase.io.ImmutableBytesWritable): K = {
// here you convert key to K
}

def toV(row: org.apache.hadoop.hbase.client.Result): V = {
// here you convert row to V
}

// no need to assign to variable, the result of map will be returned by scala
_sc.newAPIHadoopRDD(_HBaseConfiguration, classOf[TableInputFormat],
classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
classOf[org.apache.hadoop.hbase.client.Result]).map { case (key, row) =>
toK(key) -> toV(row) // return tuple of type (K, V)
}
}

关于java - Scala - 如何返回这种 RDD 类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38890925/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com