gpt4 book ai didi

scala - reduceByKey 不是成员(member)

转载 作者:行者123 更新时间:2023-12-01 13:44:38 27 4
gpt4 key购买 nike

嗨,我有代码只是从文档中获取字数。在生成输出之前,我还需要使用 map 来查找数据值。这是代码。

   requests
.filter(_.description.exists(_.length > 0))
.flatMap { case request =>
broadcastDataMap.value.get(request.requestId).map {
data =>
val text = Seq(
data.name,
data.taxonym,
data.pluralTaxonym,
request.description.get
).mkString(" ")
getWordCountsInDocument(text).map { case (word, count) =>
(word, Map(request.requestId -> count))
}
}
}
.reduceByKey(mergeMap)

错误信息是
reduceByKey is not a member of org.apache.spark.rdd.RDD[scala.collection.immutable.Map[String,scala.collection.immutable.Map[Int,Int]]]

我该如何解决这个问题?我确实需要调用 getWordCountsInDocument。谢谢!

最佳答案

reduceByKey 是 PairRDDFunctions 的成员,基本上它以 RDD[(K, V)] 的形式隐式添加到 RDD 中.您可能需要将结构展平为 RDD[String, Map[Int,Int]] .

如果您可以为您的输入提供类型( requestsbroadcastDataMapmergeMap ),我们或许可以为该转换提供一些帮助。

根据提供的类型,并假设 getWordCountsInDocument 的返回类型是一些 Collection[(word, count: Int)]

改变:

broadcastDataMap.value.get(request.requestId).map {


broadcastDataMap.value.get(request.requestId).flatMap {

应该解决这个问题。

关于scala - reduceByKey 不是成员(member),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36875190/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com