scala - 如何将 Spark 的累加器传递给函数？-6ren

scala - 如何将 Spark 的累加器传递给函数？

转载作者：行者123 更新时间：2023-12-04 17:55:13

25

4

我想做这样的事情。

val ac = sc.accumulator(0)
....
a = a.map(x => someFunction(x, the_accumulator_object))
....

the_accumulator_ojbect的位置应该是什么在上面的代码中？会写 ac有就好了吗？

另外，在函数中

def someFunction(x: TypeOfX, a: TypeOfAccumulator) : ReturnType =
{
    .....
}

TypeOfAccumulator的位置应该是什么在上面的函数中？

最佳答案

有关 Spark 蓄电池的更多信息，请访问 here

根据有关创建累加器的 scala-docs :

/** * Create an [[org.apache.spark.Accumulator]] variable of a given type, with a name for display * in the Spark UI. Tasks can "add" values to the accumulator using the += method. Only the * driver can access the accumulator's value. */

默认累加器类型为 int .您可以设置自己的类型，但需要正确实现 +=将值添加到您自己的累加器类型的方法:

val ac = sc.accumulator[MyOwnType](MyOwnTypeObject, "my own type object accumulator")

您的主要代码片段将如下所示:

val ac = sc.accumulator(0, "some accumulator")
....
a = a.map(x => someFunction(x, ac))
....
System.out.println("My accumulator value is: " + ac.value)

凡 someFunction方法植入将类似于:

def someFunction(x: TypeOfX, ac: Accumulator[Int]) : ReturnType =
{
    ...
    ac += 1
    ...
}

关于scala - 如何将 Spark 的累加器传递给函数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38745798/

25

4

0

文章推荐： jsf - jsf 中的异常处理 - 在新页面中打印错误消息

文章推荐： python - Errno 13 权限在 mac 上被拒绝

文章推荐： php - 如何使用 PHP 从 Google 表格中删除行？

文章推荐： scala - 为什么不能在 scala 中实例化特征？

c语言的计算器(累加器)
我想用 c 编写基本计算器:我有累加器的问题(带有“+”和“-”运算符) int main(void) { float num1,num2,res; char operator;
recursion - 累加器、conj 和递归
我已经解决了 4clojure.com 上的 45 个问题，并且在尝试使用递归和累加器解决一些问题的方式中，我注意到一个反复出现的问题。我会尽我所能解释我正在做的事情，以最终得到模糊的解决方案，希望
javascript - Bacon.js 累加器
my_Stream 是我想要累积并分配给变量以供进一步处理的数据。我的问题:一旦流完成，如何将变量 the_string 的内容获取到 console.log？ my_Stream.onValue(f
c++ - 使用空的 Boost 累加器
我很好奇，从这个代码片段中得到的平均值是多少？累加器旨在为空。 boost::accumulators::accumulator_set > Accumulator; int Mean = boost
c - 如何实现 timespec 累加器？
在累积 struct timespec 增量的程序中，我正在执行以下逻辑: struct timespec accu, start, stop; for (...) { // record s
scala - 使用数组作为 Scala foldLeft 累加器
我正在尝试在数组上使用 foldLeft。例如: var x = some array x.foldLeft(new Array[Int](10))((a, c) => a(c) = a(c)+1)
c++ - 重置 boost 累加器 C++
由于没有找到在 C++ 中重置累加器的“boost ”方法，我遇到了一段似乎可以重置 boost 累加器的代码。但是不明白它是如何实现的。代码如下- #include #include #incl
java - 关于收集(供应商，累加器，组合器)
这个问题在这里已经有了答案: Does a sequential stream in Java 8 use the combiner parameter on calling collect? (1
flutter - ScanStreamTransformer 上的 NULL 累加器
我正在实现一个需要递归调用才能获取所有数据的 API。我已经实现了一个具有 recursive transformer 的 Bloc 组件。但是，转换器似乎一直在递归调用中返回空累加器。 commen
f# - Seq.fold 和 bool 累加器
我永远找不到 F# 核心库的源代码。我知道它应该是开放的，但谷歌在帮助我找到它时对我并不友好，如果是这样，我会查找 Seq.fold 的实现 - 但问题就在这里。有没有人看到以下代码段有任何问题:
python - 有没有办法在 Python 中指定 reduce() 累加器？
最近我学习了很多 Haskell，并想尝试一些它在 Python 中的巧妙技巧。据我了解，Python的reduce会自动将函数中的迭代变量和累加器设置为reduce中给出的列表的前两个值。在 Has
c++ - boost 累加器 error_of 的目的是什么？
documentation boost 累加器的 error_of 特性说明它通过以下公式计算平均值的误差: 平方(方差/(计数 - 1))，其中方差的计算方式是: variance = 1/cou
apache-spark - Spark 累加器，我总是得到 0 值
我正在使用 LongAccumulator 来计算我在 Cassandra 中保存的记录数。 object Main extends App { val conf = args(0) val
java - 是否有类似 Spark 的 Kafka Streams 累加器？
Spark 有一个有用的 API，用于以线程安全的方式积累数据 https://spark.apache.org/docs/2.3.0/api/scala/index.html#org.apache.
c++ - 从列表中选择项目到其他列表的 Qt 实现(双列表、累加器、列表构建器、TwoListSelection ...)
我想从任意长度的列表中选择任意数量的项目。下拉列表 (QComboBox) 不允许选中项目。如果有很多项目，可检查项目的列表会变得笨拙。我找到了 this question在用户体验 SE 子站点和
java - 是否可以使用 Java Guava 将连接器(收集器、累加器)应用于函数？
是否可以在分组时通过集合收集字符串？这就是它在 Java 8 中的工作方式: Map discountOptions = p.getDiscountOptions().Stream() .

首页

博学

6Ren·AI

商城

scala - 如何将 Spark 的累加器传递给函数？