作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
根据 Passing Functions to Spark ,它声称:accessing fields of the outer object will reference the whole object; To avoid this issue ...
我正在考虑流动代码的风险是什么:
class MyClass {
val field = "Hello"
def doStuff(rdd: RDD[String]): RDD[String] = { rdd.map(x => field + x) }
}
最佳答案
这将导致 Spark 序列化您的整个对象并将其发送给每个执行程序。如果对象的某些字段包含大量数据,则它可能会很慢。也可能导致 task not serializable
如果您的对象不可序列化,则异常
这是一个有这个问题的人的例子:Task not serializable: java.io.NotSerializableException when calling function outside closure only on classes not objects
关于scala - 将函数传递给 Spark : What is the risk of referencing the whole object?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28845172/
我是一名优秀的程序员,十分优秀!