java - 具有 spark 序列化问题的功能接口(interface)-6ren

java - 具有 spark 序列化问题的功能接口(interface)

转载作者：行者123 更新时间：2023-11-30 08:48:28

25

4

考虑以下 Spark 代码:

package test 

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;

import java.io.Serializable;
import java.util.Arrays;

abstract class Ops implements Serializable {

  public void doSomething(JavaRDD<Integer> rdd, Function<Integer, Integer> func) {
    rdd.map(x -> x + func.call(x))
       .collect()
       .forEach(System.out::println);
  }
}

public class AbstractTest {

  public static void main(String[] args) {
    new AbstractTest().job();
  }

  public void job() {
    SparkConf conf = new SparkConf()
      .setAppName(AbstractTest.class.getName())
      .setMaster("local[*]");
    JavaSparkContext jsc = new JavaSparkContext(conf);

    JavaRDD<Integer> rdd = jsc.parallelize(Arrays.asList(1, 2, 3, 4, 5, 6));

    Ops ops = new Ops() {};

    Function<Integer, Integer> f1 = v1 -> v1 + 1; // works

    Function<Integer, Integer> f2 = new Function<Integer, Integer>() {
      @Override
      public Integer call(Integer v1) throws Exception {
        return v1 + 1;
      }
    }; // java.io.NotSerializableException of non-serializable outer class

    ops.doSomething(rdd, f1);
  }
}

我想弄清楚的是在我的案例中函数式接口(interface)和 lambda 表达式之间的区别:

基本上，抽象类 Ops 中的函数 doSomething 需要序列化一个已经是可序列化的 spark.api.java.function.Function关闭。

在初始化Function对象时，我使用了两种不同的方式:

f1: lambda 表达式
f2:显式函数接口(interface)

而且 f1 有效，f2 无效。我发现他们有不同的类名:

f1: 类测试.AbstractTest$$Lambda$8/783882192
f2: 类测试.AbstractTest$2

f2 似乎被编译为匿名类，在 java 中强烈反对其序列化，其外部类也需要序列化。在我的例子中，外部类 AbstractTest 不可序列化。这就是我们得到 NotSerializableException 的原因。

另一方面，f1 被编译为$Lambda$8/783882192，我不明白它代表什么。但显然，它是与匿名类不同的实现。它工作正常。看起来可以避免序列化外部类。

那么，函数式接口(interface)和 lambda 表达式有什么区别呢？在这种特殊情况下，它们似乎并不等同。

最佳答案

Lambda 表达式不是必须实现为内部类，而功能接口(interface)肯定是。由于您的 Lambda 表达式不会关闭任何类变量，因此它更有可能最终成为静态成员。

这个幻灯片很好地解释了 Lambda 的设计决策，以及 Lambda 的具体实现延迟到运行时的事实取决于各种因素，其中一些是特定于 JVM 实现的 https://www.google.co.uk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&cad=rja&uact=8&ved=0CCgQFjABahUKEwin3d7DkqHHAhWCWBQKHTLFAlA&url=http%3A%2F%2Fwww.slideshare.net%2Fjaxlondon2012%2Flambda-a-peek-under-the-hood-brian-goetz&ei=1vnJVaeaGIKxUbKKi4AF&usg=AFQjCNFeoyEpSfx6qNFeCOQ9iFpSxarthg&bvm=bv.99804247,d.d24 .

您可以尝试以下操作，这会导致 f1 关闭一个类成员，然后看看您是否会得到不同的结果。在这种情况下，f1 不可能是静态成员:

public int getIncrement() {return 1;}
Function<Integer, Integer> f1 = v1 -> v1 + getIncrement();

看看这是否会给您带来不同的结果。

关于java - 具有 spark 序列化问题的功能接口(interface)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31938539/

25

4

0

文章推荐： python - 使用 cifar 100 的图像分类器，训练精度没有增加

文章推荐： java - MessageMapping 处理程序 - 没有匹配的方法

interface - 实现两个或多个其他接口(interface)的标记接口(interface)
编写一个仅用于集中其他接口(interface)的接口(interface)是好的做法还是坏的做法？ interface InterfaceA : InterfaceB, InterfaceC { }
interface - 从任意接口(interface)列表中满足哪些接口(interface)？
有没有一种方法可以确定具体类型从任意接口(interface)列表？我知道类型转换，但我想知道所有满意的接口(interface)。例如，给定: type Mover interface { Mo
interface - Go Interfaces 使用定义中的接口(interface)
我正在尝试制作斐波那契堆。 (在我正在上的算法课中多次提到它们，我想检查一下。)我希望堆使用任何类型的节点，所以我定义了一个 Node 接口(interface): package node type
interface - 如何实现带返回类型的接口(interface)方法是Golang中的一个接口(interface)
这是我的代码: type IA interface { FB() IB } type IB interface { Bar() string } type A struct {
interface - 我应该为跨平台实现使用接口(interface)还是工厂(和接口(interface))？
示例 A: // pseudo code interface IFoo { void bar(); } class FooPlatformA : IFoo { void bar() {
interface - 定义一个继承接口(interface)但不实现接口(interface)的抽象类
合并它编译的 leppies 反馈 - 但 IMO 有一些缺点，我希望编译器强制每个子类定义它们自己的 Uri 属性。现在的代码: [] type UriUserControl() = inh
json - 错误 : interface conversion interface {} is []interface {}, 不是映射 [字符串] 接口(interface) {}
我正在构建一个项目，该项目从用户那里获取一个术语，然后执行谷歌搜索并返回一个 json 格式的标题列表。我正在使用 serpwow API 来执行谷歌搜索并试图解析响应。但是我收到的错误是: pa
C# Interfaces——只在其他接口(interface)中实现一个接口(interface)
我只想在其他接口(interface)中实现某些接口(interface)，我不希望它们能够被类直接继承。提前致谢! 最佳答案您不能在 C# 中执行此操作 - 任何类都可以实现它有权访问的任何接口
interface - 将参数设置为接口(interface)或接口(interface)列表
我是 Go 的新手，还有一些我还没有掌握的技巧例如，我有一个可以这样调用的函数: myVar.InitOperation("foo",Operator.EQUAL,"bar") myVar.Init
interface - 抽象如何实现接口(interface)？
我有一个通用接口(interface)来描述对输出流的访问，如下所示: interface IOutput { function writeInteger(aValue:Int):Void;
interface - PC和定制电路之间的接口(interface)
我正在做一个项目，我想通过某种接口(interface)(最好是 USB)将光电探测器电路安装到计算机上。但是，由于我是新手，所以我不知道应该朝哪个方向处理这个问题。假设我有一个带有 USB 连接的光
interface - 在哪里定义分层体系结构中存储库的接口(interface)？
背景我正在尝试创建一个简单的应用程序，以真正理解DDD + TDD + etc的整个堆栈。我的目标是在运行时动态注入DAL存储库类。这让我域和应用程序服务层可测试。我打算用“穷人的DI”来完成现
interface - UML 中的 "interface extends interface"关系是什么样的？
在 Java 中，接口(interface)扩展接口(interface)是完全合法的。 UML 中的这种关系看起来像“扩展”关系(实线、闭合、未填充的箭头)还是“实现”关系(虚线、闭合、未填充的箭头
interface - 为什么这个类型不是接口(interface)？
我想创建一个具有相等和比较函数默认实现的接口(interface)。如果我从类型 IKeyable 中删除所有内容除了Key成员，只要我不添加默认实现，它就是一个有效的接口(interface)。从
interface - COM双接口(interface)
COM 中的双接口(interface)是能够通过 DispInterface 或 VTable 方法访问的接口(interface)。现在有人可以告诉我这两种方法之间到底有什么区别吗？我认为 V
interface - 了解接口(interface)
我有一个类方法，它返回一个可以迭代的员工列表。返回列表的最佳方式是什么？通常我只返回一个 ArrayList。然而，据我了解，界面更适合这种类型的操作。哪个是最好使用的界面？另外，为什么返回接口(in
interface - 实现内部非静态接口(interface)
我想从包装类外部实例化一个内部非静态接口(interface)。这可能吗？考虑以下代码: shared class AOuterClass() { Integer val = 3; shared
interface - 实现一个没有错误的接口(interface)
我为一个类编写了一个接口(interface)，如下所示: public interface IGenericMultipleRepository { Lazy> addresses { ge
interface - 如何在序列图中表示实现接口(interface)
我是 UML 的初学者，现在我正在创建一个序列图，问题是我想根据用户输入实现 DAO 接口(interface)。如何在时序图中正确绘制以实现接口(interface)。最佳答案您不会在 SD 上
java - 我应该在父接口(interface)中嵌套静态接口(interface)还是非静态接口(interface)
要使用 jsr 303 验证创建有条件验证的组，请将接口(interface)类传递给注释，如下所示: @NotEmpty (groups={UpdateValue.class}) 我有很多不同的接口

首页

博学

6Ren·AI

商城

java - 具有 spark 序列化问题的功能接口(interface)