hadoop - java.lang.NullPointerException:在Spark Streaming作业中写入 Parquet 文件时，writeSupportClass不应为null-6ren

hadoop - java.lang.NullPointerException:在Spark Streaming作业中写入 Parquet 文件时，writeSupportClass不应为null

转载作者：行者123 更新时间：2023-12-02 20:55:51

28

4

在 Spark 流作业中，我将使用以下代码片段将rdd数据保存到Hadoop HDFS的 Parquet 文件中:

readyToSave.foreachRDD((VoidFunction<JavaPairRDD<Void, MyProtoRecord>>) rdd -> {          
            Configuration configuration = rdd.context().hadoopConfiguration();
            Job job = Job.getInstance(configuration);
            ParquetOutputFormat.setWriteSupportClass(job, ProtoWriteSupport.class);
            ProtoParquetOutputFormat.setProtobufClass(job, MyProtoRecord.class);
            rdd.saveAsNewAPIHadoopFile("path-to-hdfs", Void.class, MyProtoRecord.class, ParquetOutputFormat.class, configuration);
    });

我在下面得到异常:

java.lang.NullPointerException: writeSupportClass should not be null
at parquet.Preconditions.checkNotNull(Preconditions.java:38)
at parquet.hadoop.ParquetOutputFormat.getWriteSupport(ParquetOutputFormat.java:326)
at parquet.hadoop.ParquetOutputFormat.getRecordWriter(ParquetOutputFormat.java:272)
at parquet.hadoop.ParquetOutputFormat.getRecordWriter(ParquetOutputFormat.java:262)
at org.apache.spark.rdd.PairRDDFunctions$$anonfun$saveAsNewAPIHadoopDataset$1$$anonfun$12.apply(PairRDDFunctions.scala:1112)
at org.apache.spark.rdd.PairRDDFunctions$$anonfun$saveAsNewAPIHadoopDataset$1$$anonfun$12.apply(PairRDDFunctions.scala:1095)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:70)
at org.apache.spark.scheduler.Task.run(Task.scala:86)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:274)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)

我该如何解决这个问题？

最佳答案

发现问题了!
在调用“ saveAsNewAPIHadoopFile()方法时，您可以指定作业的配置( job.getConfiguration()):

readyToSave.foreachRDD((VoidFunction<JavaPairRDD<Void, MyProtoRecord>>) rdd -> {
            Configuration configuration = rdd.context().hadoopConfiguration();
            Job job = Job.getInstance(configuration);
            ParquetOutputFormat.setWriteSupportClass(job, ProtoWriteSupport.class);
            ProtoParquetOutputFormat.setProtobufClass(job, MyProtoRecord.class);
            rdd.saveAsNewAPIHadoopFile("path-to-hdfs", Void.class, MyProtoRecord.class, ParquetOutputFormat.class, job.getConfiguration());
    });

关于hadoop - java.lang.NullPointerException:在Spark Streaming作业中写入 Parquet 文件时，writeSupportClass不应为null，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44542568/

28

4

0

文章推荐： spring-boot - 使用参数运行Docker镜像

文章推荐： javascript - 如何在模态之外使用 handleClick 关闭模态？

文章推荐： JavaScript 正则表达式 : why is alternation not ordered?

nullpointerexception - XTend 空安全抛出 NullPointerException
我正在将我的模板代码移植到 XTend。在某些时候，我在测试用例中有这种类型的条件处理: @Test def xtendIfTest() { val obj = new FD if (
nullpointerexception - Kotlin NullPointerException 发生
我是新来的 kotlin , 当我开始 Null Safety 时，我对下面的情况感到困惑. There's some data inconsistency with regard to initia
nullpointerexception - 带有牛轧糖的java.lang.NullPointerException
我的应用程序一直在各种Android版本中保持良好状态。我有用户在Android 4.3、5.0、5.1和6.0上正常运行。但是，具有S7 Edge的用户刚刚更新了Android 7.0，将文本粘贴到
nullpointerexception - 无法访问除窗体之外的任何对象，NullPointerException 错误
我使用的是最新版本的 LWUIT (1.5)。我在资源编辑器中设计了我的表单，然后将代码生成到 netbeans。问题是如果我想访问除表单之外的任何对象，我会收到此错误: java.lang.Null
nullpointerexception - SonarQube Runner 在分析过程中抛出 NullPointerException
更新: 我在 Fedora 21 上运行它。 SonarQube - 5.0。 SonarQube Runner - 2.4 更新 2:Findbugs v3.1，Java 插件 v2.8 更新3:
java - jsp 中出现 NullPointerException，但控制台中没有出现 NullPointerException
RecupData 我的类仅在 web 中返回 NullPointerException。我连接到 pgsql db 8.3.7 - 该脚本在“控制台”syso 中运行良好 - 但引发了测试 Web
nullpointerexception - PShape 2.08 使用 createShape 抛出 NullPointerException
我在 mac 上使用 Processing 2.08。我正在尝试使用文档中给出的 createShape 函数创建 PShape。 PShape s; void setup(){ size(500
nullpointerexception - PShape 2.08 使用 createShape 抛出 NullPointerException
我在 mac 上使用 Processing 2.08。我正在尝试使用文档中给出的 createShape 函数创建 PShape。 PShape s; void setup(){ size(500
java - 异常 org.apache.jasper.JasperException : java. lang.NullPointerException 根本原因 java.lang.NullPointerException
每次运行此 jsp 时，都会收到以下错误异常: org.apache.jasper.JasperException: java.lang.NullPointerException root cause
nullpointerexception - java修改kotlin类内容为null
Kotlin 在编译时有一个出色的 null 检查，使用分离到“可空？”和“不可为空”的对象。它有一个 KAnnotator 来帮助确定来自 Java 的对象是否可以为空。但是，如果 not-null
nullpointerexception - 方向上的动态时间显示崩溃
我有一个布局将显示一个TextView，用于显示一个滴答时间。我遵循了此链接中的代码 How to Display current time that changes dynamically for
nullpointerexception - 在upsert上的ElasticsearchIllegalArgumentException
Elasticsearch 1.4.1版(“lucene_version”:“4.10.2”) 我有一个像这样的文件: $ curl 'http://localhost:9200/blog/artic
nullpointerexception - 从java中的selenium的另一个类调用test
这是我从另一个类调用函数的方法Selenium 设置已定义。 public void Transfer() throws Exception { System.out.println("\nTrans
创建文本文件时Java NullpointerException
我试图在主类中使用我在此类中创建的函数，但它崩溃并显示“警告:无法在根 0 处打开/创建首选项根节点 Software\JavaSoft\Prefsx80000002。 Windows RegCrea
JSP中调用方法时出现Java NullPointerException
这个问题已经有答案了: What is a NullPointerException, and how do I fix it? (12 个回答) 已关闭 3 年前。我有一个 Java 代码，它将
Java数组，NullPointerException？
我声明了两张牌: Card card1 = new Card('3', Card.Suit.clubs); Card card2 = new Card('T', Card.Suit.diamonds)
javafx任务错误: NullPointerException
我编写了一段代码来解码 Base64 图像并在 javafx 中表示该图像。在我的 url base64 代码中不断变化。这就是我在 javafx 代码中使用任务的原因。但我收到错误:java.lan
Java图实现: nullpointerexception
我正在尝试使用 arrayList 的 arrayList 在 Java 中实现图形。每当调用 addEdge 函数时，我都会收到 NullPointerException 。我似乎无法弄清楚为什么
函数中的android nullpointerexception
我是 Java/android 的新手，所以很多这些术语都是外国的，但我愿意学习。我不打算详细介绍该应用程序，因为我认为它不相关。我目前的问题是，我使用了博客中的教程和代码 fragment ，并使我
安卓摄像机 : NullPointerException
我正在开发一个 Android 应用程序来在 Android developer guide 的帮助下录制视频.我程序上的所有代码都与此页面相同。我在之外定义了权限标签。当应

首页

博学

6Ren·AI

商城

hadoop - java.lang.NullPointerException:在Spark Streaming作业中写入 Parquet 文件时，writeSupportClass不应为null