java - s3开始使用Apache Spark返回内容长度错误的结尾，同时在较旧的EC2实例上可以正常工作-6ren

java - s3开始使用Apache Spark返回内容长度错误的结尾，同时在较旧的EC2实例上可以正常工作

转载作者：行者123 更新时间：2023-12-02 20:14:50

我们将S3存储桶用作数据集的数据存储，其中数据存储为 Parquet 文件。
我们正在以Hydrosphere Mist作为代理的AWS r6g实例上运行Apache Spark，以在Spark实例中启 Action 业。我们使用本地集群模式，因此每个实例都在Docker容器中运行spark worker。 4天前，当从存储桶中读取 Parquet 文件时，我们的一个EC2实例突然开始出现内容长度错误的结尾，而另一个实例读取它们就好了。但是，第二天，两个正在运行的实例都开始出现该错误。重新创建它们也无济于事，该问题并没有消失，并且发生在每次从S3存储桶读取数据的作业运行中。
错误如下:

Error: RSocket error 0x201 (APPLICATION_ERROR): org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 1.0 failed 1 times, most recent failure: Lost task 0.0 in stage 1.0 (TID 1, localhost, executor driver): org.apache.http.ConnectionClosedException: Premature end of Content-Length delimited message body (expected: 1977131; received: 849
    at org.apache.http.impl.io.ContentLengthInputStream.read(ContentLengthInputStream.java:178)
    at org.apache.http.impl.io.ContentLengthInputStream.read(ContentLengthInputStream.java:198)
    at org.apache.http.impl.io.ContentLengthInputStream.close(ContentLengthInputStream.java:101)
    at org.apache.http.conn.BasicManagedEntity.streamClosed(BasicManagedEntity.java:166)
    at org.apache.http.conn.EofSensorInputStream.checkClose(EofSensorInputStream.java:228)
    at org.apache.http.conn.EofSensorInputStream.close(EofSensorInputStream.java:172)
    at java.io.FilterInputStream.close(FilterInputStream.java:181)
    at java.io.FilterInputStream.close(FilterInputStream.java:181)
    at java.io.FilterInputStream.close(FilterInputStream.java:181)
    at java.io.FilterInputStream.close(FilterInputStream.java:181)
    at com.amazonaws.services.s3.model.S3ObjectInputStream.abort(S3ObjectInputStream.java:90)
    at org.apache.hadoop.fs.s3a.S3AInputStream.reopen(S3AInputStream.java:72)
    at org.apache.hadoop.fs.s3a.S3AInputStream.seek(S3AInputStream.java:115)
    at org.apache.hadoop.fs.FSDataInputStream.seek(FSDataInputStream.java:62)
    at org.apache.parquet.hadoop.util.H1SeekableInputStream.seek(H1SeekableInputStream.java:46)
    at org.apache.parquet.hadoop.ParquetFileReader$ConsecutiveChunkList.readAll(ParquetFileReader.java:1157)
    at org.apache.parquet.hadoop.ParquetFileReader.readNextRowGroup(ParquetFileReader.java:805)
    at org.apache.spark.sql.execution.datasources.parquet.VectorizedParquetRecordReader.checkEndOfRowGroup(VectorizedParquetRecordReader.java:301)
    at org.apache.spark.sql.execution.datasources.parquet.VectorizedParquetRecordReader.nextBatch(VectorizedParquetRecordReader.java:256)
    at org.apache.spark.sql.execution.datasources.parquet.VectorizedParquetRecordReader.nextKeyValue(VectorizedParquetRecordReader.java:159)
    at org.apache.spark.sql.execution.datasources.RecordReaderIterator.hasNext(RecordReaderIterator.scala:39)
    at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.hasNext(FileScanRDD.scala:101)
    at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.nextIterator(FileScanRDD.scala:181)
    at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.hasNext(FileScanRDD.scala:101)
    at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.scan_nextBatch_0$(Unknown Source)
    at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
    at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
    at org.apache.spark.sql.execution.WholeStageCodegenExec$$anonfun$13$$anon$1.hasNext(WholeStageCodegenExec.scala:636)
    at org.apache.spark.sql.execution.aggregate.ObjectHashAggregateExec$$anonfun$doExecute$1$$anonfun$2.apply(ObjectHashAggregateExec.scala:107)
    at org.apache.spark.sql.execution.aggregate.ObjectHashAggregateExec$$anonfun$doExecute$1$$anonfun$2.apply(ObjectHashAggregateExec.scala:105)
    at org.apache.spark.rdd.RDD$$anonfun$mapPartitionsWithIndexInternal$1$$anonfun$12.apply(RDD.scala:823)
    at org.apache.spark.rdd.RDD$$anonfun$mapPartitionsWithIndexInternal$1$$anonfun$12.apply(RDD.scala:823)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
    at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:55)
    at org.apache.spark.scheduler.Task.run(Task.scala:123)
    at org.apache.spark.executor.Executor$TaskRunner$$anonfun$10.apply(Executor.scala:408)
    at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1360)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:414)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

我们使用的版本:

spark-2.4.4

水圈雾-1.1.3

hadoop-2.7

java aws sdk-1.7.4(hadoop 2.7使用相同版本)

jvm-1.8

我们使用 s3a://读取S3存储桶，并使用 org.apache.hadoop.fs.s3a.S3AFileSystem s3a实现。
我认为可能的问题之一可能是Java AWS SDK版本，因为1.7.4是一个非常老的版本，目前已受支持，但是Spark将2.7作为其主要Hadoop版本，因此这不应该成为问题。
数据集本身很小，目前都在10mb以下。
有没有人遇到这个问题？
edit1:失败的内容长度通常是相同的，它们都是随机的。因此，它始终为849、7744、664或8192。这取决于特定的工作。从 Parquet 文件中删除压缩也将最小数字从696更改为849。

最佳答案

编辑:不固定。问题仍然存在。但是，事实证明，在本地运行 Spark 和雾不会产生此问题。
较新的Hadoop 2.7构建实际上不使用aws-java-sdk 1.7.4。更新到最新版本的Hadoop随附的最新Spark版本解决了该问题。我们现在使用Spark 3.0.1和Hadoop 2.7.4。
另一个问题是我们同时包含了org.apache.hadoop:hadoop-aws和aws-java-sdk依赖项。第二个可以安全地删除。之后，一切又恢复了正常

关于java - s3开始使用Apache Spark返回内容长度错误的结尾，同时在较旧的EC2实例上可以正常工作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64645815/

文章推荐：依赖于其他容器中的文件的 Docker 容器

文章推荐：使用 REST API 进行 firebase 电子邮件/密码身份验证

文章推荐： vbscript - Windows 7安装程序，刷新路径环境变量

文章推荐： docker - 大容量安装防止在容器中启动

nginx - 旧 SSL 证书在续订后仍在使用
几周前，我安装了一个新的 ssl 证书来替换一个过期的证书。 .crt 和 .key 的文件名保持不变。只是内容变了。现在，当我访问我的网站时，它说证书已过期，我看到它正在使用旧的证书链。我可以确认
php - 旧 PHP 版本中的类命名空间
这个问题在这里已经有了答案: Make namespaces backwards compatible in PHP (4 个回答) 8 年前关闭。我真的很想在我的工作流程中采用命名空间。据我了解，
codenameone - 旧 GUI 中的主题问题
我从 CN1 开始，然后以 Todo App 为例。当我在 Netbeans 中运行 de app 时，只出现一个空白表单，我更改了主题，添加了一个 jpg 图像并使用旧的 GUI Builder 在
Laravel 4 - 单选按钮的输入::旧
我想知道是否有一些 Laravel 人员可以帮忙。我有一个表单，其中有 2 个单选按钮，当表单提交时，它会通过验证器，如果验证器失败，它会返回表单，使用输入填充字段并显示错误消息。我似乎无法对单选
java - 旧 Java 代码中的异常
我正在使用 Java 中没有泛型的旧代码。 hashMap 是在该代码中定义的，没有泛型，例如: Map A = new HashMap(); 在这段代码中，我想如何确定要在键和值中放入什么内容，以及
java - 旧 Java 项目兼容性
我想问一个关于项目兼容性的问题。我的论文项目是在Windows Vista和XP上在JRE 1.6和JDK 1.6下开发的。该项目使用Java新套接字。今天我尝试在 Windows 8(64 位)机器
python - 旧 Plone 产品的自动化蛋化
有谁知道一个脚本可以将旧的 Products 命名空间样式 Plone 附加组件包装到 Egg 中吗？生成setup.py 创建目录结构还需要采取其他措施吗？鸡蛋化过程中有什么陷阱吗？最佳答案
mysql - 旧数据，旧 MySQL
我已经运行 MySQL 5.6.12 一段时间了。我决定将我的 WAMP 服务器更新到最新的 PHP 版本。在此过程中，它还将 MySQL 更新到 5.6.17，保留 .12 数据，但无法访问。如
mysql - 旧 MySQL 代码出现空格错误
最近，我一直在尝试根据互联网上的各种旧教程编写论坛代码，但是我最近遇到了一个问题 - 尽管我完全按照教程所述进行操作，但我收到了空格错误。我认为这可能是因为某些 MySQL 命令可能已更改。如果有人可
php - 旧 MySQL 中的错误查询
我正在创建对 Count 表的查询。 $Month = $_POST['Month']; $query = "SELECT ANY_VALUE(AD) AS ad, COU
旧 mysql 版本的 mysqldump
如果我使用 mysqldump 工具备份旧版本的 MySql 数据库，是否存在任何已知风险？例如，如果我在生产机器上使用 mysqldump 5.6 来备份 MySql 5.X 数据库。最佳答案有
javascript - 旧 JSON 值已更改
当将 columnsData 值分配给 columns 时，我有两个 JSON 对象 columnsData 和 columns，这两个值都会更改。 var columnsData = [
c++ - 旧 C++ 编译器中的防护
我有一个需要在 gcc 4.4 上编译的多线程应用程序，我不允许使用 c++0x 标志。我希望一个变量以原子方式运行，但不幸的是没有 C++0x 标志我无法使用 atomic在 C++ 中。我试过
android - 更改时间后获取上一个(旧)时间
我可以借助广播事件(ACTION_TIME_CHANGED 和 ACTION_DATE_CHANGED)获取时间更改事件。我需要在时间更改后获取之前的时间。例如，当前时间是 10:00。我要把时间改
Android - DatePickerDialog - 旧 API
我正在尝试在我的 Android 应用程序中创建一个 DatePickerDialog，但是当我创建一个 DatePickerDialog 时，我收到以下消息:Call requires API le
php - Laravel 旧()不工作
{!! Form::open(array('route' => 'posts.store', 'data-parsley-validate' => '')) !!} {{ Form::labe
ios - 旧 iOS 设备的蓝牙框架
我的问题与 iOS 周围的蓝牙技术有关。我看过关于蓝牙低功耗 101、新功能、基础知识等的 WWDC，以及关于使用 iOS 5 及更高版本中可用的 CoreBluetooth 框架的内容。我浏览了不同
ios - 旧 View 的线程仍在运行
我有一个有五个屏幕的应用。在每个屏幕上，我在 viewDidLoad 中从服务器访问数据。在每个屏幕上我都有下一个按钮。当我从屏幕一转到屏幕五(通过单击下一步 4 次)时，在 NSLog 中，我
php - 旧 Symfony 应用程序的问题
我最近在一家网络报纸找到了一份工作。在网站上，我们有一个非常古老且重要的 Symfony 应用程序，它是为一位年长的开发人员编写的，已经消失很久了。该应用程序是神圣的:是报纸收入的血液。问题是我们没有
旧 "struct hack"(?) 的符合变体
我相信我已经找到了一种方法来实现类似可移植 C89 中众所周知的“struct hack”的方法。我很好奇这是否真的严格符合 C89。主要思想是:我分配足够大的内存来容纳初始结构和数组元素。确切的大

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - s3开始使用Apache Spark返回内容长度错误的结尾，同时在较旧的EC2实例上可以正常工作