java - 线程中出现异常 "broadcast-exchange-0"java.lang.OutOfMemoryError : Not enough memory to build and broadcast the table to all worker nodes-6ren

java - 线程中出现异常 "broadcast-exchange-0"java.lang.OutOfMemoryError : Not enough memory to build and broadcast the table to all worker nodes

转载作者：行者123 更新时间：2023-11-30 02:03:26

26

4

我正在以下配置上运行 Spark 应用程序:

1 个 Master 节点，2 个 Worker 节点。

每个工作线程有 88 个核心，因此总数为 88 个。核心数量 176
每个工作线程有 502 GB 内存，因此总可用内存为 1004 GB

我在运行应用程序时遇到以下异常:

Exception in thread "broadcast-exchange-0" java.lang.OutOfMemoryError: Not enough memory to build and broadcast the table to all worker nodes. As a workaround, you can either disable broadcast by setting spark.sql.autoBroadcastJoinThreshold to -1 or increase the spark driver memory by setting spark.driver.memory to a higher value
        at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec$$anonfun$relationFuture$1$$anonfun$apply$1.apply(BroadcastExchangeExec.scala:115)
        at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec$$anonfun$relationFuture$1$$anonfun$apply$1.apply(BroadcastExchangeExec.scala:73)
        at org.apache.spark.sql.execution.SQLExecution$.withExecutionId(SQLExecution.scala:97)
        at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec$$anonfun$relationFuture$1.apply(BroadcastExchangeExec.scala:72)
        at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec$$anonfun$relationFuture$1.apply(BroadcastExchangeExec.scala:72)
        at scala.concurrent.impl.Future$PromiseCompletingRunnable.liftedTree1$1(Future.scala:24)
        at scala.concurrent.impl.Future$PromiseCompletingRunnable.run(Future.scala:24)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
        at java.lang.Thread.run(Thread.java:745)

此错误本身提到了两个解决方案:

作为解决方法，您可以通过设置禁用广播Spark.sql.autoBroadcastJoinThreshold 为 -1。
或
通过将spark.driver.memory设置为a来增加spark驱动程序内存更高的值(value)。

我正在尝试设置更多驱动程序内存来运行，但是我想了解此问题的根本原因。谁能解释一下。

我在代码中使用了Java。

编辑 1

我在代码中使用广播变量。

编辑2

添加包含广播变量的代码。

//1.
        Dataset<Row> currencySet1 = sparkSession.read().format("jdbc").option("url",connection ).option("dbtable", CI_CURRENCY_CD).load();
        currencySetCache = currencySet1.select(CURRENCY_CD, DECIMAL_POSITIONS).persist(StorageLevel.MEMORY_ONLY());
        Dataset<Row> currencyCodes = currencySetCache.select(CURRENCY_CD);
        currencySet = currencyCodes.as(Encoders.STRING()).collectAsList();

        //2.
        Dataset<Row>  divisionSet = sparkSession.read().format("jdbc").option("url",connection ).option("dbtable", CI_CIS_DIVISION).load();
        divisionSetCache = divisionSet.select(CIS_DIVISION).persist(StorageLevel.MEMORY_ONLY());
        divisionList = divisionSetCache.as(Encoders.STRING()).collectAsList();

        //3.
        Dataset<Row> userIdSet =  sparkSession.read().format("jdbc").option("url",connection ).option("dbtable", SC_USER).load();
        userIdSetCache = userIdSet.select(USER_ID).persist(StorageLevel.MEMORY_ONLY());
        userIdList = userIdSetCache.as(Encoders.STRING()).collectAsList();

ClassTag<List<String>> evidenceForDivision = scala.reflect.ClassTag$.MODULE$.apply(List.class);
        Broadcast<List<String>> broadcastVarForDiv = context.broadcast(divisionList, evidenceForDivision);

        ClassTag<List<String>> evidenceForCurrency = scala.reflect.ClassTag$.MODULE$.apply(List.class);
        Broadcast<List<String>> broadcastVarForCurrency = context.broadcast(currencySet, evidenceForCurrency);

        ClassTag<List<String>> evidenceForUserID = scala.reflect.ClassTag$.MODULE$.apply(List.class);
        Broadcast<List<String>> broadcastVarForUserID = context.broadcast(userIdList, evidenceForUserID);


        //Validation -- Start
        Encoder<RuleParamsBean> encoder = Encoders.bean(RuleParamsBean.class);
        Dataset<RuleParamsBean> ds = new Dataset<RuleParamsBean>(sparkSession, finalJoined.logicalPlan(), encoder);


        Dataset<RuleParamsBean> validateDataset = ds.map(ruleParamsBean -> validateTransaction(ruleParamsBean,broadcastVarForDiv.value(),broadcastVarForCurrency.value(),
                broadcastVarForUserID.value()),encoder);
        validateDataset.persist(StorageLevel.MEMORY_ONLY());

最佳答案

可能的根本原因:“spark.driver.memory”的默认值仅为 1 Gb(取决于分配)，这是一个非常小的数字。如果您在驱动程序上读取大量数据，则很容易发生 OutOfMemory，异常的建议是正确的。

解决方案:将“spark.driver.memory”和“spark.executor.memory”至少增加到 16Gb。

关于java - 线程中出现异常 "broadcast-exchange-0"java.lang.OutOfMemoryError : Not enough memory to build and broadcast the table to all worker nodes，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52038624/

26

4

0

文章推荐： java - HackerEarth 练习时间不多了

文章推荐： java - 将 Spring boot 1.5 迁移到 2.x 无法启动应用程序

文章推荐： java - 使用流根据另一个列表更新一个列表

文章推荐： java - 我是否必须阻止循环操作处理程序调用

Grails 启动错误 : groovy. lang.Closure.rehydrate(Ljava/lang/Object;Ljava/lang/Object;Ljava/lang/Object;)Lgroovy/lang/Closure;
在 Tomcat 6/Ubuntu 12.04 上启动 Grails 2.1.0 应用程序时出现以下错误。 Error 500 - Internal Server Error. groovy.lang
java.lang.RuntimeException : java. lang.ClassCastException : java. lang.Long 无法转换为 java.lang.String
在运行 Storm 拓扑时，我收到此错误。拓扑完美运行 5 分钟，没有任何错误，然后失败。我正在使用 Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS as 300 sec i
java.lang.NoSuchMethodException : java. lang.String.substring(java.lang.Long，java.lang.Long)
我有一个 jsp 代码在其中一台机器上运行良好。但是当我复制到另一台机器时，我得到了这个 no such method found 异常。我是 Spring 的新手。有人可以解释我错过了什么吗？以下
java - java.util.Map 中的 put(java.lang.String,java.lang.Inte ger) 不能应用于 (java.lang.String,java.lang.String )
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
java.lang.NoSuchMethodError - Ljava/lang/String;)Ljava/lang/String;
我的代码在下面给出了一个错误； Exception in thread "main" java.lang.NoSuchMethodError: com/myApp/Client.cypherCBC(L
java - Restful Web 服务 - java.lang.NoSuchMethodError concat(Ljava/lang/Iterable;Ljava/lang/Iterable;)Ljava/lang/Iterable
我正在尝试一个 Restful web 服务示例，所以当我要访问 url 时，我遇到了异常 java.lang.NoSuchMethodError: jersey.repackaged.com.goo
java.lang.NoSuchMethodError : org. jboss.logging.Logger.getMessageLogger(Ljava/lang/Class;Ljava/lang/String;)Ljava/lang/Object;
我正在将一个 Spring web 项目转换为一个 Maven 项目，但我收到了这个错误: java.lang.NoSuchMethodError: org.jboss.logging.Logger.
java.lang.ClassCastException : java. lang.Short 无法转换为 java.lang.Integer
在我的项目中，我有一个像这样的枚举: public enum MyEnum { FIRST(1), SECOND(2); private int value; private MyEnum(int v
java.lang.ClassCastException : java. lang.String 无法转换为 java.lang.Long
我创建了这个简单的示例，用于读取 Linux 正常运行时间: public String getMachineUptime() throws IOException { String[] di
java.lang.ClassCastException : [Ljava. lang.Object;无法转换为 [Ljava.lang.Comparable;
我正在使用 Eclipse，并且正在使用 Java。我的目标是使用 bogoSort 方法对 vector 进行排序在一个 vector (vectorExample)中适应我的 vector 类型，
java.lang.ClassCastException : java. lang.String 无法转换为 [Ljava.lang.Object
我正在运行以下查询。它显示一条错误消息。如何解决这个错误？ ListrouteList=null; List companyList = session.createS
java.lang.ClassCastException : [Ljava. lang.Long;无法转换为 java.lang.Long
我有以下模型类: @Entity @Table(name="user_content") @org.hibernate.annotations.NamedQueries({ @org.
java.lang.ClassCastException : [Ljava. lang.String;无法转换为 java.lang.String
我有那个错误。这是我的代码: GmailSettingsService service = new GmailSettingsService(APPLICATION_NAME, DOMAIN_NAME
java.lang.ClassCastException : java. lang.StackOverflowError 无法转换为 java.lang.Exception
实际上我在执行我的java程序时遇到了下面提到的错误 Exception in thread "pool-1-thread-1" java.lang.ClassCastException: jav
java.lang.ClassCastException : java. lang.Float 无法转换为 java.lang.String
java.lang.ClassCastException: java.lang.Float cannot be cast to java.lang.String 我在以下代码中遇到此异常: Strin
java.lang.ClassCastException : [Ljava. lang.Object;不兼容 [Ljava.lang.String;
我正在尝试从 linkedhashset 中检索随机元素。下面是我的代码，但它每次都给我异常。 private static void generateRandomUserId(Set userIds
java.lang.ClassCastException : java. lang.Double 无法转换为 java.lang.String
我已经完成了 Android 中的代码: List spinnerArray = new ArrayList(); for (int i = 0; i item = (LinkedTreeMap)
java.lang.ClasscastException : java. lang.Long 无法转换为 java.lang.Double
这个问题已经有答案了: Explanation of ClassCastException in Java (12 个回答) 已关闭 6 年前。我已经编写了 java 到 Json 的代码，同时从页
java.lang.ClassCastException : java. lang.Long 无法转换为 clojure.lang.IFn
这个问题在这里已经有了答案: ClassCastException java.lang.Long cannot be cast to clojure.lang.IFn (4 个答案) 关闭 6 年前
java.lang.ClassCastException : java. lang.Integer 无法转换为 java.lang.Double
我在运行时遇到问题来编译这段代码，这给我一个错误，java.lang.Integer 无法转换为 Java.lang.Double。如果有人帮助我更正此代码，我将非常高兴 double x; pu

首页

博学

6Ren·AI

商城

java - 线程中出现异常 "broadcast-exchange-0"java.lang.OutOfMemoryError : Not enough memory to build and broadcast the table to all worker nodes