java - 配置单元 : Tez how to increase AM Container memory-6ren

java - 配置单元 : Tez how to increase AM Container memory

转载作者：行者123 更新时间：2023-12-01 17:08:02

37

4

我正在尝试运行配置单元查询

set yarn.nodemanager.vmem-check-enabled=false;
set hive.strict.checks.cartesian.product=false;
select count(*)
from db1.tb1 a
where a.col1='2015-07-13'
and a.col2='val'
and exists (
         select 1 from db2.tb2 b
         where b.col1='2015-07-13'
           and b.col2='val'
           and size(a.col3)=size(b.col3));

但我不断得到

Application application_1585768406438_10833 failed 2 times due to AM Container for appattempt_1585768406438_10833_000002 exited with  exitCode: -104
Failing this attempt.Diagnostics: [2020-04-26 19:47:06.497]Container [pid=30016,containerID=container_e03_1585768406438_10833_02_000001] is running beyond physical memory limits. Current usage: 1.0 GB of 1 GB physical memory used; 2.8 GB of 2.1 GB virtual memory used. Killing container.
Dump of the process-tree for container_e03_1585768406438_10833_02_000001 :s
--------|- PID PPID PGRPID SESSID CMD_NAME USER_MODE_TIME(MILLIS) SYSTEM_TIME(MILLIS) VMEM_USAGE(BYTES) RSSMEM_USAGE(PAGES) FULL_CMD_LINE
    |- 30101 30016 30016 30016 (java) 11364 769 3041062912 264859 /usr/lib/jvm/java-8-openjdk-amd64/bin/java -Xmx819m -Djava.io.tmpdir=/hadoop/yarn/nm-local-dir/usercache/a0t00wf/appcache/application_1585768406438_10833/container_e03_1585768406438_10833_02_000001/tmp -server -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN -XX:+PrintGCDetails -verbose:gc -XX:+PrintGCTimeStamps -XX:+UseNUMA -XX:+UseParallelGC -Dlog4j.configuratorClass=org.apache.tez.common.TezLog4jConfigurator -Dlog4j.configuration=tez-container-log4j.properties -Dyarn.app.container.log.dir=/var/log/hadoop-yarn/userlogs/application_1585768406438_10833/container_e03_1585768406438_10833_02_000001 -Dtez.root.logger=INFO,CLA -Dsun.nio.ch.bugLevel= org.apache.tez.dag.app.DAGAppMaster --session

我尝试将其作为mapreduce而不是tez运行，但我面临同样的问题。我尝试了以下设置

泰兹

set tez.am.resource.memory.mb=4096
set tez.task.resource.memory.mb=4096
set tez.am.java.opts=-Xmx6144m;
set tez.am.resource.memory.mb=4096;
set hive.tez.container.size=4096;

先生

set hive.execution.engine=mr;
set mapreduce.map.memory.mb=4096;
set mapreduce.reduce.memory.mb=4096;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.java.opts=-Xmx6144m;

还有这些 Yarn 设置

set yarn.nodemanager.vmem-check-enabled=false;
set yarn.nodemanager.resource.memory-mb=98304;
set yarn.scheduler.minimum-allocation-mb=8192;
set yarn.scheduler.maximum-allocation-mb=98304;
set yarn.nodemanager.vmem-pmem-ratio=9;

但我总是遇到同样的错误。如何增加 AM 容器的内存限制？我怀疑问题在于 java 内存的一些限制，如堆栈跟踪中所示

/usr/lib/jvm/java-8-openjdk-amd64/bin/java -Xmx819m

是这样吗？如果是这样，我应该如何增加 tez/hive 使用的 java 内存？

最佳答案

首先您需要了解堆是容器的子集。您的堆内存应约为容器内存的 80%。

set hive.execution.engine=mr;  
set mapreduce.map.memory.mb=4096;  -- this is container memory
set mapreduce.reduce.memory.mb=4096;

以下值是错误的。它们必须小于 4096，否则容器运行时总会出现超出内存限制的问题。

set mapreduce.map.java.opts=-Xmx6144m;  -- this is heap memory
set mapreduce.reduce.java.opts=-Xmx6144m;

而是将它们设置为:

set mapreduce.map.java.opts=-Xmx3276m;   -- (80% of 4096)
set mapreduce.reduce.java.opts=-Xmx3276m;

这是一篇关于理解这些术语的好文章:https://community.cloudera.com/t5/Community-Articles/Demystify-Apache-Tez-Memory-Tuning-Step-by-Step/ta-p/245279

关于java - 配置单元 : Tez how to increase AM Container memory，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61447229/

37

4

0

文章推荐： Java/NetBeans 无法识别主类文件之外的常量

文章推荐： java - 并发修改异常

文章推荐： java - 使用堆栈分析字符串中的 (ABC)^n

文章推荐： java - 同步两个线程未同步工作

hadoop - hive.tez.container.size 和 tez.task.resource.memory.mb 之间的区别
有人知道并向我解释 Tez 的这些设置之间的区别吗？ hive.tez.container.size 和 tez.task.resource.memory.mb 谢谢。最佳答案 hive.tez.c
hadoop - 如何在本地运行Apache Tez？
除了与hadoop集成外，人可以执行tez的方法之一是在本地模式下。为了在本地运行我阅读了this page并了解了必须进行的更改，并更新了tez-site.xml配置。但是我不知道如何开始。我尝
hadoop - TEZ 作为工作级别的执行
如何有选择地将TEZ设置为PIG作业的执行引擎？我们可以在pig.properties中设置执行引擎，但它在集群中会影响集群的所有作业。最佳答案如果作业是通过 Templeton 提交的，这是可
hadoop - 关于输入分割长度的 Tez 容器大小估计
因此 - 当 Tez 选择要运行的映射器数量时，它会查看可以并行运行的容器数量(可用插槽)、波动因子、数据的机架位置、FileInputFormat 最大拆分大小、Tez 最大分组大小，可以拆分的 s
java - 不同用户提交时 Tez 作业失败
已配置具有 Kerberos 安全性的 Hadoop-2.6.0 HA 集群。在来自不同用户的 yarn-tez 框架中使用 tez-example-0.6.0.jar 提交示例作业时，出现以下异常
hadoop - 在配置单元中执行查询时显示 Tez 顶点错误
谁能解释一下使用 Tez 执行引擎时 Hive 中的 VERTEX_FAILURE 错误是什么？还有它的根本原因是什么？最佳答案这个错误是因为 Tez 容器没有分配足够的内存来运行查询。解决方案
hadoop - 纱容器尺寸和 Tez 容器管理
我有一个集群，其中包含大约 15 TB 的 yarn 资源。我正在尝试通过 Hive 提交查询。我在 yarn 上的默认容器大小是 4GB。为该查询分配的映射器数量约为 1000。我的 yarn 队列
hadoop - 有了Hive TEZ，Hive的LLAP有什么用？
在我们的项目中，我们将数据从 Greenplum 数据库加载到 HDFS (HIVE)。最近，我了解到 Hive2 有一个新的包，“LLAP”。我一直对 LLAP 的概念感到困惑。LLAP 的具体用途
hadoop - 如何增加 Tez 的容器物理内存？
我一直在使用 hive 1.0 和 tez 0.8 的 aws emr 4.8 集群上运行一些 hive 脚本。我的配置是这样的: SET hive.exec.compress.output=tru
hadoop - Apache Tez 构建失败
我正在尝试使用以下命令在 Windows 中为 hadoop-2.6.0 构建 Apache Tez(0.6.1 和 0.7.0 版本) mvn clean package -Dhadoop.vers
hadoop - Apache Tez 架构说明
我想看看是什么让 Apache Tez 和 Hive 比 map reduce 和 hive 快得多。我无法理解 DAG 概念。对于理解 Apache TEZ 的架构，任何人都有很好的引用。最佳答
hadoop - 带有查询的位置 Hive 日志 (Tez)
最近我从 Hadoop 1.0 迁移到 Hadoop 2.0。现在 Hive 在 Tez 上执行，我找不到包含查询的日志。我可以访问聚合日志:yarn logs -applicationId app
hadoop - 无法在 Apache Tez 上运行
感谢您详细发布此内容以及屏幕截图。我已按照您提到的相同步骤进行操作，但我无法正确安装。我遇到的错误是错误:无法找到或加载主类 org.apache.tez.dag.app.DAGAppMaster
hadoop - tez/hive 中的 OOM
[经过一些回答和评论后，我根据此处获得的知识提出了一个新问题:Out of memory in Hive/tez with LATERAL VIEW json_tuple ] 我的一个查询始终因错误而
hadoop - 使用 Tez 执行引擎将文件系统添加到 Hive
在使用 Tez 执行引擎针对外部 ORC 表执行查询时，我收到以下错误: Vertex failed, vertexName=Map 6, vertexId=vertex_1504790331090_
hadoop - 为了加快配置单元进程，如何使用 tez 调整映射器和缩减器数量
我尝试使用 tez 处理大数据(约 150GB)的过程(句子的单词标签)，但问题是它花了很多时间(1 周或更多)，然后我试图指定映射器的数量。虽然我设置了 mapred.map.tasks =200
hadoop - 使用 Hive、Tez 和偏移量执行查询
我正在尝试在试图排除特定记录的配置单元中执行偏移量查询，但总是收到以下错误: 查询: select * from sample order by id limit 1 OFFSET 1; 错误: F
hadoop - Hive 查询在 Tez 上无限运行
下面是我尝试在 Hive 上运行的查询，执行引擎为 tez。 SELECT A.CITY, A.NAME, B.PRICE ,(ROW_NUMBER() OVER (PARTITION BY A.
hadoop - 使用 Tez 的 MapReduce
我正在创建一个验证工具来检查 Apache Tez 是否在 Hadoop 的 hortonworks 发行版中工作，为此我需要检查一个简单的 map reduce 程序是否正在 Tez 上执行，我可以
hadoop - Hive Tez reducer 运行速度超慢
我加入了多个表，总行数约为 250 亿行。最重要的是，我正在做聚合。下面是我的配置单元设置，我用它来生成最终输出。我不太确定如何调整查询并使其运行得更快。目前，我正在反复试验，看看是否能产生一些结果，

首页

博学

6Ren·AI

商城

java - 配置单元 : Tez how to increase AM Container memory