- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试运行配置单元查询
set yarn.nodemanager.vmem-check-enabled=false;
set hive.strict.checks.cartesian.product=false;
select count(*)
from db1.tb1 a
where a.col1='2015-07-13'
and a.col2='val'
and exists (
select 1 from db2.tb2 b
where b.col1='2015-07-13'
and b.col2='val'
and size(a.col3)=size(b.col3));
但我不断得到
Application application_1585768406438_10833 failed 2 times due to AM Container for appattempt_1585768406438_10833_000002 exited with exitCode: -104
Failing this attempt.Diagnostics: [2020-04-26 19:47:06.497]Container [pid=30016,containerID=container_e03_1585768406438_10833_02_000001] is running beyond physical memory limits. Current usage: 1.0 GB of 1 GB physical memory used; 2.8 GB of 2.1 GB virtual memory used. Killing container.
Dump of the process-tree for container_e03_1585768406438_10833_02_000001 :s
--------|- PID PPID PGRPID SESSID CMD_NAME USER_MODE_TIME(MILLIS) SYSTEM_TIME(MILLIS) VMEM_USAGE(BYTES) RSSMEM_USAGE(PAGES) FULL_CMD_LINE
|- 30101 30016 30016 30016 (java) 11364 769 3041062912 264859 /usr/lib/jvm/java-8-openjdk-amd64/bin/java -Xmx819m -Djava.io.tmpdir=/hadoop/yarn/nm-local-dir/usercache/a0t00wf/appcache/application_1585768406438_10833/container_e03_1585768406438_10833_02_000001/tmp -server -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN -XX:+PrintGCDetails -verbose:gc -XX:+PrintGCTimeStamps -XX:+UseNUMA -XX:+UseParallelGC -Dlog4j.configuratorClass=org.apache.tez.common.TezLog4jConfigurator -Dlog4j.configuration=tez-container-log4j.properties -Dyarn.app.container.log.dir=/var/log/hadoop-yarn/userlogs/application_1585768406438_10833/container_e03_1585768406438_10833_02_000001 -Dtez.root.logger=INFO,CLA -Dsun.nio.ch.bugLevel= org.apache.tez.dag.app.DAGAppMaster --session
我尝试将其作为mapreduce而不是tez运行,但我面临同样的问题。我尝试了以下设置
泰兹
set tez.am.resource.memory.mb=4096
set tez.task.resource.memory.mb=4096
set tez.am.java.opts=-Xmx6144m;
set tez.am.resource.memory.mb=4096;
set hive.tez.container.size=4096;
先生
set hive.execution.engine=mr;
set mapreduce.map.memory.mb=4096;
set mapreduce.reduce.memory.mb=4096;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.java.opts=-Xmx6144m;
还有这些 Yarn 设置
set yarn.nodemanager.vmem-check-enabled=false;
set yarn.nodemanager.resource.memory-mb=98304;
set yarn.scheduler.minimum-allocation-mb=8192;
set yarn.scheduler.maximum-allocation-mb=98304;
set yarn.nodemanager.vmem-pmem-ratio=9;
但我总是遇到同样的错误。如何增加 AM 容器的内存限制?我怀疑问题在于 java 内存的一些限制,如堆栈跟踪中所示
/usr/lib/jvm/java-8-openjdk-amd64/bin/java -Xmx819m
是这样吗?如果是这样,我应该如何增加 tez/hive 使用的 java 内存?
最佳答案
首先您需要了解堆是容器的子集。您的堆内存应约为容器内存的 80%。
set hive.execution.engine=mr;
set mapreduce.map.memory.mb=4096; -- this is container memory
set mapreduce.reduce.memory.mb=4096;
以下值是错误的。它们必须小于 4096,否则容器运行时总会出现超出内存限制的问题。
set mapreduce.map.java.opts=-Xmx6144m; -- this is heap memory
set mapreduce.reduce.java.opts=-Xmx6144m;
而是将它们设置为:
set mapreduce.map.java.opts=-Xmx3276m; -- (80% of 4096)
set mapreduce.reduce.java.opts=-Xmx3276m;
这是一篇关于理解这些术语的好文章:https://community.cloudera.com/t5/Community-Articles/Demystify-Apache-Tez-Memory-Tuning-Step-by-Step/ta-p/245279
关于java - 配置单元 : Tez how to increase AM Container memory,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61447229/
有人知道并向我解释 Tez 的这些设置之间的区别吗? hive.tez.container.size 和 tez.task.resource.memory.mb 谢谢。 最佳答案 hive.tez.c
除了与hadoop集成外,人可以执行tez的方法之一是在本地模式下。为了在本地运行 我阅读了this page并了解了必须进行的更改,并更新了tez-site.xml配置。但是我不知道如何开始。 我尝
如何有选择地将TEZ设置为PIG作业的执行引擎? 我们可以在pig.properties中设置执行引擎,但它在集群中会影响集群的所有作业。 最佳答案 如果作业是通过 Templeton 提交的,这是可
因此 - 当 Tez 选择要运行的映射器数量时,它会查看可以并行运行的容器数量(可用插槽)、波动因子、数据的机架位置、FileInputFormat 最大拆分大小、Tez 最大分组大小,可以拆分的 s
已配置具有 Kerberos 安全性的 Hadoop-2.6.0 HA 集群。在来自不同用户的 yarn-tez 框架中使用 tez-example-0.6.0.jar 提交示例作业时,出现以下异常
谁能解释一下使用 Tez 执行引擎时 Hive 中的 VERTEX_FAILURE 错误是什么?还有它的根本原因是什么? 最佳答案 这个错误是因为 Tez 容器没有分配足够的内存来运行查询。 解决方案
我有一个集群,其中包含大约 15 TB 的 yarn 资源。我正在尝试通过 Hive 提交查询。我在 yarn 上的默认容器大小是 4GB。为该查询分配的映射器数量约为 1000。我的 yarn 队列
在我们的项目中,我们将数据从 Greenplum 数据库加载到 HDFS (HIVE)。最近,我了解到 Hive2 有一个新的包,“LLAP”。我一直对 LLAP 的概念感到困惑。LLAP 的具体用途
我一直在使用 hive 1.0 和 tez 0.8 的 aws emr 4.8 集群上运行一些 hive 脚本。 我的配置是这样的: SET hive.exec.compress.output=tru
我正在尝试使用以下命令在 Windows 中为 hadoop-2.6.0 构建 Apache Tez(0.6.1 和 0.7.0 版本) mvn clean package -Dhadoop.vers
我想看看是什么让 Apache Tez 和 Hive 比 map reduce 和 hive 快得多。我无法理解 DAG 概念。 对于理解 Apache TEZ 的架构,任何人都有很好的引用。 最佳答
最近我从 Hadoop 1.0 迁移到 Hadoop 2.0。现在 Hive 在 Tez 上执行,我找不到包含查询的日志。 我可以访问聚合日志:yarn logs -applicationId app
感谢您详细发布此内容以及屏幕截图。我已按照您提到的相同步骤进行操作,但我无法正确安装。我遇到的错误是 错误:无法找到或加载主类 org.apache.tez.dag.app.DAGAppMaster
[经过一些回答和评论后,我根据此处获得的知识提出了一个新问题:Out of memory in Hive/tez with LATERAL VIEW json_tuple ] 我的一个查询始终因错误而
在使用 Tez 执行引擎针对外部 ORC 表执行查询时,我收到以下错误: Vertex failed, vertexName=Map 6, vertexId=vertex_1504790331090_
我尝试使用 tez 处理大数据(约 150GB)的过程(句子的单词标签),但问题是它花了很多时间(1 周或更多),然后 我试图指定映射器的数量。虽然我设置了 mapred.map.tasks =200
我正在尝试在试图排除特定记录的配置单元中执行偏移量查询,但总是收到以下错误: 查询: select * from sample order by id limit 1 OFFSET 1; 错误: F
下面是我尝试在 Hive 上运行的查询,执行引擎为 tez。 SELECT A.CITY, A.NAME, B.PRICE ,(ROW_NUMBER() OVER (PARTITION BY A.
我正在创建一个验证工具来检查 Apache Tez 是否在 Hadoop 的 hortonworks 发行版中工作,为此我需要检查一个简单的 map reduce 程序是否正在 Tez 上执行,我可以
我加入了多个表,总行数约为 250 亿行。最重要的是,我正在做聚合。下面是我的配置单元设置,我用它来生成最终输出。我不太确定如何调整查询并使其运行得更快。目前,我正在反复试验,看看是否能产生一些结果,
我是一名优秀的程序员,十分优秀!