performance - Hive 查询卡在执行中间-6ren

performance - Hive 查询卡在执行中间

转载作者：可可西里更新时间：2023-11-01 16:31:57

同事们，

我在配置单元中使用 sql 脚本执行 bash 文件时遇到问题 - 它总是卡在同一个地方 map=100%，reduce=67%

我尝试使用具有不同变体和其他调整特性的映射器和缩减器数量:

SET hive.exec.parallel=true;
SET hive.default.fileformat=RCFILE;
SET hive.stats.autogather=false;
SET hive.exec.compress.output=true; 
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec; 
SET mapred.output.compression.type=BLOCK;
SET hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

但结果仍然相同 - 它持续返回 67% 的减少进度。

配置单元版本 - 0.13.0.2.X.X.X

SQL 包含来自多个源的表创建 - 多个表的简单连接。

有什么办法可以调整吗？

我们将不胜感激。

最佳答案

Reducer 的阶段是:

随机播放
排序
减少

卡在 67% 表示洗牌和排序已经完成，但您的分区都无法在 Reduce 阶段成功。 Reduce 阶段是您实际的 Reducer 代码。这表明您的代码无法完成。您应该检查您的代码并查看配置单元日志以了解您的代码无法运行的原因。

关于performance - Hive 查询卡在执行中间，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27351314/

文章推荐： hadoop - 为什么我在安装 HDinsight 后运行了多个 Java 实例？

文章推荐： hadoop - 我们可以有任何命令来检查名称节点元数据吗

文章推荐： javascript - mqtt 异步等待消息然后响应 http post 请求

文章推荐： mysql - Apache Sqoop 连接错误

Android 间 Activity 生命周期
根据 Android docs ，activity生命周期如下: onCreate() onStart() onResume() onPause() onStop() onDestroy() 问题是，
php - Mysql查询逻辑(类(class)前、后、间)
我有一门类(class)有很多专栏，但这个问题只需要其中三个: ---------------------------------------- | start_date | start_time
rest - Tomcat 间 webapp 的 http 通信
给定在同一个 Tomcat 6 上运行的两个 Web 应用程序。如果您从一个应用程序到另一个应用程序进行 http 调用，Tomcat 是否会“短路”此调用，或者它会在调用之前一直在 interweb

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

performance - Hive 查询卡在执行中间