- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我对 hive 不够熟悉,所以我在这里。我们正在使用Oozie将一堆 hive ql作业链接在一起。我的任务是优化已经在我们的生产环境中运行的应用程序。业务合作伙伴不希望它花费超过1.5个小时的时间。我注意到的第一件事是,在一个工作流程中大约有90个oozie Action 。我们还与其他应用程序共享 yarn 队列。这些 Action 的一半是hive2 Action ,并且每个Hive QL Action 仅执行一个HQL语句。有时似乎HiveQL操作之间存在延迟,因为Oozie启动器在队列中等待,然后HiveQL在队列中等待。那是正常的吗?有没有解决的办法。
对于时间敏感的Hive查询:
1)Oozie是正确的工具,应该用于将对时间敏感的HiveQL脚本链接在一起
2)有哪些替代方案(可以使用Java或Python启动并处理HQL之间的流程具有性能优势)吗?
3)HQL本身可以做些什么? (再次,我是 hive 新手,主要体验MapReduce / Spark和简单的工作流程(少于20个 Action )
4)还有我没有提到的其他性能考量吗?
谢谢,
最佳答案
the Oozie launcher waits in a queue, and then the HiveQL waits in a queue.
oozie.launcher.yarn.app.mapreduce.am.resource.mb
(总RAM)和
oozie.launcher.yarn.app.mapreduce.am.command-opts
(带有“-Xmx”参数的Java堆大小的显式配额,通常为80%RAM)-太低,而出现OutOfMemory错误,从而覆盖默认设置,太高,YARN可能会因配额滥用而杀死您的容器)
oozie.launcher.mapreduce.map.memory.mb
和
oozie.launcher.mapreduce.map.java.opts
等等。
oozie.launcher.mapreduce.job.queuename
一起用于启动器。对于实际的Hive查询,取决于:
mapreduce.job.queuename
Action set
mapreduce.job.queuename = *** ;
yarn.app.mapreduce.am.resource.mb
和yarn.app.mapreduce.am.command-opts
-或可能tez.am.resource.memory.mb
和tez.am.launch.cmd-opts
TEZ yarn.scheduler.minimum-allocation-mb
(并且它是为ResourceManager服务设置的,不能在每个工作的基础上覆盖该请求)。
Are there any other performance considerations
关于java - 在Oozie中优化多个Hive QL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35538621/
每当我从 CLI 对 JavaScript 项目运行查询时,就会出现此错误。 查询 codeql analyze U:\dev\test\Website-CodeQL-DB U:\codeql-hom
我想用 C# 编写应用程序,我希望我的兄弟 QL-710W 从我的应用程序打印标签。我从Brother的网站上下载了sample SDK代码,但是没有用。我按下打印按钮,加载光标显示,但没有任何反应。
当我读取 orcfile 并将数据写入 orcfile 时,出现以下错误: expected org.apache.hadoop.hive.ql.io.orc.OrcStruct, received
我对 hive 不够熟悉,所以我在这里。我们正在使用Oozie将一堆 hive ql作业链接在一起。我的任务是优化已经在我们的生产环境中运行的应用程序。业务合作伙伴不希望它花费超过1.5个小时的时间。
这看起来很简单,我不敢相信我自己还没有找到解决方案。我有一个名为 PersonBean 的 bean,它有一个名称。现在我想编写一个 finder 方法,它接受一个字符串并查找名字中带有该字符串的人,
如何在 Hive QL 中执行 EXCEPT 子句(如 SQL) 我有 2 个表,每个表都是一列唯一的 id。 我想查找仅在表1中但不在表2中的id列表 表1 apple orange pear 表2
我的 Hibernate 查询有问题,我的 IDEA 检查错误语法: This inspection controls whether the Persistence QL Queries are e
我在 A 和 B 之间存在多对多关系,其中 A 是拥有方。我在A类中定义了ManyToMany: @ManyToMany(....) private Set bs 但我不想公开 B 中的集合,因此 B
我在尝试构建 JPQL 查询时陷入困境,并希望比我拥有更多 JPA 经验的人能够提供帮助。考虑以下两个实体: class Author{ String name @OneToMany(mapp
在我的应用程序中,我有以下 2 个实体: @Entity @Inheritance(strategy=InheritanceType.JOINED) public class Commentable
我正在运行一个没有 mysql 错误的脚本,但数据库表中没有写入任何内容。 $team1 = 75; $con = mysqli_connect("localhost","user","pwd");
我正在编写一个示例程序,使用 org.apache.hadoop.hive.ql.Driver 类连接到 Hive Metastore。示例片段如下 String userName = "test";
我想用表 B 中出现的键对表 A 的所有行进行子集化。 表A- Idn X Y ... 12 * * 13 * * 14 * * 表B- Idn A B C ...
如果我在 where 子句中列出了多个项目,如何将列表中每个项目的结果限制为 N? 例如: select a_id,b,c, count(*), as sumrequests from table_n
我现在正在尝试用 C# 编写一个简单的程序,该程序向打印机发送命令以打印纯文本,但不知道如何操作。我现在面临两个主要问题: 1。如何与打印机通信? 在谷歌搜索但没有得到满意的结果后,我去了 Broth
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 3年前关闭。 Improve thi
我每天运行很多 Hive 查询,我必须写 SET hive.cli.print.header = TRUE;在每次开始时。是否有我可以编辑的配置文件,因此打印标题将是默认行为? 如果不可能,是否有原因
我在 EJB-QL 中有以下构造,几个 EJB 2.1 finder 方法: SELECT distinct OBJECT(rd) FROM RequestDetail rd, DetailRespo
我正在尝试从 Overpass API 获取与 tourism=museum 或 historical=memorial 匹配的 POI。我尝试了不同的查询,但找不到正确的解决方案,我得到的响应是空的
我有一台新的标签打印机(Brother QL 570),支持无限纸张。我的想法是,我可以通过打印所需的纸张来节省纸张 - 错误!打印机附带的纸张尺寸为 63 毫米 x 100 毫米和 63 毫米 x
我是一名优秀的程序员,十分优秀!