gpt4 book ai didi

apache-spark - 如何在 Spark 2 中启用 Tungsten 优化?

转载 作者:行者123 更新时间:2023-12-04 04:08:43 25 4
gpt4 key购买 nike

我刚刚构建了带有 hive 支持的 Spark 2,并将其部署到带有 Hortonworks 2.3.4 的集群中。但是我发现这个 Spark 2.0.3 比 HDP 2.3 附带的标准 spark 1.5.3 慢

当我查看 explain似乎我的 Spark 2.0.3 没有使用钨。我是否需要创建特殊版本才能启用 Tungsten?

Spark 1.5.3 解释

== Physical Plan ==
TungstenAggregate(key=[id#2], functions=[], output=[id#2])
TungstenExchange hashpartitioning(id#2)
TungstenAggregate(key=[id#2], functions=[], output=[id#2])
HiveTableScan [id#2], (MetastoreRelation default, testing, None)

Spark 2.0.3
== Physical Plan ==
*HashAggregate(keys=[id#2481], functions=[])
+- Exchange hashpartitioning(id#2481, 72)
+- *HashAggregate(keys=[id#2481], functions=[])
+- HiveTableScan [id#2481], MetastoreRelation default, testing

最佳答案

关于apache-spark - 如何在 Spark 2 中启用 Tungsten 优化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43504744/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com