gpt4 book ai didi

apache-spark - spark-shell 和 spark-sql 有什么区别?任何性能差异?

转载 作者:行者123 更新时间:2023-12-04 04:48:47 33 4
gpt4 key购买 nike

Spark-shell : 这基本上打开了scala>迅速的。查询需要按以下方式编写的地方

val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)
// Queries are expressed in HiveQL
sqlContext.sql("FROM src SELECT key, value").collect().foreach(println)
spark-sql : 这似乎直接连接到 hive 元存储,我们可以用与 hive 类似的方式编写查询。并查询 hive 中的现有数据
我想知道这两者之间的区别.. 并处理 中的任何查询 Spark SQL 中的相同 Spark 壳 ?我的意思是我们可以在 中利用 spark 的性能优势吗? Spark SQL ?
Spark 1.5.2 在这里。

最佳答案

spark-shell为您提供一个工作的 Spark 环境,其中 Scala 是(编程)语言。
spark-sql为您提供一个 Spark SQL 环境,其中 SQL 是查询语言。

请注意 spark-shell用于 Spark 中可用的任何 API,而 spark-sql仅适用于 Spark SQL API(带有数据集和数据帧)。

它们只是针对具有不同技能的用户的不同界面(spark-shell 用于 Spark/Scala 开发人员,而 spark-sql 用于 SQL 开发人员)。
spark-sql将 Spark 基础设施“隐藏”在 SQL 接口(interface)后面,这使得一个人应该具备多少工程技能,但最终会使用 Spark SQL(以及一般的 Spark)中可用的所有优化。

性能方面 spark-sqlspark-shell是一样的。

关于apache-spark - spark-shell 和 spark-sql 有什么区别?任何性能差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43714652/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com