apache-spark - hive on spark - 为什么 'select *' 不生成 spark 应用程序/执行程序？-6ren

apache-spark - hive on spark - 为什么 'select *' 不生成 spark 应用程序/执行程序？

转载作者：可可西里更新时间：2023-11-01 15:20:01

24

4

我在 Spark(执行引擎)上设置了 Hive (v2.3.4)。

这将启动一个 spark 应用程序/执行程序:

select count(*) from s.t where h_code = 'KGD78' and h_no = '265'

为什么这不启动 spark 应用程序/执行程序:

select * from s.t where h_code = 'KGD78' and h_no = '265'

最佳答案

这 - 第二种情况 - 是由于不太知名的 "hive.fetch.task.conversion" 参数。

根据设置方式，Hive 可以启动单个“获取任务”，而不是 Map Reduce 作业，即使使用过滤器即 where 子句也是如此。

如果您选择 * 或非分区列，它将启动提取任务而不是 MR 作业 - 单线程。单线程并不总是一件好事。 count(*) 应该不言自明，您可能需要进行大量处理，第二种情况可以看作是一个游标。

您可以在 hive-site.xml 中将参数更改为“minimal”或“none”以避免此类处理。

发现得很好。

关于apache-spark - hive on spark - 为什么 'select *' 不生成 spark 应用程序/执行程序？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55418197/

24

4

0

文章推荐： c++ - Qt 图表在 PDF 上呈现问题

文章推荐： hadoop - 构建 Impala 是否依赖于 Hive、HBase 和 Sentry？

文章推荐： hadoop - 如何减少基于 View 的查询处理时间？

文章推荐： sql - 需要帮助避免在查询中多次(内部)连接使用的 View

haskell 执行程序。文件和cmd
我是 Haskell 世界的新手，我编译了一个简单的 exe.program main = do putStrLn "Hello, what's your name?" name
java - JUnit @before 执行程序
我正在使用 JUnit，现在我想在运行测试之前执行 Java 程序(主方法)。即在我的项目中，我有一个包含一个具有 main 方法的类的包。我想在运行测试之前运行它(可能在一个单独的进程中)，因为被
无法使用 execv() 执行程序
我的代码是: char* arg_list[] = { "gnuplot", "gnuplot_script.sh", NULL }; printf("Ready %s %s\n", arg_list
启用 PHP 执行程序？
exec() 似乎在服务器上启用(function_exists('exec') 返回 true，并且命令未在 'disable_functions' 变量中列出)但我们得到警告:出于安全原因，ex
flash - Adobe AIR 执行程序
我想从 Adobe AIR 应用程序中按下一个按钮并执行一些已安装的程序。例如，我会有一个名为“Start Winamp”的按钮。当按下它时，它应该直接启动 Winamp.exe...我不想执行一
makefile - 制作、安装、执行程序
我学习 CS 有一段时间了，似乎我(或我的许多 friend )从来不了解在制作、安装等方面幕后发生的事情。纠正我，但是 make 是一种编译一组文件的方法吗？在 Windows 上“将程序安装到
c# - 从 MemoryStream 执行程序
如何执行 MemoryStream 中的程序，这样我就不必先将它保存到硬盘上。该文件可能不会临时保存到硬盘。该程序必须在内存中 100% 正常运行。 static string s
python - 如何停止使用 python 执行程序？
我使用了一个程序(在 Windows 上)，我不会透露其名称，它可以从命令行打开而无需通过任何身份验证。我正在尝试创建一些安全措施以防止其他人以这种方式访问它。我计划用批处理文件替换这个程序的内
php - 执行程序 php linux
我正在开发一个 Web 应用程序，但我陷入了困境: 我想创建一个简单的标签来触发本地程序的执行如gedit、mozilla firefox等我的项目基于 HTML、Javascript 和 PHP。
c++ - 在运行时使用 root 执行程序
我有一个 C++ 程序需要 root 权限才能执行某些功能。如果我在 su 模式下运行编译后的代码，例如 linux-c5b6:/home/suman # 它满足了我的要求，但是在运行时我想检查我的进
c - 允许使用 execvp 执行程序
我正在创建一个 shell 副本，但在执行自制程序时遇到了问题。我的意思是，当我想执行诸如 java、ls、wc 等之类的东西时，一切都很好......已经存在于路径变量。现在我希望能够执行“myl
c - 从 C 执行程序
我试图让一些值显示在电子墨水显示器上(通过 SPI)。我已经编写了软件来初始化显示并显示作为命令行参数传递的值。问题是，由于电子墨水技术，显示需要几秒钟才能完全实现，所以此时显示程序也在运行。另一个
database - 执行程序 Oracle 11g
所以我在 Oracle 11g 上创建了以下过程: create or replace PROCEDURE calc_fee (proc_borrowed_date IN Borrowing.borr
maven-2 - 如何使用 Maven 执行程序？
我想让 Maven 目标触发 java 类的执行。我正在尝试使用以下行迁移 Makefile: neotest: mvn exec:java -Dexec.mainClass="org.dha
python - 如何从 python 执行程序？操作系统失败
我想用 os.system 运行命令，但出现错误 c:/fe ' is not recognized as an internal or external command, operable prog
apache-spark - 什么是以及如何在Web UI的“执行程序”选项卡中控制内存存储？
我将Spark 1.5.2用于Spark Streaming应用程序。 Web UI的“执行者”选项卡中的存储内存是什么？如何达到530 MB？如何更改该值？最佳答案小心:您使用的非常，非常老旧且
gitlab - 在初始配置后更改 GitLab CI Multirunner 执行程序
我正在阅读 GitLab CI Multirunner documentation它介绍了如何设置 GitLab CI Multirunner 执行器，但我似乎无法在文档或在线搜索中找到有关更改初始设
c - 使用 fork 和 exec 执行程序
我是 C 编程新手。我正在尝试使用 fork()、exec() 和 waitpid() 运行由用户指定的路径给出的程序命令。我已经尝试让它正确运行几个小时了，但我不断收到错误，我不知道如何排除故障，一
javascript - 为什么我们需要将 Firefox 驱动程序强制转换为 javascript 执行程序？
我是 Java 和 Selenium 的初学者，我在工作时遇到了 JavascriptExecutor。想知道:虽然 Remote webdriver 和 Firefox driver 实现了 ja
c++ - 来自 C++ 的 Linux 执行程序
我正在尝试通过 linux c++ 中的邮件命令发送电子邮件，但 execl 导致错误。如何使用 exec 发送此命令？ /bin/echo llol | /usr/bin/mail -s "tes

首页

博学

6Ren·AI

商城

apache-spark - hive on spark - 为什么 'select *' 不生成 spark 应用程序/执行程序？