gpt4 book ai didi

python - Hadoop(Hive)中是否有类似存储过程/作业的东西

转载 作者:可可西里 更新时间:2023-11-01 15:49:00 38 4
gpt4 key购买 nike

我在 Hive 上使用 Cloudera 5.14 Hadoop 和 PySpark。我想知道是否有可能在 Hadoop 中提供类似存储过程的东西?

我想达到什么目的?有没有什么办法可以设置一些正在运行的工作,例如每天早上,访问一些 Hive 表并在那里写一些东西 + 发送电子邮件。

那需要什么 - 请注意,我没有集群的管理员权限,但是我可以通过 subprocess python 模块 运行 shell 脚本。另外,是否有可能以某种方式从 PySpark 脚本发送电子邮件?

最佳答案

Hadoop 无法自行安排作业。您可以使用 Apache Oozie Workflow Scheduler for Hadoop 安排工作

另一种使用简单的cron 作业来执行脚本文件的方法

关于python - Hadoop(Hive)中是否有类似存储过程/作业的东西,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53003340/

38 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com