amazon-web-services - 将 Kubernetes 中的 Spark Driver 和 Worker stdout stderr 日志暴露给历史服务器-6ren

amazon-web-services - 将 Kubernetes 中的 Spark Driver 和 Worker stdout stderr 日志暴露给历史服务器

转载作者：行者123 更新时间：2023-12-04 17:18:51

26

4

我将 Spark 3.0.0 与 Kubernetes master 一起使用。我正在使用集群模式来运行 spark 作业。请找到如下的spark提交命令

./spark-submit \
--master=k8s://https://api.k8s.my-domain.com \
--deploy-mode cluster \
--name sparkle \
--num-executors 2 \
--executor-cores 2 \
--executor-memory 2g \
--driver-memory 2g \
--class com.myorg.sparkle.Sparkle \
--conf spark.driver.extraJavaOptions=-Dlog4j.configuration=file:/opt/spark/conf/log4j.properties \
--conf spark.executor.extraJavaOptions=-Dlog4j.configuration=file:/opt/spark/conf/log4j.properties \
--conf spark.kubernetes.submission.waitAppCompletion=false \
--conf spark.kubernetes.allocation.batch.delay=10s \
--conf spark.kubernetes.appKillPodDeletionGracePeriod=20s \
--conf spark.kubernetes.node.selector.workloadType=spark \
--conf spark.kubernetes.driver.pod.name=sparkle-driver \
--conf spark.kubernetes.container.image=custom-registry/spark:latest \
--conf spark.kubernetes.namespace=spark \
--conf spark.eventLog.dir='s3a://my-bucket/spark-logs' \
--conf spark.history.fs.logDirectory='s3a://my-bucket/spark-logs' \
--conf spark.eventLog.enabled='true' \
--conf spark.kubernetes.authenticate.driver.serviceAccountName=spark \
--conf spark.kubernetes.authenticate.executor.serviceAccountName=spark \
--conf spark.hadoop.fs.s3a.impl=org.apache.hadoop.fs.s3a.S3AFileSystem \
--conf spark.hadoop.fs.s3a.aws.credentials.provider=com.amazonaws.auth.WebIdentityTokenCredentialsProvider \
--conf spark.kubernetes.driver.annotation.iam.amazonaws.com/role=K8sRoleSpark \
--conf spark.kubernetes.executor.annotation.iam.amazonaws.com/role=K8sRoleSpark \
--conf spark.kubernetes.driver.secretKeyRef.AWS_ACCESS_KEY_ID=aws-secrets:key \
--conf spark.kubernetes.driver.secretKeyRef.AWS_SECRET_ACCESS_KEY=aws-secrets:secret \
--conf spark.kubernetes.executor.secretKeyRef.AWS_ACCESS_KEY_ID=aws-secrets:key \
--conf spark.kubernetes.executor.secretKeyRef.AWS_SECRET_ACCESS_KEY=aws-secrets:secret \
--conf spark.hadoop.fs.s3a.endpoint=s3.ap-south-1.amazonaws.com \
--conf spark.hadoop.com.amazonaws.services.s3.enableV4=true \
--conf spark.yarn.maxAppAttempts=4 \
--conf spark.yarn.am.attemptFailuresValidityInterval=1h \
s3a://dp-spark-jobs/sparkle/jars/sparkle.jar \
--commonConfigPath https://my-bucket.s3.ap-south-1.amazonaws.com/sparkle/configs/prod_main_configs.yaml \
--jobConfigPath https://my-bucket.s3.ap-south-1.amazonaws.com/sparkle/configs/cc_configs.yaml \
--filePathDate 2021-03-29 20000

我用相同的图像托管了一个不同的 pod 运行历史服务器。历史服务器能够读取所有事件日志并显示详细信息。作业执行成功。
我在历史服务器中没有看到驱动程序 Pod 和工作程序 Pod 的 stdout 和 stderr 日志。我怎样才能启用它？
类似于 this question

最佳答案

不幸的是，似乎无法将驱动程序范围的日志通过管道传输到 spark-submit 范围。来自 docs :

Logs can be accessed using the Kubernetes API and the kubectl CLI. When a Spark application is running, it’s possible to stream logs from the application using:

kubectl -n=<namespace> logs -f <driver-pod-name>

关于amazon-web-services - 将 Kubernetes 中的 Spark Driver 和 Worker stdout stderr 日志暴露给历史服务器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67418814/

26

4

0

文章推荐： ios - XCode 12.5 - 无法添加 Apple ID

文章推荐： JMeter - 更改字体颜色

stdout - 同时捕获和显示 STDOUT
我有以下代码来捕获和处理运行命令输出。如何修改它以便运行命令窗口显示输出并同时记录输出？更换 @SW_HIDE与 @SW_SHOW (或等效的)只显示一个空白的命令窗口。类似于linux的东西te
python - 对于 subprocess.stderr=STDOUT - stdout=PIPE 比 stdout ="a_file_name"更好吗？
[已编辑] 用于处理 subprocess.Popen 标准输出的 2 个选项是 stdout="a_file_name" 和 stdout=subprocess.PIPE。 stderr 可以通过
stdout - 默认情况下，stdout 行是缓冲的、无缓冲的还是不确定的？
c99 的 7.19.3/7 节指出: At program start-up, three text streams are predefined and need not be opened ex
php - 使用未定义常量 STDOUT - 假定为 'STDOUT'
我正在运行以下 proc_open 函数。加载页面时，出现错误: Use of undefined constant STDOUT - assumed 'STDOUT'` 如何正确设置STDOUT和S
process - 将多个 stdout/stderr 合并为一个 stdout
我有一个运行多个进程的开发堆栈:网络服务器、自动测试、后台编译等。所有这些都是基本的命令行命令，例如 node app.js 或 lein midje :autotest. 是否可以使用一个脚本在“后
stdout - 如何更改 SLURM 更新输出文件 (stdout) 的频率？
我正在使用 SLURM 在 super 计算机上调度作业。我已设置 --output=log.out 选项，将作业标准输出中的内容放入文件 (log.out)。我发现该文件每 30-60 分钟更新一次
stdout - Ansible寄存器结果result.stdout result.rc等dict变量未找到，如何使用直到循环
ansible/ansible-playbook 版本:2.1.2.0/2.2.0.0 我正在尝试使用 yum/apt 安装软件包，但由于安装软件包的存储库位于 packagecloud.io 中，有
linux - stdout 和/dev/stdout 的区别
bala@hp:~$ echo "Hello World" > stdout bala@hp:~$ cat stdout Hello World bala@hp:~$ echo "Hello Worl
c - 如果 stdout 是文件，则 stdout 重定向不起作用
在从 Fortran 编写的外部库中调用嘈杂的函数之前，我正在使用如下代码重定向标准输出: // copy standard output out = dup(STDOUT_FILENO); // c
bash - 如何将 STDERR 重定向到 STDOUT，但忽略原始 STDOUT？
这个问题在这里已经有了答案: How can I pipe stderr, and not stdout? (11 个答案) 关闭 6 年前。我有一个程序，我想检查其 STDERR 输出并在其上运
java - 将 Java STDOUT 流式传输到 perl STDOUT
我正在从 perl 运行一个 java 应用程序这是脚本 #!/usr/bin/perl use strict; use warnings; $| = 1; my $args = join (" "
python - 为什么我不能使用 "from sys import stdout"重定向 STDOUT？
我正在尝试将 python 脚本的 STDOUT 重定向到一个文件。如果 STDOUT 是从 sys 导入的，脚本的输出不会被重定向到一个文件: from sys import stdout std
php - 为什么我不能写到/dev/stdout，但是php ://stdout works?
我正在尝试使用 PHP 和 Apache(在 Docker 的前台运行)写入 stdout(或 stderr)。这些作品: file_put_contents( "php://stderr","wo
c++ - 在 win32 中重定向 stdout 不会重定向 stdout
我正在尝试重定向标准输出，以便 Windows 应用程序中的 printf 将转到我选择的文件。我这样做: outFile = fopen("log.txt", "w"); *stdout = *o
ruby - Ruby 中 $stdout 和 STDOUT 的区别
在 Ruby 中，$stdout(前面有一个美元符号)和 STDOUT(全部大写)有什么区别？在进行输出重定向时，应该使用哪个，为什么？ $stderr 和 STDERR 也是如此。编辑: 刚找到一
c - FILE * "/dev/stdout"和 stdout 之间的区别
让我们看看这个Hello World程序 #include int main(int argc, char ** argv) { printf("Hello, World!"); c
c - 为什么将 stdout 重定向到 memfd_create() 结果仅在事先使用 stdout 时才有效？
我在 64 位机器上运行 Ubuntu 20.04。我想将 stdout 重定向到从 memfd_create 获得的描述符。似乎使用 memfd_create 创建的匿名文件只有在 stdout
python-3.x - 将 stdout 重定向到日志文件，同时仍然打印到 stdout？
我想在 Python 脚本末尾捕获控制台输出。也就是说，我既想正常打印到控制台，又想在执行结束时将控制台输出保存到文件中。我看过各种相关的 SO 问题 1 , 2 , 3尽管他们要么简单地重定向输出
bash - 在将 stdout 和 stderr 写入日志文件时是否可以仅将 stdout 打印到屏幕？
我知道可以将两者都重定向到特定文件: ./command 1> out.log 2> err.log 或 ./command 1>test.log 2>&1 将两者写入文件。但是我不知道在只打印其中一
bash - 在将 stdout 和 stderr 写入日志文件时是否可以仅将 stdout 打印到屏幕？
我知道可以将两者都重定向到特定文件: ./command 1> out.log 2> err.log 或 ./command 1>test.log 2>&1 将两者写入文件。但是我不知道在只打印其中一

首页

博学

6Ren·AI

商城

amazon-web-services - 将 Kubernetes 中的 Spark Driver 和 Worker stdout stderr 日志暴露给历史服务器