java - Apache Kafka-Log4j-Appender 不工作 Spark 集群模式

转载作者：行者123 更新时间：2023-12-02 01:42:13

25

4

我尝试将我的 Spark 应用程序驱动程序/执行程序日志发送到 kafka 主题。它正在 Eclipse 中运行。
部署集群模式时显示

ClassNotFoundException.

我添加了spark core、spark-sql、spark Stream kafka、spark Streaming、 kafka Streaming 和 kafka-log4j-appender maven 的，但仍然显示

org.apche.kafka.log4jappender ClassNotFoundException.

在服务器中，我的 Spark 程序运行的 jar 本身没有可用的 kafka 相关 jar。

请告诉大家为什么它不以集群模式从 Spark 驱动程序/执行程序向 kafka 主题发送日志。

我也尝试了下面链接提到的步骤，

spark streaming application and kafka log4j appender issue

og4j.rootLogger=INFO, console, KAFKA, file

log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.err
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n
log4j.appender.KAFKA=org.apache.kafka.log4jappender.KafkaLog4jAppender
log4j.appender.KAFKA.topic=test2
log4j.appender.KAFKA.name=localhost
log4j.appender.KAFKA.host=localhost
log4j.appender.KAFKA.port=9092
log4j.appender.KAFKA.brokerList=localhost:9092
log4j.appender.KAFKA.compressionType=none
log4j.appender.KAFKA.requiredNumAcks=0
log4j.appender.KAFKA.syncSend=true
log4j.appender.KAFKA.layout=org.apache.log4j.PatternLayout
log4j.appender.KAFKA.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p %c{1}:%L %% - %m%n
log4j.appender.file=org.apache.log4j.RollingFileAppender
log4j.appender.file.File=log4j-application.log
log4j.appender.file.MaxFileSize=5MB``
log4j.appender.file.MaxBackupIndex=10
log4j.appender.file.layout=org.apache.log4j.PatternLayout
log4j.appender.file.layout.ConversionPattern=%d{yyyy-M` `M-dd` ` HH:mm:ss} %-5p %c{1}:%L - %m%n` `

如何使用 log4j.properties 通过 kafka-log4j-appender-2.3.0 将 Spark 驱动程序/执行程序日志发送到 kafka 主题。

最佳答案

带有 Spark 的 kafka-log4j-appender

我设法在 cluster 模式下使用 spark-submit 2.1.1 和 kafka-log4j-appender 2.3.0，但我相信其他版本的行为类似。

<小时/>

为Spark提供`kafka-log4j-appender`

基本上，spark 缺少 kafka-log4j-appender。

通常，您应该能够在 fat jar 中提供 kafka-log4j-appender。我以前有过一些关于 similar problem 的经验它不起作用的地方。只是因为在集群环境中，您的类路径被 Spark 覆盖。因此，如果它也不适合您，请继续。

选项 A. 手动下载 jar:

kafka-log4j-appender-2.3.0.jar
kafka-clients-2.3.0.jar

您实际上需要两者，因为如果没有客户端，附加程序将无法工作。
将它们放在您触发 spark-submit 的同一台机器上。
这样做的好处是，您可以根据自己的喜好命名它们。

现在进入客户端模式

JARS='/absolute/path/kafka-log4j-appender-2.3.0.jar,/absolute/path/kafka-clients-2.3.0.jar'
JARS_CLP='/absolute/path/kafka-log4j-appender-2.3.0.jar:/absolute/path/kafka-clients-2.3.0.jar'
JARS_NAMES='kafka-log4j-appender-2.3.0.jar:kafka-clients-2.3.0.jar'

spark-submit \
    --deploy-mode client \
    --jars "$JARS"
    --conf "spark.driver.extraClassPath=$JARS_CLP" \
    --conf "spark.executor.extraClassPath=$JARS_NAMES" \

或者对于集群模式

spark-submit \
    --deploy-mode cluster \
    --jars "$JARS"
    --conf "spark.driver.extraClassPath=$JARS_NAMES" \
    --conf "spark.executor.extraClassPath=$JARS_NAMES" \

选项 B. 使用 `--packages` 从 maven 下载 jar:

我认为这样更方便，但是你必须准确地获得名称。

您需要在运行期间查找这些类型的行:

19/11/15 19:44:08 INFO yarn.Client: Uploading resource file:/srv/cortb/home/atais/.ivy2/jars/org.apache.kafka_kafka-log4j-appender-2.3.0.jar -> hdfs:///user/atais/.sparkStaging/application_1569430771458_10776/org.apache.kafka_kafka-log4j-appender-2.3.0.jar
19/11/15 19:44:08 INFO yarn.Client: Uploading resource file:/srv/cortb/home/atais/.ivy2/jars/org.apache.kafka_kafka-clients-2.3.0.jar -> hdfs:///user/atais/.sparkStaging/application_1569430771458_10776/org.apache.kafka_kafka-clients-2.3.0.jar

并记下 jar 在 hdfs 上的 application_1569430771458_10776 文件夹中的调用方式。

现在进入客户端模式

JARS_CLP='/srv/cortb/home/atais/.ivy2/jars/org.apache.kafka_kafka-log4j-appender-2.3.0.jar:/srv/cortb/home/atais/.ivy2/jars/org.apache.kafka_kafka-clients-2.3.0.jar'
KAFKA_JARS='org.apache.kafka_kafka-log4j-appender-2.3.0.jar:org.apache.kafka_kafka-clients-2.3.0.jar'

spark-submit \
    --deploy-mode client \
    --packages "org.apache.kafka:kafka-log4j-appender:2.3.0"
    --conf "spark.driver.extraClassPath=$JARS_CLP" \
    --conf "spark.executor.extraClassPath=$KAFKA_JARS" \

或者对于集群模式

spark-submit \
    --deploy-mode cluster \
    --packages "org.apache.kafka:kafka-log4j-appender:2.3.0"
    --conf "spark.driver.extraClassPath=$KAFKA_JARS" \
    --conf "spark.executor.extraClassPath=$KAFKA_JARS" \

<小时/>

以上应该已经可以工作了

额外步骤

如果您想提供 logging.proprietes，请按照我的教程进行操作:https://stackoverflow.com/a/55596389/1549135

关于java - Apache Kafka-Log4j-Appender 不工作 Spark 集群模式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57482253/

25

4

0

文章推荐： sql-server - SQL Server 2008 网络版

文章推荐： spring-security - 如何保障协会资源？

Android Log.v()、Log.d()、Log.i()、Log.w()、Log.e() - 什么时候使用它们？
不同的 LogCat 方法是: Log.v(); // Verbose Log.d(); // Debug Log.i(); // Info Log.w(); // Warning Log.e();
Android开发笔记之:Log图文详解(Log.v,Log.d,Log.i,Log.w,Log.e)
在android群里，经常会有人问我,android　log是怎么用的，今天我就把从网上以及sdk里东拼西凑过来，让大家先一睹为快，希望对大家入门android　log有一定的帮助． android
logging - Log.INFO 与 Log.DEBUG
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。社区 12
logging - 重命名 "log"记录器以符合格式 "LOG(?:GER)?"
我正在尝试使用 sonarlint 检查代码质量.上面的问题概要，我不明白为什么它要说要大写。但是 this discussion与上述建议相反。哪一个应该被认为是正确的？最佳答案这没有正确答案，
algorithm - 哪个增长率 log(log *n) 和 log*(log n) 更快？
随着 n 变大，log*(log n) 和 log(log* n) 这两个函数会更快吗？这里，log* 函数是迭代对数，定义如下: 我怀疑它们是相同的，只是写法不同，但它们之间有什么区别吗？最佳答
algorithm - 复杂度是 O(log(n) + log(n/2) + log(n/4) + log(n/8) + ... + log(2)) = O(log(n)) 吗？
作为家庭作业，我被要求在 O(log(n)) 中编写一个算法，我可以计算出我编写的算法的复杂度为 O(log(n) + log(n/2) + log(n/4) + log(n/8) + ... + l
tomcat - localhost.log、catalina.log、manager.log、host-manager.log 之间有什么区别？
我正在使用 Tomee。日志文件夹包含这样的文件 localhost_access_log.2016-12-02.txt localhost.2016-12-02.log catalina.2016-
android - android Log.v、Log.d、Log.i、Log.e 等的 ios 等效项是什么？
Android Log.v、Log.d、Log.i、Log.e 等的 ios 等效项是什么？同样在 android 上，我使用 Android 设备监视器和 logcat 来访问我的手机日志，我需要在
c++ - 以下代码段的复杂度 : log log n or log n?
我认为下面的代码是 O(log log n) 因为它里面有 i*i 但我对 log n 感到困惑> 和 log (log n)。 for (i=2; i*i<=number; i++) { if
logging - dmesg 和/var/log/kern.log 之间的区别
我正在修改 kvm 模块，并在内核代码中添加了 printk 语句。运行虚拟机后，printk 为我提供了错误地址和有关 guest 操作系统的其他信息。我需要从这个信息中生成统计信息。当我使用 d
logging - 企业库5 : Exceptions not being logged to Event log on Windows Azure
我有一个部署为 Windows Azure Web 角色的 WCF 服务。我正在使用 Enterprise Library 进行异常处理，并且在我的本地 Development Fabric 中，似
logging - 哪个最好 : First Log then do the Operation OR First do the Operation then Log it?
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。 Improv
go - 生产中的 log.SetFlags(log.LstdFlags | log.Lshortfile)
在 Go 的生产中使用 log.SetFlags(log.LstdFlags | log.Lshortfile) 是好的做法(至少是一般做法)吗？我想知道在生产中这样做是否存在性能或安全问题。因为它不
java - 性能:log(a/b) 与 log(a) - log(b)
我想知道什么更快: double value = Math.log(a) - Math.log(b); 或 double value = Math.log(a/b); 我计算值的方式是否会对性能产生影
logging - Golang : Does logging into file using log. Println 负责并发访问
我有数百个子例程使用 log.Println() 写入日志文件我正在使用 log.Println 写入 error.log 文件。 func main() { e, err := os.Open
logging - Nuxt SSR : Logging with response time into access.日志和error.log
我将 Nuxt 与 SSR 一起使用，并希望有类似于 apaches 的 access.log 和 error.log 的东西我特别感兴趣的是每次调用的响应时间。我在 nuxt 文档中找不到任何内
logging - Nginx 记录到 access.log.1 而不是 access.log
我知道以前有人问过这个问题，但我相信这是一个不同的问题。 Nginx 在 www-data 下运行: $ ps -eo "%U %G %a" | grep nginx root root
logging - 奇怪的 openssh-server 登录/var/log/auth.log
我在我的日志文件中发现了一个非常奇怪的条目 Jan 29 01:35:30 vs-proj-handy sshd[5316]: Received disconnect from 130.207.203
android - 检索对 Log 的调用？例如Log.w() Log.e() Log.i()
对于我正在开发的应用程序，我希望在开发过程中和发布时简化故障排除。我希望能够检索到对 Log 的调用，以了解在 USB 调试中没有连接手机的情况下运行应用程序时的调用，以便可以检索并发送给我。例如，当
logging - 戈朗 : How to capture panic and log this error to original log file?
我试图捕获 panic 并记录错误: func (s *server) SayHello(ctx context.Context, in *pb.HelloRequest) (*pb.HelloRep

首页

博学

6Ren·AI

商城

java - Apache Kafka-Log4j-Appender 不工作 Spark 集群模式

带有 Spark 的 kafka-log4j-appender

为Spark提供`kafka-log4j-appender`

选项 A. 手动下载 jar:

选项 B. 使用 `--packages` 从 maven 下载 jar:

以上应该已经可以工作了

额外步骤

首页

博学

6Ren·AI

商城

java - Apache Kafka-Log4j-Appender 不工作 Spark 集群模式

带有 Spark 的 kafka-log4j-appender

为Spark提供kafka-log4j-appender

选项 A. 手动下载 jar:

选项 B. 使用 --packages 从 maven 下载 jar:

以上应该已经可以工作了

额外步骤

为Spark提供`kafka-log4j-appender`

选项 B. 使用 `--packages` 从 maven 下载 jar: