apache-spark - 从谷歌云中的 spark worker 获取日志输出-6ren

apache-spark - 从谷歌云中的 spark worker 获取日志输出

转载作者：行者123 更新时间：2023-12-04 05:16:00

24

4

我在谷歌集群中运行一个 spark 作业，我试图在 RDD 映射过程中获取一些日志信息。快速示例:

object LoggerWrapper extends Serializable{
    @transient lazy val logger=Logger.getLogger("myLogger")
}
object Processing{
 ...
    rdd.map(x=>{
       LoggerWrapper.logger.info("processing:"+x)
       foo(x)
    })
   ...
  sparkContext.stop
 }

我遵循描述的方法 here结合找到的方向in the Spark webpage .生成的 log4j.properties 就是最后显示的那个。使用 --files 上传文件gcloud的旗帜命令(如下所示)。我还更新了 yarn-site.xml 文件，以便属性 yarn.log-aggregation-enable设置为 true .

我的第一个问题是，当我从主节点运行时 yarn logs -application <applicationID>我总是收到错误消息“日志聚合尚未完成或未启用。”是否还有其他需要做的事情来收集消息。

第二个问题是，是否有可能在进程运行时在控制台输出中获取所有工作人员的日志消息。例如，如果 spark 作业是流式作业，那么我想在作业运行时获取消息。

log4j.properties:

log4j.appender.myConsoleAppender=org.apache.log4j.ConsoleAppender
log4j.appender.myConsoleAppender.layout=org.apache.log4j.PatternLayout
log4j.appender.myConsoleAppender.layout.ConversionPattern=%d [%t] %-5p %c - %m%n
log4j.appender.RollingAppender=org.apache.log4j.DailyRollingFileAppender
log4j.appender.RollingAppender.File=${spark.yarn.app.container.log.dir}/spark.log
log4j.appender.RollingAppender.DatePattern='.'yyyy-MM-dd
log4j.appender.RollingAppender.layout=org.apache.log4j.PatternLayout
log4j.appender.RollingAppender.layout.ConversionPattern=[%p] %d %c %M - %m%n

log4j.appender.RollingAppenderU=org.apache.log4j.DailyRollingFileAppender
log4j.appender.RollingAppenderU.File=${spark.yarn.app.container.log.dir}/sparkU.log
log4j.appender.RollingAppenderU.DatePattern='.'yyyy-MM-dd
log4j.appender.RollingAppenderU.layout=org.apache.log4j.PatternLayout
log4j.appender.RollingAppenderU.layout.ConversionPattern=[%p] %d %c %M - %m%n


# By default, everything goes to console and file
log4j.rootLogger=INFO, RollingAppender, myConsoleAppender

# My custom logging goes to another file
log4j.logger.myLogger=INFO, RollingAppenderU, myConsoleAppender

# The noisier spark logs go to file only
log4j.logger.spark.storage=INFO, RollingAppender
log4j.additivity.spark.storage=false
log4j.logger.spark.scheduler=INFO, RollingAppender
log4j.additivity.spark.scheduler=false
log4j.logger.spark.CacheTracker=INFO, RollingAppender
log4j.additivity.spark.CacheTracker=false
log4j.logger.spark.CacheTrackerActor=INFO, RollingAppender
log4j.additivity.spark.CacheTrackerActor=false
log4j.logger.spark.MapOutputTrackerActor=INFO, RollingAppender
log4j.additivity.spark.MapOutputTrackerActor=false
log4j.logger.spark.MapOutputTracker=INFO, RollingAppender
log4j.additivty.spark.MapOutputTracker=false

gcloud 命令: gcloud dataproc jobs submit spark --cluster myCluster --properties spark.driver.memory=1000m,spark.driver.maxResult=512m,spark.executor.memory=1000m --jars gs://path/to/jar/myJar.jar --files /absolute/path/to/local/file/log4j.properties --class contextual.wikidata.spark.jobs.$1 <application-arguments>

最佳答案

正如您在 ContainerManagerImpl 中看到的那样，是否启用日志聚合的检查在节点管理器代码中:

protected LogHandler createLogHandler(Configuration conf, Context context,
    DeletionService deletionService) {
  if (conf.getBoolean(YarnConfiguration.LOG_AGGREGATION_ENABLED,
      YarnConfiguration.DEFAULT_LOG_AGGREGATION_ENABLED)) {
    return new LogAggregationService(this.dispatcher, context,
        deletionService, dirsHandler);
  } else {
    return new NonAggregatingLogHandler(this.dispatcher, deletionService,
                                        dirsHandler,
                                        context.getNMStateStore());
  }
}

另外似乎是作为初始化的一部分完成的，在第一次创建 LogHandler 实例时；这意味着配置值必须提供给所有工作节点，并且必须在节点管理器启动/重启之前的配置中。

在 Dataproc 中，您无需自己手动修改 yarn-site.xml 文件，您只需在创建集群时使用更简单的 --properties 标志，以及在守护进程服务启动之前，配置 key 将在您的所有节点中正确设置:

gcloud dataproc clusters create my-cluster \
    --properties yarn:yarn.log-aggregation-enable=true

此外，您需要确保以运行作业的同一用户身份运行您的 yarn logs 命令，否则 YARN 将尝试查看错误的 $USER 日志聚合目录中的目录:

sudo yarn logs -applicationId <applicationId>

关于apache-spark - 从谷歌云中的 spark worker 获取日志输出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38483165/

24

4

0

文章推荐： raku - Sigilless 变量、常量、绑定(bind) : when to choose what

文章推荐： Django无法使用inspectdb对旧数据库建模

文章推荐： elm - 在榆树中进行 "Http.post"调用的方法是什么

文章推荐： apache-kafka - Kafka消费者组分区问题

cloud - 云、网格和集群有什么区别？
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
Python，云 - 具有调度功能的在线网页抓取工具
我计划使用 python 开发一个 Web/云应用程序，它执行以下操作， 1.上传Perl/Python抓取脚本并执行。 2. 上传脚本以按计划运行。 3. 使用不同的输入参数运行同一脚本的多个实例。
Android 云 - 备份管理器与驱动器
我正在开发一个应用程序，我想实现一个功能，可以在相同的用户设备之间共享，比方说，收藏夹、书签等。所以，我想实现类似 iCloud 的东西。我想到了 2 个可能的想法:Backup Manager 和
Java 云 API
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
r - 创建词组而不是R中的单个词的 "word"云
我正在尝试从一系列短语中使一个单词云成为一个词云，而不是从单个单词中重复很多短语。我的数据看起来像这样，数据框的一列是短语列表。 df$names <- c("John", "John", "Jose
azure - 预配和配置 - Azure 云
对于配置AWS服务(EC2/R53/VPC/S3/..)，Terraform等技术在执行回滚、错误处理等方面的方法不可靠。 AWS CloudFormation 模板解决了这些问题。 CloudFor
Azure 云 shell 错误
我无法使用我的 Azure 帐户执行任何操作，例如创建服务器或数据库或任何操作。看起来这一切都围绕着我无法创建的资源组>我收到此错误: 这特别困难，因为我什至无法使用云外壳，因为我得到了这个:请求 C
websocket - 云/托管推送系统可以使用socket.io作为客户端吗？
是否有在客户端使用 socket.io 的云/托管推送系统？据我所知，没有一个系统使用 socket.io AFAIK: http://beaconpush.com/ http://pusher.co
RStudio 本地 + R 云
有没有办法在我的计算机上本地运行 RStudio，但使用运行 R 作为引擎的远程计算机而不是本地 R 安装？需要明确的是，我知道可以将 RStudio 服务器与 Web GUI 一起使用，但我问的是
java - 如何将视频直播发送到 azure 云？
我正在寻找在这种情况下可以使用的合适服务: 在视频模式下打开相机并将其流式传输到 azure 云。并从另一方聆听(也包括客户)。我读到了有关 Azure 媒体服务的信息。但根据this我知道客户
java - 将应用程序部署到 Google 云
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicate: Google App Engine, getting started 如何将 Java 应用程序部署到 Google
java - 控制台应用程序的替代(云)部署选项
我有一个用 Java 7 编写的相当大的控制台应用程序，它管理大量的订单处理。该应用程序使用大量订单 Web 服务、与数据库交互并将数据插入 ERP 系统。该应用程序的要求没有指定用户交互，因此在项
azure - 是什么让项目适合 Azure/云？
我已经阅读过有关 Windows Azure 的内容，但为了深入了解这项技术，我(显然)需要使用它。我有一个小型 ASP.NET 网站，流量很少，我认为在 Azure 上托管该网站会节省我的钱。除此之
android - 将数据保存到 Parse 云
我的 Activity 中有 3 个编辑文本(姓名、手机号码、职业)和一个按钮(保存)。每次用户单击按钮时，我都想将这三个数据保存到 Parse-cloud。然后新 Activity 在 imagev
json - 传感器数据未上传至 artik 云
我正在尝试通过node.js 将传感器数据发送到artik cloud。 (使用网络套接字和串行端口)。但它发送空。有人知道原因吗？我刚刚复制了教程中的代码，因此没有语法错误。 var webSock
Docker 集线器与 Docker 云
我对 docker hub 和 docker cloud 有一点困惑。我有需要安装在客户端服务器中并运行容器的 docker 镜像。我相信这可以使用 docker hub 来完成，它允许在我的私有(p
这个华夏文明发源地，不仅有矿，还有“云”
晋城，华夏文化发祥地之一。两万年前留下高都遗址、塔水河、下川等人类遗址，女娲补天、愚公移山等神话传说，如今在云上有了崭新的魅力。 9月3日，阿里云数字中国行•晋城峰会期间，晋城市人民政府公布了
airflow - 云 Composer Airflow 插件使用
我刚开始使用 Airflow 插件，有点困惑。我在 GCP (composer-1.13.4-airflow-1.10.12) 上使用 Cloud Composer 作为托管服务运行它我按照文档编
分布式环境(云)中的 PHP XDebug
据我所知，PHP 分析工具 XDebug 将其结果保存到文件中。然而，当应用程序运行在云分布式环境中时，处理此类文件是很困难的。处理这种情况的最佳做法是什么？ XDebug 中是否有任何方法(最好是可
Azure 云 Web 服务、存储选项
我们正在将 PHP 网站迁移到 Azure 云 Web 服务(Web 角色)。目前，该网站通过驱动器盘符访问将用户提交的图像文件保存到文件系统。然后通过 URL 提供这些图像，例如content.e

首页

博学

6Ren·AI

商城

apache-spark - 从谷歌云中的 spark worker 获取日志输出