java - 跟踪 Gzip 日志文件的 WatcherService-6ren

java - 跟踪 Gzip 日志文件的 WatcherService

转载作者：塔克拉玛干更新时间：2023-11-02 07:46:37

我有一个包含 gzip 压缩日志文件的目录，每行一个事件。为了实时读取和处理这些信息，我创建了一个与此处列出的代码相同的 WatcherService: http://docs.oracle.com/javase/tutorial/essential/io/notification.html

在 processEvents() 方法中，我添加了这段代码来逐行读取已添加或附加的文件:

if (kind == ENTRY_MODIFY) {
    try(BufferedReader reader = new BufferedReader(new InputStreamReader(new GZIPInputStream(Files.newInputStream(child, StandardOpenOption.READ))))) {
        String line;
        while ((line = reader.readLine()) != null) {
            System.out.println(line);
        }
    }
    catch(EOFException ex) {
        //file is empty,  so ignore until next signal
    }
    catch(Exception ex) {
        ex.printStackTrace();
    }
}

现在，正如您所想象的，这对于在几毫秒内创建和关闭的文件非常有效，但是，当处理随时间附加的大文件时，这将一遍又一遍地读取整个文件，每次附加行(假设文件不时被生产者刷新和同步)。

有什么方法可以在每次发送 ENTRY_MODIFY 信号时只读取此文件中的新行，或者找出文件何时“完成”？

如何处理未附加而是覆盖的文件？

最佳答案

首先我想回答您问题的技术方面:

A WatchEvent只为您提供更改(或创建或删除)文件的文件名，仅此而已。因此，如果您需要除此之外的任何逻辑，您必须自己实现(当然也可以使用现有的库)。

如果您只想读取新行，则必须记住每个文件的位置，并且每当该文件发生更改时，您都可以移动到最后一个已知位置。要获得当前位置，您可以使用 CountingInputStream来自 Commons IO 包(学分转到 [1])。要跳转到最后一个位置，可以使用函数 skip .

但是您正在使用 GZIPInputStream，这意味着跳过不会给您带来很大的性能提升，因为跳过压缩流是不可能的。相反，GZIPInputStream skip 将解压缩流，就像您阅读它时一样，因此您只会体验到很小的性能改进(试试吧!)。

我不明白的是您为什么要使用压缩日志文件？你为什么不用 DailyRollingFileAppender 写未压缩的日志呢？并在一天结束时压缩它，当应用程序不再访问它时？

另一种解决方案可能是保留 GZIPInputStream(存储它)，这样您就不必再次重新读取文件。这可能取决于您必须查看多少日志文件来决定这是否合理。

现在有一些关于您的要求的问题:

您没有提到要实时查看日志文件的原因。你为什么不集中你的日志(见 Centralised Java Logging )？例如看看 logstash和此演示文稿(参见 [2] 和 [3])或在 scribe 上或 splunk , 这是商业的(见 [4])。

集中式日志将使您有机会根据您的日志数据真正做出实时 react 。

[1] https://stackoverflow.com/a/240740/734687
[2] Using elasticsearch, logstash & kibana to create realtime dashboards - 幻灯片
[3] Using elasticsearch, logstash & kibana to create realtime dashboards - 视频
[4] Log Aggregation with Splunk - 幻灯片

更新

首先，一个用于生成压缩日志文件的 Groovy 脚本。每次我想模拟日志文件更改时，我都会从 GroovyConsole 启动这个脚本:

// Run with GroovyConsole each time you want new entries
def file = new File('D:\\Projekte\\watcher_service\\data\\log.gz')

// reading previous content since append is not possible
def content
if (file.exists()) {
    def inStream = new java.util.zip.GZIPInputStream(file.newInputStream())
    content = inStream.readLines()
}

// writing previous content and append new data
def random  = new java.util.Random()  
def lineCount = random.nextInt(30) + 1
def outStream = new java.util.zip.GZIPOutputStream(file.newOutputStream())

outStream.withWriter('UTF-8') { writer ->
    if (content) {
        content.each { writer << "$it\n" }
    }
    (1 .. lineCount).each {
        writer.write "Writing line $it/$lineCount\n"
    }
    writer.write '---Finished---\n'
    writer.flush()
    writer.close()
}

println "Wrote ${lineCount + 1} lines."

然后是日志文件阅读器:

import java.nio.file.FileSystems
import java.nio.file.Files
import java.nio.file.Path
import java.nio.file.Paths
import java.nio.file.StandardOpenOption
import java.util.zip.GZIPInputStream
import org.apache.commons.io.input.CountingInputStream
import static java.nio.file.StandardWatchEventKinds.*

class LogReader
{
    private final Path dir = Paths.get('D:\\Projekte\\watcher_service\\data\\')
    private watcher
    private positionMap = [:]
    long lineCount = 0

    static void main(def args)
    {
        new LogReader().processEvents()
    }

    LogReader()
    {
        watcher = FileSystems.getDefault().newWatchService()
        dir.register(watcher, ENTRY_CREATE, ENTRY_DELETE, ENTRY_MODIFY)
    }

    void processEvents()
    {
        def key = watcher.take()
        boolean doLeave = false

        while ((key != null) && (doLeave == false))
        {
            key.pollEvents().each { event ->
                def kind = event.kind()
                Path name = event.context()

                println "Event received $kind: $name"
                if (kind == ENTRY_MODIFY) {
                    // use position from the map, if entry is not there use default value 0
                    processChange(name, positionMap.get(name.toString(), 0))
                }
                else if (kind == ENTRY_CREATE) {
                    processChange(name, 0)
                }
                else {
                    doLeave = true
                    return
                }
            }
            key.reset()
            key = watcher.take()
        }
    }

    private void processChange(Path name, long position)
    {
        // open file and go to last position
        Path absolutePath = dir.resolve(name)
        def countingStream =
                new CountingInputStream(
                new GZIPInputStream(
                Files.newInputStream(absolutePath, StandardOpenOption.READ)))
        position = countingStream.skip(position)
        println "Moving to position $position"

        // processing each new line
        // at the first start all lines are read
        int newLineCount = 0
        countingStream.withReader('UTF-8') { reader ->
            reader.eachLine { line ->
                println "${++lineCount}: $line"
                ++newLineCount
            }
        }
        println "${++lineCount}: $newLineCount new lines +++Finished+++"

        // store new position in map
        positionMap[name.toString()] = countingStream.count
        println "Storing new position $countingStream.count"
        countingStream.close()
    }
}

在函数 processChange 中，您可以看到 1) 输入流的创建。带有 .withReader 的行创建了 InputStreamReader 和 BufferedReader。我总是使用 Grovvy，它是类固醇上的 Java，当你开始使用它时，你就停不下来了。 Java 开发人员应该能够阅读它，但如果您有任何疑问，请发表评论。

关于java - 跟踪 Gzip 日志文件的 WatcherService，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24555822/

文章推荐： java - 当我们尝试检索大数据时 Cassandra 服务器崩溃

文章推荐： ios - UITableViewCell 中的 2 个标签，无需自定义单元格

php - xdebug 跟踪/跟踪 php 回显，打印调用
有没有办法在 xdebug 跟踪输出中查看 echo 或 print 函数调用。我正在为我在我的服务器中运行的所有脚本寻找一个全局配置(或一种方法)。例子: 我希望跟踪输出显示 echo 调用。默
grails - 跟踪/BPT陷阱:5个正在运行的grails 2.1.0应用-跟踪/BPT陷阱:5
我将应用程序从2.0.0M2升级到了2.1.0，但是当我尝试运行该应用程序时，出现此错误: Note: /Volumes/Info/proyectos-grails/vincoorbis/Member
共享点日志记录/跟踪
我如何在共享点中执行日志记录。我想使用跟踪。以便它记录 12 个配置单元日志。最佳答案微软提供了一个例子: http://msdn.microsoft.com/en-us/library/aa9
Android - 跟踪
如何跟踪 eclipse 和 android 模拟器的输出。我习惯于在 Flash 和 actionscript 中这样做。在 AS3 中它将是: trace('我的跟踪语句'); 最佳答案您有几
Postgresql 跟踪
是否可以在 Postgresql 上进行查询跟踪？我在带有 OLEDB 界面的 Windows 上使用 9.0。此外，我需要它是实时的，而不是像默认情况下那样缓冲... 最佳答案我假设您的意思是在
trace - HaxeFlixel 跟踪
第一天 HaxeFlixel 编码器。愚蠢的错误，但谷歌没有帮助我。如何使用 Haxe、NME 和 Flixel 追踪到 FlashDevelop 输出。它在使用 C++ 执行时有效，但对 Flas
iPhone:跟踪/识别个人触摸
我有一个关于 iPhone 上跟踪触摸的快速问题，我似乎无法就此得出结论，因此非常感谢任何建议/想法: 我希望能够跟踪和识别 iPhone 上的触摸，即。基本上每次触摸都有一个起始位置和当前/移动位置
php - 跟踪/跟踪Yii错误信息并将其存储在数据库中
我正在做我的大学项目，我只想跟踪错误及其信息。错误信息应该与用户源设备信息一起存储在数据库中(为了检测源设备，我正在使用MobileDetect扩展名)。我只想知道应该在哪里编写代码，以便获得所有错误
azure - 如何利用应用程序洞察进行分布式跟踪/跟踪
我正在 Azure 中使用多个资源，流程如下所示: 从 sftp 获取文件使用 http 调用的数据丰富文件将消息放入队列处理消息调用一些外部电话传递数据我们如何跟踪上述过程中特定“运行”
WCF 跟踪。如何获得关闭连接的确切原因？
在我的 WCF 服务中，当尝试传输大数据时，我不断收到错误:底层连接已关闭:连接意外关闭我想知道引发此错误的具体原因，因此我设置了 WCF 跟踪并可以读取 traces.svclog 文件。问题是
Firebase + GTM 跟踪
我的目标是在 Firebase Analytics 中获取应用数据，在 Google Universal Analytics 中获取其他自定义数据和应用数据。我的问题是我是否在我的应用上安装 Fir
azure - 如何利用应用程序洞察进行分布式跟踪/跟踪
我正在 Azure 中使用多个资源，流程如下所示: 从 sftp 获取文件使用 http 调用的数据丰富文件将消息放入队列处理消息调用一些外部电话传递数据我们如何跟踪上述过程中特定“运行”
Tridion 分析/跟踪
我们正在考虑跟踪用户通过 Tridion 管理的网站的旅程的要求，然后能够根据此行为将此用户识别为“潜在客户”，然后如果他们在之后没有返回，则触发向此用户发送电子邮件X 天。 SmartTarget
debugging - 如何描述本地函数(跟踪)？
在 Common Lisp 中，函数(跟踪名称)可用于查看有关函数调用的输出。如果我的函数是用局部作用域声明的，我如何描述它以进行跟踪？例如，如何跟踪栏，如下: (defun foo (x)
javascript - 跟踪/观察文本框值已更改
有什么方法可以检测文本框的值是否已更改，是用户明确更改还是某些 java 脚本代码修改了文本框？我需要检测这种变化。最佳答案要跟踪用户更改，您可以添加按键处理程序: $(selector).key
c - 跟踪/等待非子进程
int Enable ( int pid) { int status; #if 1 { printf ( "child pid = %d \n", pid ); long ret =
c - 跟踪/监控系统
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
c - 跟踪/包装开放系统调用
我有以下测试代码: #include int main(void) { fprintf(stderr, "This is a test.\n"); int ret = open("s
Java 应用程序分析/跟踪
我有一个闭源 Java 应用程序，供应商已为其提供了用于自定义的 API。由于我没有其他文档，我完全依赖 API 的 javadoc。我想跟踪特定用例在不同类中实际调用的方法。有什么办法可以用 ec
php - 跟踪 For 循环的最后一个
我正在学习 PHP。我在我的一个 php 函数中使用了如下所示的 for 循环。 $numbers = $data["data"]; for ($i = 0;$i send($numbers[

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 跟踪 Gzip 日志文件的 WatcherService