linux - 归档不同名称的每小时文件-6ren

linux - 归档不同名称的每小时文件

转载作者：太空宇宙更新时间：2023-11-04 12:00:21

26

4

我有一个如下所示的日志文件:

2018/10/08 12:15:04 David access denied
2018/10/08 12:15:05 David access denied
2018/10/08 12:15:05 David access granted
2018/10/08 13:15:14 Karel Jan access granted
2018/10/08 13:15:19 Lydia access denied
2018/10/08 13:15:20 Lydia access denied
2018/10/08 13:15:21 Lydia access granted
2018/10/08 14:15:26 Henk access denied
2018/10/08 14:15:26 Henk access denied
2018/10/08 14:15:27 Henk access denied

脚本:

file="log.txt"
while read -r regel
do
        sort | awk '{file=$1 substr($2,1,2); gsub(/[^0-9]/,"",file) }
                {print > ("logfile_" file ".txt")}'
        zip logfile_20181008.zip logfile_20181008{00..23}.txt   
done < "$file"

到目前为止，这是我在帮助下得到的结果，也出现了以下错误:

ArchiveerLog.sh: line 6: syntax error near unexpected token `('
ArchiveerLog.sh: line 6: `  {print > (prefix bestand".txt")}'

我有每小时的日志文件，并且想每天压缩它们，这样压缩文件将被称为 logfile_20181008.zip 如上所述，有没有办法不硬核这个？

最佳答案

如果您有一个未排序的日志文件和这种类型的日志键，您就会有点不安。可排序的日期时间格式的格式为 YYYY[c]MM[c]DD[c]hh[c]mm[c]ss[.sss] 并且始终在同一时区中表示.您提供的格式不能通过简单的 ascii 排序直接排序。作为一个简单的例子。键“01/01/2018.00:00:00”<“01/10/2018.00:00:00”<“10/10/1302.00:00:00”。

使用sort工具你可以建立一个复杂的排序结构:

sort -k1.7n,1.10 -k1.4n,1.5 -k1.1n,1.2 -k1.11 <logfile>

这将正确排序您的文件。现在您可以将其通过管道传输到 awk 中按小时进行拆分:

sort -k1.7n,1.10 -k1.4n,1.5 -k1.1n,1.2 -k1.11 <logfile> \
    | awk -v prefix="logfile_" '{file=substr($1,1,13); gsub(/[^0-9]/,"",file) }
                                {print > (prefix file".txt")}'

这将对文件进行排序并将所有行移动到文件 logfile_DDMMYYYYhh.txt

更新:问题更新后!

sort log.txt \
 | awk '{file=$1 substr($2,1,2); gsub(/[^0-9]/,"",file) }
        {print > ("bestand_" file ".txt")}'

第二次更新:因此您的整个脚本现在可以写成:

#!/usr/bin/env bash

#######################################################
# THIS IS NOT TESTED BUT SHOULD BE UPDATED WHERE NEEDED
#######################################################

# This is your input
logfile="log.txt"

# create a temporary directory where to do all the work
tmpdir=$(mktemp -d)

# get the full path of logfile
logfile=$(readlink -f "$logfile")

cd "$tmpdir" || exit
sort "$logfile" | awk '{file=$1 substr($2,1,2); gsub(/[^0-9]/,"",file) }
                       {print > ("logfile_" file ".txt")}'

# Now you have a $tmpdir with lots of files
# perform the zipping
oldstring=""
newstring=""
for files in ./*; do
   #remove last 6 characters ("hh.txt")
   newstring="${files%[0-9][0-9].txt}"
   [[ "${newstring}" == "${oldstring}" ]] && continue
   zip "$(dirname $logfile)/${newstring}.zip" ${newstring}[0-9][0-9].txt
   oldstring="${newstring}"
done

# uncomment this part only if you are sure it works
# # cleanup
# cd $(dirname $logfile)
# rm -rf "$tmpdir"

关于linux - 归档不同名称的每小时文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52698730/

26

4

0

文章推荐： c++ - Qt 4.8 - 更新 QGraphicsScene 时显示 “loading” 动画

文章推荐： java - 两个数组中最大的元素

文章推荐： c++ - 如何使用 C++ 创建文件的拷贝

文章推荐： java - HashMap - 插入新的相等对象后，先前的键仍然存在

r - 如何将可扩展时间数据作为 r ggplot 包中的一个因素呈现？ (即 1 小时、5 小时、10 小时)
我有 0 小时、3 小时、12 小时、24 小时、48 小时的数据组……我想绘制这些数据的图表，以便保留时间的比例。 runs <- c(1:25) hours <- as.factor(c(0, 3
swift - 如何计算从选定时间(小时)到给定持续时间的时间(小时)
例如，如果我选择了时间:下午 3 点和小时数:5 小时，则得到 (8pm) 作为答案“ 最佳答案 let calendar = Calendar.current let date = calendar
php - 两个相同的日期时间；一个显示 12 小时，另一个显示 24 小时
我有一个包含两个日期时间字段的表单。用户输入日期 (yyyy-mm-dd) 和时间(3 个框；小时、分钟、上午/下午)。出于某种原因，第一个没有保存为 24 小时制。以下数据为输入结果: 2011
javascript - 使用导出单位进行计算(例如 1 小时 * 1 英里/小时)
我一直在尝试使用导出单位进行计算，但到目前为止我还没有取得任何成果。我已经尝试过mathjs ，但如果我输入 1 小时 * 1 英里/小时，我会得到 UnsupportedTypeError: Fu
ubuntu - 每 3 小时 cron 作业和每 3+1 小时 cron 作业
我有两组要运行的 cronjob。第一个应该每 3 小时运行一次，第二个也应该每 3 小时运行一次，但比第一组晚一个小时。什么是正确的语法？ // every 3 hours 17 */3 * *
amazon-web-services - EC2 预留实例 - 24 个实例运行 1 小时(同一小时)是否等于 1 个实例运行 24 小时？
我知道 AWS 中的预留实例更多的是计费而不是实际实例——它们没有附加到实际实例——我想知道: 如果我在特定区域和可用区中购买特定时间的预留实例 - 如果我每天 24 小时使用单个实例与运行 24 个
r - 时间顺序(小时)
我试过: seq( from=as.POSIXct("2012-1-1 0", tz="UTC"), to=as.POSIXct("2012-1-3 23", tz="UTC"),
sql - SQL按日期分组(小时)
我有一个带有“日期”列的表。我想按小时分组指定日期。最佳答案 Select TO_CHAR(date,'HH24') from table where date = TO_DATE('2011022
sql - 小时、月份等的开始
我知道如何在 SQL (SQL Server) 中获取当前日期，但要获取当天的开始时间: select dateadd(DAY, datediff(day, 0, getdate()),0) (res
游戏结束后快速倒计时 + 1 小时
我正在尝试在游戏之间创建一个计时器，以便用户在失去生命后必须等待 5 分钟才能再次玩游戏。但是我不确定最好的方法是什么。我还需要它来防止用户在“设置”中编辑他们的时间。实现这一目标的最佳方法是什么
MySQL - 小时(日期时间)
我的查询有误。该错误显示预期的已知函数，得到“HOUR”。如果我删除这部分，查询将正常工作 (AND HOUR({$nowDate}) = 11) SELECT c FROM ProConvocati
javascript - 从javascript中的字符串中获取差异(小时)
var d1 = new Date(); var d2 = new Date(); d2.setHours(d1.getHours() +01); alert(d2); 这部分没问题。现在我试图在 (
ios - 为什么时间不自动更改为最新的分钟/小时？
我正在构建一个用于练习的基本时钟应用程序，但出于某种原因，时间不会自动更改为最新的分钟或小时。例如，当前时间是 17:56，但它显示的是 17:54，这是我打开应用程序的最后时间。 NSDate *n
html - 部分下划线(小时)
我创建了一张图片，我想将其用作页面的 hr。当它被上传时，它一直向左对齐。我希望它居中，在标题下。这是我的 CSS 代码: .section-underline { height: 35px
javascript - 如何使用毫秒计算超过一秒/小时？
这个问题已经有答案了: Getting difference in seconds from two dates in JavaScript (2 个回答) 已关闭 4 年前。我想计算两个具有不同格
php - 显示特定时间之前的天/小时
我需要计算到某个日期/时间的剩余时间(天/小时)。但是，我没有使用静态日期。假设我在每个星期日的 17:00 有一个事件。我需要显示到下一个事件的剩余时间，即即将到来的星期日 17:00。我
MySQL - -838 小时？
我正在执行这个脚本: SELECT EXTRACT(HOUR FROM TIMEDIFF('2009-12-12 13:13:13', NOW())); 我得到:-838。这是提取时 MySQL 可以
javascript 小时:分钟的正则表达式
复制代码代码如下: /** * 小时:分钟的正则表达式检查<br> * <br> * @param pInput 要检查的字符串 * @return boolean 返
WiFi名称个性好听沙雕连wifi5元/小时
连wifi5元/小时独领风骚朕好帅今晚你是我的人十里桃花高端定制厕所VP专用一只老母猪在家好无聊你爹的wifi 密码是叫爸爸全拼关晓彤和鹿晗分手了吗蹭了我的
python - 如何将以天、小时、分钟和秒为单位的时间转换为仅以秒为单位
我有以下数据框列: 我需要将 csv 列中的对象字符串数据转换为总秒数。示例:10m -> 600s 我试过这段代码: df.duration = str(datetime.timedelta(df

首页

博学

6Ren·AI

商城

linux - 归档不同名称的每小时文件