gpt4 book ai didi

linux - 使用分隔符拆分日志文件以保持数据完整性

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:50:34 26 4
gpt4 key购买 nike

我有一个巨大的日志文件,要分成每个大约 1MB 的文件。我可以使用 split 命令,但我会将日志条目分成两半,甚至可以在一行中间拆分。

如何使用简单而优雅的命令拆分这样的文件? (复杂的脚本不是解决方案)。

对于以下情况,拆分将在标记“====”之后完成

====
Log entry 1 line 1
Log entry 1 line 2
Log entry 1 line 3
====
Log entry 2 line 1
Log entry 2 line n
====

最佳答案

csplit 命令可用于根据模式进行拆分。

例如,

csplit -f PREFIX -n 2 large_file '/====/' '{*}'

这将在“====”处拆分文件

将生成的文件命名为 PREFIX01、PREFIX02

{*} 指定拆分次数与模式在输入文件中出现的次数相同。

还有其他选项可以微调输出文件的生成方式。你可以在/====/后面放一个整数来控制是否在 token 处拆分,之前还是之后。

关于linux - 使用分隔符拆分日志文件以保持数据完整性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33060537/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com