gpt4 book ai didi

linux - 想要从具有页眉页脚的文件中获取分隔数据,以便进行数据处理以进行性能分析

转载 作者:太空宇宙 更新时间:2023-11-04 04:21:40 25 4
gpt4 key购买 nike

我有一个包含页眉和页脚的文件,并且数据经过多次迭代(包含页眉和页脚),我想分隔数据并且不需要页眉页脚。我的目标是进行数据处理以进行性能分析,只是解析部分进展不顺利。

文件中的数据:

   09:31:56 12/13/11 r/w I/O per second KBytes per sec  Svt ms     IOSz KB     
VVname Cur Avg Max Cur Avg Max Cur Avg Cur Avg Qlen
admin r 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -
admin w 17 17 17 68 68 68 0.2 0.2 4.1 4.1 -
admin t 17 17 17 68 68 68 0.2 0.2 4.1 4.1 0
z0001_app0136_s.254 r 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -
z0001_app0136_s.254 w 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -
z0001_app0136_s.254 t 0 0 0 0 0 0 0.0 0.0 0.0 0.0 0
....................
....................

-----------------------------------------------------------------------------------
Footer 394 r 87 87 4354 4354 2.7 2.7 49.9 49.9 -
Footer 394 w 126 126 906 906 0.1 0.1 7.2 7.2 -
Footer 394 t 213 213 5260 5260 1.2 1.2 24.7 24.7 0
09:32:57 12/13/11 r/w I/O per second KBytes per sec Svt ms IOSz KB
VVname Cur Avg Max Cur Avg Max Cur Avg Cur Avg Qlen
admin r 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -
admin w 32 24 32 130 99 130 0.2 0.2 4.1 4.1 -
admin t 32 24 32 130 99 130 0.2 0.2 4.1 4.1 0
z0001_app0136_s.254 r 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -
z0001_app0136_s.254 w 0 0 0 0 0 0 0.0 0.0 0.0 0.0 -

文件中的数据会一遍又一遍地重复。

最佳答案

清理此类数据的常见方法是使用 grep,选择您想要的数据或排除您不需要的数据。在这种情况下,看起来所有所需的行都有一个字母(r、t 或 w),两侧各有一个空格,并且所有不需要的行都没有该字母。 (编辑:页脚行稍后添加到问题中,因此添加了 grep -v 命令来排除页脚。)

如果数据在文件 d 中,你会说:

grep ' [rtw] ' d | grep -v Footer

这将选择数据行,但不会选择页眉、页脚或空行。要使用数据创建一个名为 t 的文件,请说:

grep ' [rtw] ' d | grep -v Footer > t

如果实际数据(相对于出现问题的数据)使用制表符或空格以外的空格,则使用 '[[:space:]][rtw][[:space:]]' 作为搜索字符串,而不是 ' [rtw] '。此外,当不使用 -i 时,grep 区分大小写。如果要排除的术语以两种方式出现(有时为大写,有时为小写),请使用 -iv 而不是 -v 作为 grep 选项:

grep '[[:space:]][rtw][[:space:]]' d  | grep -iv footer > t

关于linux - 想要从具有页眉页脚的文件中获取分隔数据,以便进行数据处理以进行性能分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12523967/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com