gpt4 book ai didi

awk - 修改文本文件中的日期格式

转载 作者:行者123 更新时间:2023-12-02 07:15:49 27 4
gpt4 key购买 nike

我有一些包含以下行的文本文件:

07JAN01, -0.247297942769082E+07, -0.467133797284279E+07, 0.355810777473149E+07

07JAN02,-0.247297942405032E+07,-0.467133797586388E+07,0.355810777517715E+07

07JAN03, -0.247297942584851E+07, -0.467133797727224E+07, 0.355810777627353E+07

. . . .

. . . .

我需要制作一个脚本,将日期格式修改为:

01/01/07,-0.247297942769082E+07,-0.467133797284279E+07,0.355810777473149E+07

02/01/07,-0.247297942405032E+07,-0.467133797586388E+07,0.355810777517715E+07

03/01/07,-0.247297942584851E+07,-0.467133797727224E+07,0.355810777627353E+07

. . . .

. . . .

我一直在寻找合适的 sed 或 grep 命令来仅提取每行的一些字符,以将其定义为脚本中的变量。因为我想“重组”日期,所以我在考虑定义三个变量,其中,对于第一行,它将是:

a=07

b=JAN(我认为需要在脚本中实现一个“案例”来处理这个问题?)

c=03

我查看了一些 grep 示例和大量文档,但没有什么真正清楚的显示......找到了一些关于 -cut 命令的信息,但是......我不太确定它在这里是否合适。

我的另一个问题是关于输出的,因为 sed 不修改输入数据,我如何直接修改文件?有办法吗?

任何帮助将不胜感激:)

最佳答案

我不认为 grep 是适合我自己的工作的工具。您需要一些更具表现力的东西,例如 Perl 或 awk:

echo '07JAN01, -0.24729E+07, -0.46713E+07, 0.35581E+07
07JAN02, -0.24729E+07, -0.46713E+07, 0.35581E+07
07AUG03, -0.24729E+07, -0.46713E+07, 0.35581E+07' | awk -F, '
{
yy=substr($1,1,2);
mm=substr($1,3,3);
mm=(index(":JAN:FEB:MAR:APR:MAY:JUN:JUL:AUG:SEP:OCT:NOV:DEC",mm)+2)/4;
dd=substr($1,6,2);
printf "%02d/%02d/%02d,%s,%s,%s\n",dd,mm,yy,$2,$3,$4
}'

生成:

01/01/07, -0.24729E+07, -0.46713E+07, 0.35581E+07
02/01/07, -0.24729E+07, -0.46713E+07, 0.35581E+07
03/08/07, -0.24729E+07, -0.46713E+07, 0.35581E+07

显然,这只是通过命令行 awk 脚本提取一些测试数据。您最好将其放入实际的 awk 脚本文件并通过它运行您的输入。

如果 datchg.awk 包含:

{
yy=substr($1,1,2);
mm=substr($1,3,3);
mm=(index(":JAN:FEB:MAR:APR:MAY:JUN:JUL:AUG:SEP:OCT:NOV:DEC",mm)+2)/4;
dd=substr($1,6,2);
printf "%02d/%02d/%02d,%s,%s,%s\n",dd,mm,yy,$2,$3,$4
}

然后:

echo '07JAN01, -0.24729E+07, -0.46713E+07, 0.35581E+07
07JAN02, -0.24729E+07, -0.46713E+07, 0.35581E+07
07AUG03, -0.24729E+07, -0.46713E+07, 0.35581E+07' | awk -F, -fdatechg.awk

还产生:

01/01/07, -0.24729E+07, -0.46713E+07, 0.35581E+07
02/01/07, -0.24729E+07, -0.46713E+07, 0.35581E+07
03/08/07, -0.24729E+07, -0.46713E+07, 0.35581E+07

其工作方式如下。每行被拆分成字段(-F, 将字段分隔符设置为逗号),我们提取并处理字段 1(日期)的相关部分。我的意思是年和日颠倒了,文本月份通过搜索字符串并操纵找到它的索引将文本月份变成数字月份,使其落在 1 到 12 的范围内。

这是唯一(相对)棘手的一点,它是通过一些基本的数学运算完成的:索引函数只是在您的月份字符串中找到位置(第一个字符是 1)。所以 JAN 在位置 2,FEB 在 6,MAR 在 10,...,DEC 在 46(集合 {2, 6, 10, ..., 46})。它们相差 4,所以我们最终需要除以 4 以获得连续的月份数字,但首先我们加 2,这样除法会很好。添加 2 得到集合 {4, 8, 12, ..., 48}。然后除以 4 得到 {1, 2, 3, ... 12},这是您的月份:

Text   Pos   +2   /4
---- --- -- --
JAN 2 4 1
FEB 6 8 2
MAR 10 12 3
APR 14 16 4
MAY 18 20 5
JUN 22 24 6
JUL 26 28 7
AUG 30 32 8
SEP 34 36 9
OCT 38 40 10
NOV 42 44 11
DEC 46 48 12

然后我们就输出新的信息。显然,如果您提供了错误的数据,这很可能会失败,但我假设:

  • 数据不错;或
  • 您将添加自己的错误检查。

关于直接修改文件,由来已久的 UNIX 传统是使用 shell 脚本将当前文件保存到别处,处理它创建一个新文件,然后用新文件覆盖旧文件(但不触及保存文件,以防出现严重错误)。

我不会通过详细说明来更长回答,您可能已经睡着了:-)

关于awk - 修改文本文件中的日期格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1158579/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com