gpt4 book ai didi

linux - 使用 awk 将列转换为矩阵格式

转载 作者:IT王子 更新时间:2023-10-29 00:17:23 27 4
gpt4 key购买 nike

我有一个列格式的网格化数据文件:

ifile.txt
x y value
20.5 20.5 -4.1
21.5 20.5 -6.2
22.5 20.5 0.0
20.5 21.5 1.2
21.5 21.5 4.3
22.5 21.5 6.0
20.5 22.5 7.0
21.5 22.5 10.4
22.5 22.5 16.7

我想将其转换为矩阵格式:

ofile.txt
20.5 21.5 22.5
20.5 -4.1 1.2 7.0
21.5 -6.2 4.3 10.4
22.5 0.0 6.0 16.7

其中top 20.5 21.5 22.5表示y,边值表示x,里面的值表示对应的网格值。

我在这里发现了一个类似的问题Convert a 3 column file to matrix format但脚本不适用于我的情况。

脚本是

awk '{ h[$1,$2] = h[$2,$1] = $3 }
END {
for(i=1; i<=$1; i++) {
for(j=1; j<=$2; j++)
printf h[i,j] OFS
printf "\n"
}
}' ifile

最佳答案

以下 awk 脚本句柄:

  • 任意大小的矩阵
  • 行索引和列索引之间没有关系,因此它会分别跟踪它们。
  • 如果某个行列索引没有出现,该值将默认为零。

这是通过这种方式完成的:

awk '
BEGIN{PROCINFO["sorted_in"] = "@ind_num_asc"}
(NR==1){next}
{row[$1]=1;col[$2]=1;val[$1" "$2]=$3}
END { printf "%8s",""; for (j in col) { printf "%8.3f",j }; printf "\n"
for (i in row) {
printf "%8.3f",i; for (j in col) { printf "%8.3f",val[i" "j] }; printf "\n"
}
}' <file>

它是如何工作的:

  • PROCINFO["sorted_in"] = "@ind_num_asc",声明所有数组都按索引进行数字排序。
  • (NR==1){next} : 跳过第一行
  • {row[$1]=1;col[$2]=1;val[$1""$2]=$3},通过存储行列索引和伴随值来处理行。
  • end 语句完成所有打印。

这个输出:

          20.500  21.500  22.500
20.500 -4.100 1.200 7.000
21.500 -6.200 4.300 10.400
22.500 0.000 6.000 16.700

注意PROCINFO 的使用是一个gawk 特性。

但是,如果你做出几个假设,你可以做得更短:

  • 文件包含所有可能的条目,没有缺失值
  • 您不希望打印出行和列的索引:
  • 索引在 column-major-order 中排序

您可以使用以下简短版本:

sort -g <file> | awk '($1+0!=$1){next}
($1!=o)&&(NR!=1){printf "\n"}
{printf "%8.3f",$3; o=$1 }'

哪些输出

  -4.100   1.200   7.000
-6.200 4.300 10.400
0.000 6.000 16.700

或者对于转置:

awk '(NR==1){next}
($2!=o)&&(NR!=2){printf "\n"}
{printf "%8.3f",$3; o=$2 }' <file>

这输出

  -4.100  -6.200   0.000
1.200 4.300 6.000
7.000 10.400 16.700

关于linux - 使用 awk 将列转换为矩阵格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48782640/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com