gpt4 book ai didi

linux - 在第二个字段上加入未排序的文件

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:57:12 24 4
gpt4 key购买 nike

我只是厌倦了使用 join 命令而没有得到想要的结果,它返回了一些错误。

还有一件事,我在这里和 SuperUser 中阅读了与 join 命令相关的所有查询,但没有成功。

如何使用 joinawk

file1.csv
autoid|Mycolumn
5|Odhav, Gujarat, 380010
7|Navrangpura, Gujarat, 380009
16|Kalupur, Gujarat, 380002
32|Naroda, Gujarat, 380025
62|Khamasa, Gujarat, 380001
73|Sola Road, Gujarat, 380063
74|Railwaypura, Gujarat, 380002
78|Meghaninagar, Gujarat, 380016
85|Thaltej, Gujarat, 380054

file2.csv
5|Odhav, Gujarat, 380010|22.406347|73.824345
7|Navrangpura, Gujarat, 380009|22.328403|73.881841
16|Kalupur, Gujarat, 380002|22.379901|73.814217
32|Naroda, Gujarat, 380025|22.417059|73.887806
38|Raikhad, Gujarat, 380001|22.491544|73.782878
39|Ashram Road, Gujarat, 380006|22.279248|73.846393
44|Raipur, Gujarat, 380002|22.346186|73.87462
56|Jamalpur, Gujarat, 380022|22.518504|73.785024
58|Patharkuva, Gujarat, 380001|22.308473|73.825071
62|Khamasa, Gujarat, 380001|22.100711|73.707207
73|Sola Road, Gujarat, 380063|22.026236|73.732926
74|Railwaypura, Gujarat, 380002|21.992994|73.86893
78|Meghaninagar, Gujarat, 380016|21.955106|73.878629
85|Thaltej, Gujarat, 380054|21.989253|73.735725

我正在使用这个命令但无法得到想要的结果:

$ join -t'|' -1 2 -2 2 <(sort -k2 Areaprob.csv) <(sort -k2 Com_remoteArea.csv)>output.csv

它返回这样的东西;如您所见,我已经将 sort 命令与上面给出的 join 一起使用。

join: file 1 is not in sorted order
join: file 2 is not in sorted order

我的 output.csv 看起来像这样 - 它不会将所有 9 条记录返回为 file1.csv

Mycolumn|autoid|autoid|Gis_lat|Gis_long
Khamasa, Gujarat, 380001|62|62|22.100711|73.707207
Railwaypura, Gujarat, 380002|74|74|21.992994|73.86893
Thaltej, Gujarat, 380054|85|85|21.989253|73.735725
Sola Road, Gujarat, 380063|73|73|22.026236|73.732926

最佳答案

您忘记告诉 sort 分隔符。尝试使用 sort -t'|' -k2:

$ join -t'|' -j2 <(sort -t'|' -k2 file1) <(sort -t'|' -k2 file2)
Kalupur, Gujarat, 380002|16|16|22.379901|73.814217
Khamasa, Gujarat, 380001|62|62|22.100711|73.707207
Meghaninagar, Gujarat, 380016|78|78|21.955106|73.878629
Naroda, Gujarat, 380025|32|32|22.417059|73.887806
Navrangpura, Gujarat, 380009|7|7|22.328403|73.881841
Odhav, Gujarat, 380010|5|5|22.406347|73.824345
Railwaypura, Gujarat, 380002|74|74|21.992994|73.86893
Sola Road, Gujarat, 380063|73|73|22.026236|73.732926
Thaltej, Gujarat, 380054|85|85|21.989253|73.735725

注意:您可以在加入两个文件中的字段 2 时使用 -j2


编辑:

如果你想保留标题,你将需要 awk:

awk -F'|' 'NR==1;FNR==NR{a[$2];next}$2 in a{print $2,$3,$4}' OFS='|' file1 file2
autoid|Mycolumn
Odhav, Gujarat, 380010|22.406347|73.824345
Navrangpura, Gujarat, 380009|22.328403|73.881841
Kalupur, Gujarat, 380002|22.379901|73.814217
Naroda, Gujarat, 380025|22.417059|73.887806
Khamasa, Gujarat, 380001|22.100711|73.707207
Sola Road, Gujarat, 380063|22.026236|73.732926
Railwaypura, Gujarat, 380002|21.992994|73.86893
Meghaninagar, Gujarat, 380016|21.955106|73.878629
Thaltej, Gujarat, 380054|21.989253|73.735725

关于linux - 在第二个字段上加入未排序的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15524202/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com