gpt4 book ai didi

linux - 需要从大型 linux 文本文件(约 2000 万行)中解析数据字符串并转换为 csv

转载 作者:太空宇宙 更新时间:2023-11-04 10:18:19 25 4
gpt4 key购买 nike

我有一个大文件(20M 行),每行格式如下:

(5859785,7410375) (5859799,7410377) LAYER_ACT stringofdatathatislateronrow
(58597,74103) (58597,74103) LAYER_ACT2 stringofdatathatislateronrowmillion

我需要一个 csv 输出:

X              Y
5859785 7410375
58597 74103

我知道 unix 上的“sed”命令可以用来抓取东西,但是我无法让它工作以获得正确的格式。您是否有更好的解决方案来获得此输出?

最佳答案

使用 (, ), 作为 awk 的输入字段分隔符:

awk -F '[(),]' 'BEGIN{OFS="\t"; print "X","Y"} {print $2,$3}' file

输出:

X       Y5859785 741037558597   74103

根据您的需要更改输出字段分隔符 (OFS)。

关于linux - 需要从大型 linux 文本文件(约 2000 万行)中解析数据字符串并转换为 csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45071474/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com