gpt4 book ai didi

linux - 删除 .csv 文件中的重复内容?

转载 作者:太空宇宙 更新时间:2023-11-04 03:51:01 25 4
gpt4 key购买 nike

我有一个包含两列的大型 .csv 文件

A) 姓名 B) 电子邮件

我想删除重复的电子邮件。它需要删除整行。

例如,如果我的 .csv 文件具有以下内容

Ted     abc@efg.com
John abc@efg.com
Dave abc@efg.com

它将删除两条底线并仅包含

Ted     abc@efg.com

任何帮助将不胜感激

谢谢!

最佳答案

使用 awk 您可以根据字符串所在的列检查重复值:

awk '!x[$2]++' FS="," file.csv > deduped.csv

在上面的示例中,awk 检查以 , 分隔的 csv 文件的第 2 列

关于linux - 删除 .csv 文件中的重复内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26370955/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com