gpt4 book ai didi

python - 比较 2 个文本文件中的行

转载 作者:太空宇宙 更新时间:2023-11-04 08:51:40 27 4
gpt4 key购买 nike

我有两个大型文本文件(200,000 多行),CSV 格式。我需要逐行比较它们,但字段可能会在每一行内切换。

示例文件A.csv:

AAA,BBB,,DDD  
EEE,,GGG,HHH
III,JJJ,KKK,LLL

示例文件B.csv:

AAA,,BBB,DDD  
EEE,,GGG,HHH
LLL,KKK,JJJ,III

因此,就我的目的而言,A.csvB.csv 应该是“相同的”,即使字段在第一行和最后一行中切换。由于每个文件中的字段顺序可能不同,因此 grep 或 diff 等常用选项将不起作用。

基本上,我想我需要写一些东西来读取一行 A.csvB.csv,并检查两行中是否存在所有字段,独立于订单。或者,在阅读行后对字段进行排序的东西。

最佳答案

您可以在不影响数据的情况下规范化检查。

with open('big1.csv') as i, open('big2.csv') as j:
a = csv.reader(i)
b = csv.reader(j)
for linea in a:
lineb = next(b)
if sorted(map(str.lower, linea)) != sorted(map(str.lower, lineb)):
print('{} does not match {}'.format(linea, lineb))

关于python - 比较 2 个文本文件中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34702571/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com