gpt4 book ai didi

python - Python 中具有相同内容的 2 个文件中的 2 行的标识

转载 作者:行者123 更新时间:2023-11-28 21:03:57 25 4
gpt4 key购买 nike

我同时从两个内容相同的文本文件(单词列表)中读取行。

peach
carrot
apple
lemon

我想检查两条同步线是否相同。如果不是,则总相似性会降低。由于这两个文件是相同的,因此检查身份应该会导致 100% 的相似性。相反,我得到 0%。

from itertools import izip, izip_longest

with open(r'file1.txt', "rb") as f1, open(r'file2.txt', "rb") as f2:

#initialize numerator & denominator values for calculating file similarity
nTotal = 4 #total number of lines in each file
nIdent = nTotal

for line1, line2 in izip_longest(f1, f2):

if((line1 is line2) is False):

nIdent -=1

similarity = nIdent/nTotal

为什么线条不一样?

最佳答案

您的比较line1 is line2line1 == line2相同。对象相同,但它们代表的数据是相同的。

equal_lines = 0

with open(r'file1.txt', "rb") as f, open(r'file2.txt', "rb") as f2:
for f1_line, f2_line in zip(f.readlines(), f2.readlines()):
if f1_line == f2_line:
equal_lines += 1

关于python - Python 中具有相同内容的 2 个文件中的 2 行的标识,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45950818/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com