gpt4 book ai didi

python - 确定文档与 Python 的不同之处

转载 作者:太空宇宙 更新时间:2023-11-03 13:53:44 25 4
gpt4 key购买 nike

我一直在使用 Python difflib库查找 2 个文档的不同之处。 Differ().compare() 方法执行此操作,但它非常慢 - 与 diff 相比,大型 HTML 文档至少慢 100 倍命令。

如何在 Python 中有效地确定 2 个文档的不同之处? (理想情况下,我在位置之后而不是实际文本之后,这是 SequenceMatcher().get_opcodes() 返回的内容。)

最佳答案

a = open("file1.txt").readlines()
b = open("file2.txt").readlines()
count = 0
pos = 0

while 1:
count += 1
try:
al = a.pop(0)
bl = b.pop(0)
if al != bl:
print "files differ on line %d, byte %d" % (count,pos)
pos += len(al)
except IndexError:
break

关于python - 确定文档与 Python 的不同之处,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1999019/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com