gpt4 book ai didi

python - 将字符串列表与字符串列表进行比较(python)

转载 作者:太空宇宙 更新时间:2023-11-04 07:03:24 24 4
gpt4 key购买 nike

我正在尝试比较两个 excel 文档,它们由大约 6000 行和 4 列组成,第一列是域名,其他三列是评论,其中一个文档已更新评论一些专栏,最终我希望此脚本的功能类似于批量更新新评论以替换旧的过时评论。

到目前为止,我编写的代码会打开文档并将它们添加到两个单独的列表中:

import csv

newlist = csv.reader(open('newcomments.csv','rU'), dialect='excel')
export = csv.reader(open('oldcomments.csv', 'rU'), dialect='excel')

for row in newlist:
olddomain=[]
domain = row[0:]
olddomain.append(domain)
for item in olddomain:
print item

for row in export:
newdomain=[]
domain= row[0:]
newdomain.append(domain)
for item in newdomain:
print item

列表的输出看起来像(第二列通常是空白的):

['example.com', '', 'excomment', 'Parked Page']

当尝试比较列表时,我尝试了类似的方法:

if item in olddomain != item in newdomain:
print "no match"
else:
print "match"

但这似乎不起作用,例如,两个文件中的第一行包含完全相同的数据,但代码返回“不匹配”,两个文件中的第二行也包含相同的数据,但是代码返回“匹配”

我将行保存到列表的方式有问题,还是我遗漏了什么?我假设有更好的方法可以做到这一点,但我将其用作学习更多 python 的借口!

感谢您的宝贵时间。

最佳答案

您似乎正在尝试将旧域名列表与新域名列表进行比较。构建这些列表后,您想查看列表之间是否存在共性。

在这种情况下,我认为 set()提供更丰富的功能,让您的生活更轻松。示例:

>>> olddomains = set(['www.cisco.com', 'www.juniper.com', 'www.hp.com'])
>>> newdomains = set(['www.microsoft.com', 'www.cisco.com', 'www.apple.com'])
>>> olddomains.intersection(newdomains)
set(['www.cisco.com'])
>>>
>>> 'www.google.com' in newdomains
False
>>>

重写部分代码以使用集合如下所示:

# retain newlist, since that's the output from csv...
for row in newlist:
olddomain = set([])
domain = row[0]
olddomain.add(domain.lower()) # use lower() to ensure no CAPS mess things up
for item in olddomain:
print item

以及您询问的代码:

if olddomain.intersection(newdomain) == set([]):
print "no match"
else:
print "match"

在确定我是使用 set() 还是 list() 时我使用的一般规则:

  • 如果保留元素的顺序很重要(包括能够使用索引访问它们),请使用 list()
  • 在任何其他情况下,使用 set()

编辑

既然你在问为什么我发布的代码会抛出一个TypeError,如果你像我一样分配row,那么你需要使用行[0] 而不是 行[0:]

>>> row = ['example.com', '', 'excomment', 'Parked Page']
>>> row[0:]
['example.com', '', 'excomment', 'Parked Page']
>>> row[0]
'example.com'
>>>

我更改了示例以反射(reflect)这一点,因为我怀疑这就是问题所在。

关于python - 将字符串列表与字符串列表进行比较(python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8757417/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com