gpt4 book ai didi

python - 如何从python中的列表中删除重复项

转载 作者:太空宇宙 更新时间:2023-11-04 10:43:51 24 4
gpt4 key购买 nike

<分区>

我有一个列表:list = ['item1', 'item2', 'item3', 'item4']

我想比较所有元素的相似度。

如果 item2item3 相似,结果变成 list = ['item1', 'item2', 'item4']

编辑:

抱歉我的问题。

列表项是一组三元组。我想删除列表中的相似项。

list = [('very','beauty','place'),('very','good','place'),('another','trigram','item')]

通过计算 jaccard 相似度,该列表中的每个 pairs-item,如果 pairs-item 的 jaccard 分数 > 0.4,我称之为相似。在此示例中,item1 和 item2 相似。我想要的最后一个输出是:

list = [('very','beauty','place'),('another','trigram','item')]

这是计算jaccard分数的方法:

def compute_jaccard_index(set_1, set_2):
n = len(set_1.intersection(set_2))
return n / float(len(set_1) + len(set_2) - n)

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com