gpt4 book ai didi

python - 有没有一种有效的方法对标记的相似数据点进行聚类?

转载 作者:行者123 更新时间:2023-12-03 23:58:06 25 4
gpt4 key购买 nike

我有一个如下所示的数据框:

| Image | Similar Images |
| ------| -------------- |
| 1 | [1, 2, 6] |
| 2 | [2, 1, 6] |
| 3 | [3, 4] |
| 4 | [4, 3] |
| 5 | [5] |
| 6 | [6, 1, 2] |

我想制作相似图像的集群并标记它们。我的目标是这样的:

| Image | Similar Images | Label |
| ------| -------------- |-------|
| 1 | [1, 2, 6] | 1 |
| 2 | [2, 1, 6] | 1 |
| 3 | [3, 4] | 2 |
| 4 | [4, 3] | 2 |
| 5 | [5] | 3 |
| 6 | [6, 1, 2] | 1 |

有没有一种有效的方法来做到这一点?我有有限的计算资源和大约 178000 张图像,这就是为什么我想知道是否有任何有效的现有方法或包可以执行(部分)这项任务。

最佳答案

尝试 frozenset 然后 factorize

df['new'] = df['Similar Images'].map(frozenset).factorize()[0]+1

关于python - 有没有一种有效的方法对标记的相似数据点进行聚类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67557551/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com