python - 有没有一种有效的方法对标记的相似数据点进行聚类？-6ren

python - 有没有一种有效的方法对标记的相似数据点进行聚类？

转载作者：行者123 更新时间：2023-12-03 23:58:06

我有一个如下所示的数据框:

| Image | Similar Images |
| ------| -------------- |
| 1     | [1, 2, 6]      |
| 2     | [2, 1, 6]      |
| 3     | [3, 4]         |
| 4     | [4, 3]         |
| 5     | [5]            |
| 6     | [6, 1, 2]      |

我想制作相似图像的集群并标记它们。我的目标是这样的:

| Image | Similar Images | Label |
| ------| -------------- |-------|
| 1     | [1, 2, 6]      | 1     |
| 2     | [2, 1, 6]      | 1     |
| 3     | [3, 4]         | 2     |
| 4     | [4, 3]         | 2     |
| 5     | [5]            | 3     |
| 6     | [6, 1, 2]      | 1     |

有没有一种有效的方法来做到这一点？我有有限的计算资源和大约 178000 张图像，这就是为什么我想知道是否有任何有效的现有方法或包可以执行(部分)这项任务。

最佳答案

尝试 frozenset 然后 factorize

df['new'] = df['Similar Images'].map(frozenset).factorize()[0]+1

关于python - 有没有一种有效的方法对标记的相似数据点进行聚类？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67557551/

文章推荐： c - 如果只有一次迭代，gcc 优化会删除 for 循环吗？

文章推荐： c++ - 是否分配给临时对象未定义行为的字段？

文章推荐： string - 如何获取字符串开头对应字符的个数

文章推荐： javascript - 如何计算自定义值的总和

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 有没有一种有效的方法对标记的相似数据点进行聚类？