作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个如下所示的数据框:
| Image | Similar Images |
| ------| -------------- |
| 1 | [1, 2, 6] |
| 2 | [2, 1, 6] |
| 3 | [3, 4] |
| 4 | [4, 3] |
| 5 | [5] |
| 6 | [6, 1, 2] |
我想制作相似图像的集群并标记它们。我的目标是这样的:
| Image | Similar Images | Label |
| ------| -------------- |-------|
| 1 | [1, 2, 6] | 1 |
| 2 | [2, 1, 6] | 1 |
| 3 | [3, 4] | 2 |
| 4 | [4, 3] | 2 |
| 5 | [5] | 3 |
| 6 | [6, 1, 2] | 1 |
有没有一种有效的方法来做到这一点?我有有限的计算资源和大约 178000 张图像,这就是为什么我想知道是否有任何有效的现有方法或包可以执行(部分)这项任务。
最佳答案
尝试 frozenset
然后 factorize
df['new'] = df['Similar Images'].map(frozenset).factorize()[0]+1
关于python - 有没有一种有效的方法对标记的相似数据点进行聚类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67557551/
我是一名优秀的程序员,十分优秀!