gpt4 book ai didi

python - DBSCAN 中的替代相似性度量?

转载 作者:行者123 更新时间:2023-11-30 23:38:08 24 4
gpt4 key购买 nike

我在scikit-learn中的DBSCAN算法上测试了我的图像集 python 模块。相似度计算还有其他选择:

# Compute similarities
D = distance.squareform(distance.pdist(X))
S = 1 - (D / np.max(D))

我可以尝试的加权测量或类似的方法,例如?

最佳答案

存在 DBSCAN 的泛化,称为“广义 DBSCAN”。

实际上,对于 DBSCAN,您甚至不需要距离。这就是为什么首先计算相似度矩阵实际上没有意义。

您所需要的只是一个谓词“getNeighbors”,它可以计算您视为邻居的对象。

参见:在 DBSCAN 中,除了测试一个对象是否是邻居之外,并没有真正使用距离。所以你所需要的只是这个 bool 决定。

您可以尝试以下方法:将矩阵初始化为全1。对于您认为与您的应用程序相似的任何两个对象(在不了解您的应用程序和数据的情况下,我们无法为您提供太多帮助),请在相应的单元格中填充 0。然后以 epsilon = 0.5 运行 DBSCAN,显然 DBSCAN 会将所有 0 视为邻居。

关于python - DBSCAN 中的替代相似性度量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14854243/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com