gpt4 book ai didi

scikit-learn - python中余弦度量的DBSCAN错误

转载 作者:行者123 更新时间:2023-12-04 04:06:45 28 4
gpt4 key购买 nike

我试图使用带有余弦度量的 scikit-learn 库中的 DBSCAN 算法,但被错误所困扰。
代码行是

db = DBSCAN(eps=1, min_samples=2, metric='cosine').fit(X)    

哪里 Xcsr_matrix .错误如下:

Metric 'cosine' not valid for algorithm 'auto',



尽管文档说可以使用这个指标。
我尝试使用选项 algorithm='kd_tree''ball_tree'但得到了相同的。但是,如果我使用 euclidean 没有错误或者,比如说, l1公制。

矩阵 X很大,所以我不能使用预先计算的成对距离矩阵。

我用 python 2.7.6scikit-learn 0.16.1 .
我的数据集没有一整行零,所以余弦度量是明确定义的。

最佳答案

sklearn 中的索引(可能 - 这可能会随着新版本而改变)不能加速余弦。

试试 algorithm='brute' .

有关您的 sklearn 版本可以加速的指标列表,请参阅球树支持的指标:

from sklearn.neighbors.ball_tree import BallTree
print(BallTree.valid_metrics)

关于scikit-learn - python中余弦度量的DBSCAN错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32745541/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com