gpt4 book ai didi

python - Scikit 的 DBSCAN 聚类算法中的噪声样本是什么?

转载 作者:行者123 更新时间:2023-12-04 02:03:44 28 4
gpt4 key购买 nike

如果我在相似矩阵上应用 Scikit 的 DBSCAN ( http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html ),我会得到一系列标签。其中一些标签是 -1。文档称它们为噪声样本。

这些是什么?它们是否都属于一个集群,或者它们都属于自己的集群,因为它们很嘈杂?

谢谢

最佳答案

这些不完全是集群的一部分。它们只是不属于任何集群的点,可以在某种程度上“忽略”。

请记住,DBSCAN 代表“具有噪声的基于密度的应用程序空间聚类”。 DBSCAN 检查以确保一个点在指定范围内有足够的邻居来将这些点分类到集群中。

但是那些不符合落入任何主要集群标准的点会发生什么?如果一个点在指定半径内没有足够的邻居被视为集群的一部分怎么办?这些点的聚类标签为 -1并且被认为是噪音。

所以呢?

好吧,如果您正在分析数据点并且您只对一般集群感兴趣,那么您可以降低数据的大小并消除噪音。或者,如果您使用聚类分析对数据进行分类,在某些情况下,可以将噪声作为异常值丢弃。

在异常检测中,不属于任何类别的点也很重要,因为它们可以代表问题或罕见事件。

关于python - Scikit 的 DBSCAN 聚类算法中的噪声样本是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45313176/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com