- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用 HDBSCAN 聚类技术来预测异常值。我已经训练了我的模型来优化参数,但是,当我对新数据应用近似预测时,我得到了原始模型中不同的集群和标签。我将在这里解释过程流程。
我有一个看起来像这样的数据集:
我应该注意到这个数据集有我人为添加的异常值,目的是优化参数。然后,我申请:
clusterer = hdbscan.HDBSCAN(min_cluster_size=10, gen_min_span_tree=True,
cluster_selection_epsilon=0.1,min_samples=1,allow_single_cluster=True, prediction_data=True, leaf_size=30)
clusterer.fit(X_scaled)
test_labels, strengths = hdbscan.approximate_predict(clusterer, new_observation)
test_labels
from matplotlib import cm
cmap = cm.get_cmap('Set1')
plt.scatter(x='wind_speed',y='temperature',data=X_scaled, c=clusterer.labels_, cmap=cmap)
plt.scatter(x='wind_speed',y='temperature',data=new_observation, c=test_labels, cmap=cmap, s=120)
plt.show()
最佳答案
我也有同样的问题。删除 cluster_selection_epsilon 作为参数,仅使用 min_samples 和 min_cluster_size 来调整聚类。它对我有用。
关于python - HDBSCAN 和近似预测的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60815892/
我想使用 HDBSCAN 聚类技术来预测异常值。我已经训练了我的模型来优化参数,但是,当我对新数据应用近似预测时,我得到了原始模型中不同的集群和标签。我将在这里解释过程流程。 我有一个看起来像这样的数
是否可以在python中选择HDBSCAN算法中的簇数?或者唯一的方法是使用输入参数,例如 alpha、min_cluster_size? 谢谢 更新: 这是使用 fcluster 和 hdbscan
我使用 HDBSCAN 从数据集中获取软集群,如下所示: clusterer = hdbscan.HDBSCAN(min_cluster_size=10, prediction_data=True)
我正在数据上构建和拟合 hdbscan 模型,当我从文件内运行脚本时,它运行良好且快速,但是当我导入文件并从“外部”运行它时,它会进入一个奇怪的循环我不明白它是怎么开始的。我收到以下错误: Impor
我正在尝试通过largeVis包在R中运行HDBSCAN算法。用于集群的可视化。我在largeVis中使用gplot函数。是否可以将图中数据点的标签从整数更改为字符串?我使用的 Iris 数据集在“c
我尝试将 HDBSCAN 算法应用于我的数据集(50000 个 GPS 点)。但是,每次我运行代码时,R session 都会崩溃。 这是基本信息。关于我的电脑: processor: Intel i
我尝试使用 pip install hdbscan 下载 Hdbscan ,我明白了: 错误 : hdbscan 的构建轮失败 错误 : 无法为使用 PEP 517 且无法直接安装的 hdbscan
我在 Linux 操作系统中使用 conda install -c conda-forge hdbscan 安装了 hdbscan。 import hdbscan 从 python 命令行运行,但不适
我正在尝试安装 bertopic,但出现此错误: pip install bertopic Collecting bertopic > Using cached ber
我正在尝试在运行 Windows 10 并安装了 Python 3.6 的电脑上安装 hdbscan。 我的第一次尝试失败了: (base) C:\WINDOWS\system32>pip insta
我知道以前有很多人发布过关于此的信息,但我仍然无法解决我的错误。我正在尝试导入 hdbscan 但它一直返回以下错误 -----------------------------------------
我是一名优秀的程序员,十分优秀!