gpt4 book ai didi

algorithm - 如何选择合适的聚类算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:29:03 26 4
gpt4 key购买 nike

我即将使用 1000 维的特征向量进行聚类。也就是说,特征向量如下所示。a = {255, 2334, 436, ... , 5284};b = {235, 434, 63, ... , 844};...我还有衡量 2 个特征向量之间距离的度量。但是我无法弄清楚哪种聚类算法最好地使用这个特征向量进行聚类,因为由于高维,我无法可视化这些向量的分布。任何人都知道可以可视化这些分布的方法,或者在不知道数据分布的情况下,如何选择最好的聚类算法?提前致谢。

最佳答案

您应该将标记数据分成训练集和测试集。使用训练集,您可以训练一个分类器,您可以根据标记的测试集来衡量其性能。

作为分类器,一个 first try可以是 SVC。

为了获得更好的可靠性,您应该针对不同的训练集和测试集重做此过程。这被称为 cross-validation .

关于algorithm - 如何选择合适的聚类算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20223514/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com