作者热门文章
- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我即将使用 1000 维的特征向量进行聚类。也就是说,特征向量如下所示。a = {255, 2334, 436, ... , 5284};b = {235, 434, 63, ... , 844};...我还有衡量 2 个特征向量之间距离的度量。但是我无法弄清楚哪种聚类算法最好地使用这个特征向量进行聚类,因为由于高维,我无法可视化这些向量的分布。任何人都知道可以可视化这些分布的方法,或者在不知道数据分布的情况下,如何选择最好的聚类算法?提前致谢。
最佳答案
您应该将标记数据分成训练集和测试集。使用训练集,您可以训练一个分类器,您可以根据标记的测试集来衡量其性能。
作为分类器,一个 first try可以是 SVC。
为了获得更好的可靠性,您应该针对不同的训练集和测试集重做此过程。这被称为 cross-validation .
关于algorithm - 如何选择合适的聚类算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20223514/
我是一名优秀的程序员,十分优秀!