gpt4 book ai didi

statistics - 如何使用非常小的数据集对特征进行加权以实现更好的聚类?

转载 作者:行者123 更新时间:2023-11-30 08:32:09 25 4
gpt4 key购买 nike

我正在开发一个程序,该程序接受特征空间(1000+维)中的几个(<50)高维点,并通过递归地使用标准 k 聚类对它们执行层次聚类。

我的问题是,在任何一个 k 聚类过程中,高维表示的不同部分都是冗余的。我知道这个问题是在特征提取、选择或加权的保护下出现的。

一般来说,在选择特定的特征提取/选择/加权算法时要考虑什么?具体来说,在我的情况下,什么算法是准备数据进行聚类的最佳方法?

最佳答案

查看这篇论文:

Witten DM 和 R Tibshirani (2010) 聚类中特征选择的框架。美国统计协会杂志 105(490): 713-726。

以及 Friedman 的相关论文 COSA。他们都深入讨论了这些问题。

关于statistics - 如何使用非常小的数据集对特征进行加权以实现更好的聚类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6700897/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com