gpt4 book ai didi

cluster-analysis - 决定内核 PCA 中内核参数的类型

转载 作者:行者123 更新时间:2023-12-05 07:34:48 26 4
gpt4 key购买 nike

我是机器学习的新手,我正在尝试使用 k-means 聚类进行无监督学习(即使我读到 k-means 不能很好地处理分类数据)。我编码了我的分类变量并尝试应用kernel PCA 因为我有一个分类特征(它是性别)。我注意到内核参数有几个值,它们是'linear'、'poly'、'rbf'、'sigmoid'、'cosine' 和'precomputed'

我在互联网上搜索过,但找不到关于这些的任何适当解释。我无法确定内核在 PCA 和 SVM 上的使用是否相同。有没有人可以解释它们是什么,何时应该使用它们和/或如何为我们的数据集选择正确的?由于我们无法将超过 3 个维度的数据集可视化,我们将如何决定其形状以选择正确的参数?下面的部分代码只是为了显示参数的使用位置:

# Applying Kernel PCA 
from sklearn.decomposition import KernelPCA
kpca = KernelPCA(n_components = 2, kernel = 'linear')
X = kpca.fit_transform(X)

提前谢谢你。

最佳答案

这些预定义内核也不支持混合数据。它们是向量内核。

线性 kennel 应该给出与非内核 PCA 相同的结果,只是慢很多。

除了内核的使用外,与SVM没有太大关系。当您可以在监督分类任务中进行超参数优化时,像 rbf 这样的内核会更有意义。由于选择这些参数很困难,因此除了玩具问题外,很难很好地利用 KernelPCA。

关于cluster-analysis - 决定内核 PCA 中内核参数的类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49928514/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com