gpt4 book ai didi

deep-learning - 我可以使用自动编码器进行聚类吗?

转载 作者:行者123 更新时间:2023-12-03 00:12:02 25 4
gpt4 key购买 nike

在下面的代码中,他们使用自动编码器作为监督聚类或分类,因为它们有数据标签。 http://amunategui.github.io/anomaly-detection-h2o/但是,如果我没有标签,我可以使用自动编码器来聚类数据吗?问候

最佳答案

深度学习自动编码器始终是无监督学习。您链接到的文章的“监督”部分是为了评估它的表现。

以下示例(取 self 的书《Practical Machine Learning with H2O》的第 7 章,其中我在同一数据集上尝试了所有 H2O 无监督算法 - 请原谅插件)采用 563 个特征,并尝试对它们进行编码分成两个隐藏节点。<​​/p>

m <- h2o.deeplearning(
2:564, training_frame = tfidf,
hidden = c(2), auto-encoder = T, activation = "Tanh"
)
f <- h2o.deepfeatures(m, tfidf, layer = 1)

第二个命令提取隐藏节点权重。 f 是一个数据框,具有两个数字列,并且 tfidf 源数据中的每一行对应一行。我只选择了两个隐藏节点,以便可以绘制集群:

simplest autoencoder output

每次运行结果都会改变。您(也许)可以使用堆叠自动编码器或使用更多隐藏节点获得更好的结果(但随后您无法绘制它们)。在这里我感觉结果受到数据的限制。

顺便说一句,我用以下代码制作了上面的图:

d <- as.matrix(f[1:30,]) #Just first 30, to avoid over-cluttering
labels <- as.vector(tfidf[1:30, 1])
plot(d, pch = 17) #Triangle
text(d, labels, pos = 3) #pos=3 means above

(P.S.原始数据来自Brandon Rose's excellent article on using NLTK。)

关于deep-learning - 我可以使用自动编码器进行聚类吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40779282/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com