gpt4 book ai didi

java - 在mahout频谱聚类中,亲和矩阵中的对角元素值应该是多少

转载 作者:行者123 更新时间:2023-12-02 21:45:31 25 4
gpt4 key购买 nike

标题说明了一切,这是光谱聚类Spectral clustering Documentation的链接

第一步是为我们的数据点提取相似度矩阵。当说相似度矩阵时,我假设相同实体(用户,文档等)之间的相似度应为1(与距离矩阵为0相对)。

但在他们的示例中,他们为相同实体指定了得分0:

0,0 0

1,1 0

在这里我有点困惑。曾经从事光谱聚类工作的任何人都可以帮助我。

附注:我有自己的计算相似度得分的方法,所以我不想使用任何内置的mahout函数。

提前致谢..

最佳答案

我认为我们应该将相似性矩阵视为图论中邻接矩阵的扩展:如果两个节点相邻,则为1,否则为0。在您的情况下,所有节点都是相邻的,您可以通过相似性矩阵考虑此邻接矩阵,以编码有关“多少个观测值相邻?”的信息。

由于除非节点与其自身连接,否则我们不认为节点与其相邻,因此邻接矩阵的对角线设置为0。

关于java - 在mahout频谱聚类中,亲和矩阵中的对角元素值应该是多少,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25701795/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com