gpt4 book ai didi

url - 从余弦相似度值聚类

转载 作者:行者123 更新时间:2023-12-04 06:27:43 27 4
gpt4 key购买 nike

我已经从一组 URL 中提取了单词并计算了每个 URL 内容之间的余弦相似度。我还对 0-1 之间的值进行了标准化(使用 Min-Max)。现在我需要根据余弦相似度值对 URL 进行聚类以找到找出相似的 URL。哪种聚类算法最合适?。请给我推荐一种动态聚类方法,因为它很有用,因为我可以按需增加 URL 的数量,而且它会更自然。如果你觉得我是,请纠正我'我以错误的方式取得进展。感谢期待。

最佳答案

K-means 聚类可以用于在线学习,你只需要先验地选择聚类的数量。另外,我认为您不应该对数据进行标准化,因为余弦已经提供了 [0:1] 范围内的值。您的 Min-Max 归一化可能会导致信息丢失。

关于url - 从余弦相似度值聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5841282/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com