gpt4 book ai didi

algorithm - 给定一堆项目,通过比较将它们分成有意义的组

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:41:52 24 4
gpt4 key购买 nike

假设我有一堆需要分组的项目,并且我可以表达这些项目相对于彼此的差异有多少,如果你愿意,可以用数字、分数来表示,我将如何将此输入分成有意义的组?

我认识到这是一个有点抽象的问题,所以为了让这里更清楚,我已经尝试过:

我已经尝试将输入表示为加权图,其中每个顶点都连接到每个其他顶点,边的“强度”是它们的相对分数。然后我将采用图形的最长边,并通过与最长边末端的顶点的“接近度”将每个其他顶点分开。这相当有效,但缺点是总是会产生两组结果,这可能不一定合乎逻辑。

例如:说我可以用数字来表达水果的不同。然后给定一堆苹果,不同品牌的苹果会形成不同的类别,比如 Elstar、Jonagold,你有什么……但是当我有一堆由苹果、梨和橙子组成时,那么苹果将是比较相似,应该属于同一类。

我猜我必须删除图形中大于均值加标准偏差或类似值的每条边,然后查看出现了多少个脱节的子图,但我想听听方法比我有更多数学知识的人。

最佳答案

评论有点长。

你指的是聚类。您似乎在两个项目之间有一个“距离”矩阵,尽管这可能与“强度”指标相反。距离度量是非负的,当两个事物相等时为 0。值越大,项目之间的距离越远。

当您有一个通用的“距离”矩阵时,典型的聚类方法是分层/凝聚聚类(“距离”用引号引起来,因为它可能不满足距离的所有形式质量)。开始理解这项技术的好地方是 Wikipedia page .层次聚类背后的思想可以应用于非完全连接的图。

我希望几乎每个统计包都包含某种形式的层次集群。

关于algorithm - 给定一堆项目,通过比较将它们分成有意义的组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38101713/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com