cluster-analysis - 如何在聚类中计算精度和召回率？-6ren

cluster-analysis - 如何在聚类中计算精度和召回率？

转载作者：行者123 更新时间：2023-12-04 07:27:02

我真的很困惑如何在集群应用程序中计算精度和召回率。

我有以下情况:

给定两组A和B。通过为每个元素使用唯一键，我可以确定A和B中的哪个元素匹配。我想基于功能(当然不使用唯一键)对那些元素进行聚类。

我正在进行聚类，但不确定如何计算精度和召回率。根据论文“用于集群检索的扩展性能图”(http://staff.science.uva.nl/~nicu/publications/CVPR01_nies.pdf)，公式为:

p =精度=相关的检索项目/检索的项目，以及
r =召回=相关的检索项目/相关项目

我真的不知道哪些元素属于哪个类别。

到目前为止，我所做的是，在集群中检查了我有多少对匹配项(使用唯一键)。那已经是精度或召回率之一了吗？如果是的话，那是哪一个？我该如何计算另一个呢？

更新:我刚刚在http://mtg.upf.edu/files/publications/unsuperf.pdf上找到了另一篇标题为“用于评估具有不确定簇数的无监督聚类的F度量”的论文。

最佳答案

我认为您会发现Wikipedia具有有用的article on precision and recall。简而言之:

精度=真实肯定/(真实正确+错误正确)

召回率=真阳性/(真阳性+假阴性)

关于cluster-analysis - 如何在聚类中计算精度和召回率？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/657890/