作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我真的很困惑如何在集群应用程序中计算精度和召回率。
我有以下情况:
给定两组A和B。通过为每个元素使用唯一键,我可以确定A和B中的哪个元素匹配。我想基于功能(当然不使用唯一键)对那些元素进行聚类。
我正在进行聚类,但不确定如何计算精度和召回率。根据论文“用于集群检索的扩展性能图”(http://staff.science.uva.nl/~nicu/publications/CVPR01_nies.pdf),公式为:
p =精度=相关的检索项目/检索的项目,以及
r =召回=相关的检索项目/相关项目
我真的不知道哪些元素属于哪个类别。
到目前为止,我所做的是,在集群中检查了我有多少对匹配项(使用唯一键)。那已经是精度或召回率之一了吗?如果是的话,那是哪一个?我该如何计算另一个呢?
更新:我刚刚在http://mtg.upf.edu/files/publications/unsuperf.pdf上找到了另一篇标题为“用于评估具有不确定簇数的无监督聚类的F度量”的论文。
最佳答案
我认为您会发现Wikipedia具有有用的article on precision and recall。简而言之:
精度=真实肯定/(真实正确+错误正确)
召回率=真阳性/(真阳性+假阴性)
关于cluster-analysis - 如何在聚类中计算精度和召回率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/657890/
我是一名优秀的程序员,十分优秀!