gpt4 book ai didi

python - 在 python : ranked list vs. 中评估搜索查询的结果,一个手动标记为正确的文档

转载 作者:太空宇宙 更新时间:2023-11-04 02:02:09 24 4
gpt4 key购买 nike

给定以下预测的文档排名列表:

query1_predicted = [1381, 1637, 646, 1623, 774, 1764, 92, 12, 642, 463, 613, ...]

和这个手动标记的最佳选择:

query1_manual = 646

是否有任何合适的信息检索指标已经在 python 中实现来对这个结果进行排名?

我不认为NDCG对我有用,因为我缺少真实且排名完整的文档列表。我假设召回率、精确率、F 分数和 MAP 也不会起作用,只要我没有每个查​​询的手动排名结果的完整列表来指示文档的相关性。

顺便说一句:预测列表的长度等于我集合中的文档总数:

len(query1_predicted) = len(documents)

提前感谢您的帮助!

最佳答案

一个想法是结合精度和召回指标。例如,如果您的查询返回一个列表,其中正确的文档排在第一位,您可以说您的准确率和召回率是 100%。如果它排在第二位,你的准确率又是 100%,但你的召回率下降到 50%,依此类推。我知道这种方法并不完美,但它可以通过众所周知的指标很好地了解您的结果。

关于python - 在 python : ranked list vs. 中评估搜索查询的结果,一个手动标记为正确的文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55492834/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com