gpt4 book ai didi

elasticsearch - BM25与Elasticsearch中二项项频率的相似性

转载 作者:行者123 更新时间:2023-12-02 23:21:38 25 4
gpt4 key购买 nike

是否有人尝试通过以下方式自定义Elasticsearch中使用的BM25相似性?
这是常见的BM25分数。我希望术语频率为二进制(如果文档中未显示术语,则为0;如果文档中术语的频率大于0,则为1)。因此,在下面的图片中,我希望tf(q_i,d)为{0,1}。
有什么想法在Elasticsearch中最简单的方法是什么?

enter image description here

最佳答案

实现此目的的一种方法是使用Unique Token Filter,它在分析期间仅索引唯一标记。
如果存在 token ,这应该等效于文档中的术语频率为1。

关于elasticsearch - BM25与Elasticsearch中二项项频率的相似性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48520659/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com