gpt4 book ai didi

lucene - Lucene 中的规范是什么

转载 作者:行者123 更新时间:2023-12-03 23:35:41 28 4
gpt4 key购买 nike

我不明白它们是什么,我真的很感激一个简单的解释,展示它们给世界带来的值(value),而没有太多关于它们如何工作的实现细节。

最佳答案

范数是计算分数的一部分。可以根据您的喜好计算标准,真的。使规范与众不同的主要因素是它是在索引时计算的。通常,其他影响分数的因素在查询时根据文档与查询的匹配程度计算。 norm相反,通过与文档一起存储来节省查询性能。

可以在 Lucene 的 TFIDFSimilarity 中找到并详细描述了标准实现。 .在那里,它是设置字段提升的乘积(或所有字段提升的乘积,如果在该字段上设置了多个)和“lengthNorm”(这是一个计算因子,旨在更重地权衡较短文档的匹配)。这些都不依赖于查询的组成,因此在索引时计算和存储是不错的选择。

然后它们以压缩的、高度有损的单字节格式存储(具有大约 1 个有效十进制数字的准确度)。

关于lucene - Lucene 中的规范是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17536021/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com