gpt4 book ai didi

java - 修改Lucene索引中的.tim和.tip文件

转载 作者:行者123 更新时间:2023-12-01 12:48:52 25 4
gpt4 key购买 nike

我有一个包含多个索引的 Lucene 应用程序,其中相关性评分由于不同索引之间的术语频率差异而受到影响。我的理解是,术语词典(.tim 文件)包含“术语统计信息”,例如每个术语的文档频率统计信息。我认为一种方法可能是修改每个索引(和相关段)的 .tim 文件并更新“术语统计信息”。是否可以通过这种方式覆盖或修改 .tim 和 .tip 文件?

最佳答案

relevancy scoring suffers

来自FAQ :

score values are meaningful only for purposes of comparison between other documents for the exact same query and the exact same index. when you try to compute a percentage, you are setting up an implicit comparison with scores from other queries.

关于java - 修改Lucene索引中的.tim和.tip文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24412795/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com