gpt4 book ai didi

java - 如何用 Lucene 查找短语?

转载 作者:行者123 更新时间:2023-12-01 12:39:29 24 4
gpt4 key购买 nike

我希望我提出问题的方式是正确的,尽管我可能是错的。基本上,我有一个包含术语 vector 、位置和偏移量的索引,并且我希望能够执行以下操作:当我看到单词“do”时,检查下一个单词是否是“you”。如果是这样,请将这两个单词视为一个短语以进行评分。我这样做是为了避免拆分经常一起使用的单词。而不是像这样按分数排序的单词列表,

do 
want
you
come
to

我希望看到更多类似的东西

do you
want
come
to

最佳答案

一种解决方法是按单词和短语建立索引,因此您的评分列表将是:

do you
want
come
to
do
you

如果您在索引过程中对短语进行增强,您就会更接近目标。但这取决于匹配的短语是否应始终高于其单个单词的排名。

也许也值得一看 Boosting Lucene Terms When Building the Index .

关于java - 如何用 Lucene 查找短语?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25254220/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com