gpt4 book ai didi

java - 在lucene中获取精确的短语索引

转载 作者:太空宇宙 更新时间:2023-11-04 08:15:26 27 4
gpt4 key购买 nike

我需要在 lucene 中获取精确短语的索引。我使用这个得到的一个单词的索引:

TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);

termFreqVector.indexOf(searchercWord) 返回搜索词的索引。

问题是我需要搜索一个短语,并且需要获取它的索引。如果我将一个短语传递给 termFreqVector,它总是返回 -1,但我 100% 确定该短语存在。有什么解决办法吗?

最佳答案

您需要手动执行此操作。例如,如果您的短语是 president obama,则需要查找 president 的所有位置 i,其中偏移量 i+1 处的术语是 obama

关于java - 在lucene中获取精确的短语索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10521921/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com