gpt4 book ai didi

java - 是否有用于 Lucene 的快速、准确的荧光笔?

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:30:11 24 4
gpt4 key购买 nike

我一直在使用 (Java) Highlighter for Lucene (在 Sandbox 包中)一段时间。但是,在匹配搜索结果中的正确术语时,这并不是非常准确 - 它适用于简单的查询,例如搜索两个单独的词将在结果中突出显示两个代码片段。

但是,它不能很好地处理更复杂的查询。在最简单的情况下,诸如“Stack Overflow”之类的短语查询将在突出显示中匹配所有出现的 Stack 或 Overflow,这给用户的印象是它工作得不是很好。

我尝试应用修复 here但这带来了很多性能问题,并且最终完全无法使用。性能尤其是通配符查询的问题。这是由于突出显示的工作方式;它不像 Lucene 那样处理查询字符串和文本,而是像 Lucene 那样解析它,然后查找 Lucene 进行的所有匹配;不幸的是,这意味着对于某些通配符查询,它可能会在大型文档中查找 2000 多个子句的匹配项,而且速度不够快。

有没有更快的准确荧光笔实现?

最佳答案

有一个新的更快的荧光笔(需要打补丁,但将成为 2.9 版的一部分)

https://issues.apache.org/jira/browse/LUCENE-1522

和一个back-reference对于这个问题

关于java - 是否有用于 Lucene 的快速、准确的荧光笔?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/82151/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com