gpt4 book ai didi

java - Shingle filter factory startOffset 必须是非负数,endOffset 必须 >= startOffset

转载 作者:搜寻专家 更新时间:2023-11-01 00:56:53 25 4
gpt4 key购买 nike

我将 lucene 4.4 版与这些分析器一起使用:

worddelimeter, patternFilter, synonyms, lowercase,
stopwords, kStemFilter, shingle, trimfilter.

分析器按照我使用它们的顺序列出。当我尝试添加文档时出现以下异常:

startOffset must be non-negative, and endOffset must be >= startOffset,
startOffset=37571,endOffset=37569

此异常仅针对特定文件发生。但是,当我更改顺序并将 stopwords 过滤器放在 worddelimeter 之前时,它工作正常。但这不是正确的做法!

为什么会这样?在什么情况下,一个过滤器会以某种方式更改数据以导致该异常?

最佳答案

这不是你的问题,这是 WordDelimiterFilter 中的一个已知限制/错误。参见 https://issues.apache.org/jira/browse/LUCENE-5111 Rob Muir 今天添加了一个补丁,看来您对 Lucene 4.8 很幸运。

关于java - Shingle filter factory startOffset 必须是非负数,endOffset 必须 >= startOffset,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20324016/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com