- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我将 lucene 4.4 版与这些分析器一起使用:
worddelimeter, patternFilter, synonyms, lowercase,
stopwords, kStemFilter, shingle, trimfilter.
分析器按照我使用它们的顺序列出。当我尝试添加文档时出现以下异常:
startOffset must be non-negative, and endOffset must be >= startOffset,
startOffset=37571,endOffset=37569
此异常仅针对特定文件发生。但是,当我更改顺序并将 stopwords
过滤器放在 worddelimeter
之前时,它工作正常。但这不是正确的做法!
为什么会这样?在什么情况下,一个过滤器会以某种方式更改数据以导致该异常?
最佳答案
这不是你的问题,这是 WordDelimiterFilter 中的一个已知限制/错误。参见 https://issues.apache.org/jira/browse/LUCENE-5111 Rob Muir 今天添加了一个补丁,看来您对 Lucene 4.8 很幸运。
关于java - Shingle filter factory startOffset 必须是非负数,endOffset 必须 >= startOffset,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20324016/
我正在尝试将“contenteditable”div 中的选定文本包装到给定标签中。下面似乎工作正常,但 startOffset/endOffset 不包含 HTML 文本。我的问题是如何让 Rang
假设我有一个无限期运行的计时器任务,它遍历 kafka 集群中的所有消费者组,并为每个组的所有分区输出滞后、提交偏移量和结束偏移量。类似于 Kafka 控制台消费者组脚本的工作方式,除了它适用于所有组
我正在尝试重建 Range()使用 websockets 在客户端浏览器上对象。 https://jsfiddle.net/k36goyec/ 首先,我在我的浏览器中获取了 Range 对象和 Nod
这是 Microsoft Edge 浏览器的特定问题。我正在尝试使用 Range API 将 CSS 样式附加到选定的单词。当我尝试公开功能 range.endOffset 时,边缘浏览器出现问题。在
我将 lucene 4.4 版与这些分析器一起使用: worddelimeter, patternFilter, synonyms, lowercase, stopwords, kStemFilter
我已经使用 elastic 实现了搜索。下面是我的分析配置 $aAnalizerArray = [ "edgeTokenizer" => [ "tokeniz
我是一名优秀的程序员,十分优秀!