gpt4 book ai didi

java - Lucene:处理撇号

转载 作者:行者123 更新时间:2023-11-30 10:50:21 27 4
gpt4 key购买 nike

我想在 Lucene 中处理撇号。让我们举个例子。我有以下句子:“L'arbre est vert”。我想知道如何在不带撇号的情况下创建对“arbre”一词的查询。使用 StandardAnalyzer,我需要写“L'arbre”才能得到肯定的答案。

注意这里有一个问题:Lucene Indexing to ignore apostrophes .但由于我是 Lucene 的新手,我想举一个例子(适用于 Lucene 5.3 的代码片段)。

最佳答案

看来您需要对法语进行更稳健分析的东西。我会考虑使用 FrenchAnalyzer . StandardAnalyzer 旨在提供可通过的与语言无关的分析。如果您想要对特定语言进行更智能的语言分析,您应该查看该语言的分析器。

对于“L'arbre est vert”,StandardAnalyzer 将其标记为:

  • 树丛
  • 测试
  • 垂直

FrenchAnalyzer 为您提供的地方:

  • 仲裁
  • 垂直

关于java - Lucene:处理撇号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35108381/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com