gpt4 book ai didi

Lucene.NET - 包含 "and"的搜索短语

转载 作者:行者123 更新时间:2023-12-01 12:49:16 24 4
gpt4 key购买 nike

寻求有关在 Lucene 查询中处理 & 符号和单词“and”的建议。我的测试查询是(包括引号):

  • “石油和天然气田”(完整短语)
  • “研究与开发”(完整短语)
  • “r&d”(完整短语)

理想情况下,我想使用QueryParser,因为输入来自用户。

在测试和文档阅读过程中,我发现使用 StandardAnalyzer 并不能满足我的需求。对于前两个查询,QueryParser.Parse 将它们转换为:

contents:"oil gas field"
contents:"research development"

这不是我想要的。如果我改用 PhraseQuery,则不会得到任何结果(可能是因为“and”未编入索引。

如果我使用 SimpleAnalyzer,那么我可以找到短语,但 QueryParser.Parse 将最后一个术语转换为:

contents:"r d"

这又不完全是我想要的。

有什么建议吗?

最佳答案

如果你想搜索“and”,你必须对其建立索引。编写您自己的分析器或从停用词列表中删除“and”。这同样适用于“研发”。编写您自己的分析器,从文本中创建 3 个单词:“r”、“d”、“r&d”。

关于Lucene.NET - 包含 "and"的搜索短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1430049/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com