gpt4 book ai didi

elasticsearch - 何时在Elasticsearch中为Edge N Gram创建分析链

转载 作者:行者123 更新时间:2023-12-02 23:23:02 25 4
gpt4 key购买 nike

我试图找出哪一种最适合增量搜索-edge n gramm或完成提示。到目前为止,我在Internet上阅读的内容表明,对于完成建议程序,数据处理是在创建索引时完成的,而对于边缘n gram,它是在查询时完成的,因此它比完成建议程序慢。但是就在Elasticsearch-definitve指南的那一刻,我读到了对于边缘n gram来说,它也是在索引时完成的。现在我真的很困惑,请问任何人都可以清除,但是边缘克在内部起作用。

谢谢

最佳答案

两者都在索引时间起作用,建立专用的数据结构:

  • N gram token 生成器生成 token :“hello world”变为“h”,“he”,“hel” ...“worl”,“world”。使用通常的“文本”(也称为“字符串”)映射类型。
  • 完成建议程序将生成一个图形:请参见https://www.elastic.co/blog/you-complete-me。此时,存在一个特殊的映射类型“completion”。

  • 在搜索时,建议者便宜一些:
  • N克标记器:

    必须分析
  • 输入的文本,搜索结果项:搜索的“Hello Wor”应分析为“hello” +“wor”,并搜索这两个术语。
  • 但是,应将N gram标记器从分析中删除(在搜索和索引编制之间使用不同的分析器):搜索“Henry”将被分析为“h”,“he”,“hen”,“henr” ...返回“hello”,因为它们共享相同的前缀“he”。
  • 完成建议程序更加简单快捷。如果您尝试使用键盘上的用户类型自动完成搜索,则性能非常重要。

  • 在这两种情况下,您都可以使用自定义分析链(法语,德语,soundex ...):
  • N克:
  • 编写时间:自定义分析+边缘ngram +键入“文本”
  • 阅读时间:定制分析+截断+搜索API
  • 完成
  • 编写时间:自定义分析+输入“完成”
  • 阅读时间:定制分析+建议API
  • 关于elasticsearch - 何时在Elasticsearch中为Edge N Gram创建分析链,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46542913/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com