gpt4 book ai didi

elasticsearch - 按字母顺序对关键字建立索引列表VS在Elasticsearch中根本不排序?

转载 作者:行者123 更新时间:2023-12-02 23:23:02 25 4
gpt4 key购买 nike

我正在使用elasticsearch使用standard analyzer存储关键字列表,如下所示:

{
id:1,
body_color:'silver,blue',
feature:'wifi,gps'
},
{
id:2,
body_color:'blue,red',
window_color:'yellow,white',
feature:'multi core,wifi'
}

是否按字母顺序对这些列表进行排序,例如)
{
id:1,
body_color:'blue,silver',
feature:'gps,wifi'
},
{
id:2,
body_color:'blue,red',
window_color:'white,yellow',
feature:'multi core,wifi'
}

是否需要更小的索引大小,因为标准更高,变化更少?它有助于标准化 token 吗?

最佳答案

首先,正如您所说,这些是关键字而不是文本。然后应使用keyword类型而不是文本类型,不分析关键字。

然后,您的文档应如下所示:

{
id:1,
body_color:'silver,blue',
feature:['wifi','gps']
},
{
id:2,
body_color:'blue,red',
window_color:['yellow','white'],
feature:'multi core,wifi'
}

关于排序的问题。当Elasticsearch分析字符串时,他正在应用以下内容:
  • 字符过滤器
  • token 生成器
  • token 过滤器

  • 字符过滤器将删除您不想索引的字符,例如HTML标记。此后, token 处理程序将应用于剩余的字符串,它将把您的字符串划分为 token 列表。最后一步, token 过滤器将删除列表中的某些 token ,例如停用词,然后将每个 token 添加到反向索引中,从而使它们可搜索。

    我认为对关键字进行排序不会提高索引的效率。

    关于elasticsearch - 按字母顺序对关键字建立索引列表VS在Elasticsearch中根本不排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46513671/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com