gpt4 book ai didi

elasticsearch - Elasticsearch非常长字符串的完全匹配性能

转载 作者:行者123 更新时间:2023-12-03 00:10:22 29 4
gpt4 key购买 nike

我有一个用例:

我需要从单个URL中提取信息,并将每个信息另存为单独的数据单元,以显示在不同的页面中。当用户访问页面中的数据单元时,我希望列出来自同一原始URL的所有其他数据单元。

我打算将原始url字段定义为not_analyzed字符串字段,然后使用完全匹配来获取从原始url提取的所有片段。

我的问题是:

原始网址可能很长。 elasticsearch对非常长的字符串进行精确匹配的效率如何? Elasticsearch是否使用某种哈希算法(例如git's)进行长字符串精确匹配?

这个用例将被大量使用,因此对我来说很重要。

提前致谢。

最佳答案

要匹配not_analyzed归档文件中的确切文档,您可以使用术语查询:

Find documents that contain the exact term specified in the inverted index.



例如 :
POST _search
{
"query": {
"term" : { "url" : "google.com" }
}
}

就性能而言,我真的不能说。但是此查询将按原样匹配,并且不会对其进行任何转换,因为它将是 not_analyzed

关于elasticsearch - Elasticsearch非常长字符串的完全匹配性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41371688/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com