gpt4 book ai didi

Elasticsearch 查询性能下降

转载 作者:行者123 更新时间:2023-11-29 02:52:55 26 4
gpt4 key购买 nike

我们已经设置了 7 个节点的 elasticsearch 集群。每个节点的配置如 16G RAM,8 核 cpu,centos 6

Elasticsearch 版本:1.3.0
堆内存是 - 9000m

1 Master (Non data)
1 Capable master (Non data)
5 Data node

有 10 个索引,其中一个索引有 5500 万个文档 [254Gi(508Gi 副本)] 大小其余所有索引有大约 20k 个文档。

每 1 秒就有 5-10 个新文档被索引。

但问题是搜索有点慢。几乎取 2000 毫秒5000 毫秒 的平均值。一些查询在 1 秒内。

映射:

{
"my_index": {
"mappings": {
"product": {
"_id": {
"path": "product_refer_id"
},
"properties": {
"product_refer_id": {
"type": "string"
},
"body": {
"type": "string"
},
"cat": {
"type": "string"
},
"cat_score": {
"type": "float"
},
"compliant": {
"type": "string"
},
"created": {
"type": "integer"
},
"facets": {
"properties": {
"ItemsPerCategoryCount": {
"properties": {
"terms": {
"properties": {
"field": {
"type": "string"
},
"size": {
"type": "long"
}
}
}
}
}
}
},
"fields": {
"type": "string"
},
"from": {
"type": "string"
}
"id": {
"type": "string"
},
"image": {
"type": "string"
},
"lang": {
"type": "string"
},
"main_cat": {
"properties": {
"Technology": {
"type": "double"
}
}
},
"md5_product": {
"type": "string"
},
"post_created": {
"type": "long"
},
"query": {
"properties": {
"bool": {
"properties": {
"must": {
"properties": {
"query_string": {
"properties": {
"default_field": {
"type": "string"
},
"query": {
"type": "string"
}
}
},
"range": {
"properties": {
"main_cat.Technology": {
"properties": {
"gte": {
"type": "string"
}
}
},
"sub_cat.Technology.computers": {
"properties": {
"gte": {
"type": "string"
}
}
}
}
},
"term": {
"properties": {
"product.secondary_cat": {
"type": "string"
}
}
}
}
}
}
},
"match_all": {
"type": "object"
}
}
},
"secondary_cat": {
"type": "string"
},
"secondary_cat_score": {
"type": "float"
},
"size": {
"type": "long"
},
"sort": {
"properties": {
"_uid": {
"type": "string"
}
}
},
"sub_cat": {
"properties": {
"Technology": {
"properties": {
"audio": {
"type": "double"
},
"computers": {
"type": "double"
},
"gadgets": {
"type": "double"
},
"geekchic": {
"type": "double"
}
}
}
}
},
"title": {
"type": "string"
},
"product": {
"type": "string"
}
}
}
}
}
}

我们正在使用默认分析器
有什么建议吗?这个配置还不够吗?

最佳答案

看起来索引无法放入内存,因此将进行更多的磁盘 I/O。你使用固态硬盘吗?如果没有,你应该买一些。

除此之外,您的节点需要更多资源(内存、CPU)来处理该索引大小。

我对这里的大小感到有点惊讶:“仅仅”5500 万个文档的 ~250 GB 是巨大的,而且我没有看到你在那里存储任何更大的 blob(我可能错了,很难从映射定义)。也许您可以考虑保留一些数据不进行分析,以防您不需要查询它,而只是检索它。这将减少索引大小。

除此之外我没有其他想法,因为我不了解所有相关基础设施的更多细节。

关于Elasticsearch 查询性能下降,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26628959/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com