gpt4 book ai didi

python - ElasticSearch超时错误:ReadTimeoutError(HTTPConnectionPool(host ='localhost',port = 9200):读取超时。(读取超时= 60))

转载 作者:行者123 更新时间:2023-12-02 23:07:25 28 4
gpt4 key购买 nike

我有一个在服务器上运行的ElasticSearch实例。当我尝试使用多处理对巨大的语料库建立索引时,出现很多超时错误。看来EasticSearch只能处理少量请求。我遵循了ElasticSearch网站中建议的配置。关于如何提高多处理设置的索引编制性能,是否有任何建议?我要添加文档的索引只有一个分片。

最佳答案

您可以做很多工作。

  • 首先,您需要设置refresh_interval。刷新间隔是添加的文档可用于搜索的时间。如果可以容忍,则将其至少设置为30秒或-1。我已经读到,这将使索引性能提高约70%。
  • 您可以尝试的第二件事是使用批量索引API而不是单个文档索引。
  • 在某些特殊情况下,禁用交换可以为您带来更高的性能。
  • 您可以尝试的其他选项之一是增加已分配给Elasticsearch的RAM大小。
  • 最后,增加用于索引的HEAP的大小可以提高写入性能。默认大小是所有堆大小的10%。

  • 希望以上几点对您有所帮助。

    关于python - ElasticSearch超时错误:ReadTimeoutError(HTTPConnectionPool(host ='localhost',port = 9200):读取超时。(读取超时= 60)),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64255263/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com