gpt4 book ai didi

elasticsearch - 删除后,Crawler会重新索引记录吗

转载 作者:行者123 更新时间:2023-12-03 01:33:45 25 4
gpt4 key购买 nike

使用Storm Crawler 1.12.1和Elastic Search 6.5.2。我需要提高搜索引擎的效率。出于安全原因,在将文档索引到 flex 搜索中后,我删除了一些文档。所以我的问题是,storm爬虫将重新获取已删除的URL并重新建立索引吗?我不想重新抓取已删除的记录,如何实现?

最佳答案

我假设您从内容索引中删除了文档。它们可能仍在状态索引中,即使它们不在状态索引中,也可能会重新发现它们并将其添加回去。

最好的办法是将新条目添加到所用的URLfilters的任意一种中,以便覆盖这些URL,这样,即使重新发现它们也不会重新添加,然后从状态索引中删除它们。

关于elasticsearch - 删除后,Crawler会重新索引记录吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54077391/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com