gpt4 book ai didi

elasticsearch - 如何通过检查特定字段来避免将重复文档插入Elasticsearch

转载 作者:行者123 更新时间:2023-12-02 22:47:41 32 4
gpt4 key购买 nike

我的索引中有一个hash_file字段,并希望通过检查此字段来防止插入重复的文档。

  • 如何在插入数据时(而不是在插入之前)检查?
  • 带有批量功能的
  • 我该如何检查?

  • ps:我用的是version6.8

    最佳答案

    为什么不使用hash_file字段的值作为文档ID,以便每个给定的哈希值都有唯一的文档,并且您不必担心检查重复项。当然,除非您特别需要文档具有某种类型的ID,然后再使用。

    如果您决定将哈希值用作_id,请记住
    _id的大小限制为512个字节,较大的值将被拒绝。

    希望这可以帮助。

    关于elasticsearch - 如何通过检查特定字段来避免将重复文档插入Elasticsearch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59116549/

    32 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com