gpt4 book ai didi

algorithm - 减少 filenet 对象存储之间的搜索次数以根据文档创建时间查找文档的最佳方法?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:26:36 24 4
gpt4 key购买 nike

例如,有 5 个对象存储。我正在考虑将文档插入其中,但不是按顺序插入。最初它可能是顺序的,但如果我可以使用某种排名方法插入,那么就更容易知道要搜索哪个对象存储来查找文档。目标是减少对象存储搜索的次数。这只有在插入使用某种智能算法时才能实现。

我发现一种有用的方法是使用当前年份的 MOD N(对象存储的数量)来确定文档的去向。我们能否对此有一些更好的方法?

最佳答案

如果您想要快速访问,有几个标准:

  1. 哈希函数必须可根据查询的数据进行重现。这意味着,很大程度上取决于您期望的查询。

  2. 您通常希望在商店中尽可能均匀地分配您的对象。如果你想并行,你想访问来自不同商店的给定查询的每个文档,这样它们就不会互相阻塞。因此,您的散列函数应尽可能分散到类似文档的不同商店。如果您希望与同一查询相关的文档来自同一年,请不要直接使用年份。

假设您希望能够进行可并行化的快速查询。相反,如果您有一个系统,在该系统中您首先必须打开一个可能代价高昂的存储连接,那么与同一查询相关的大多数文档都应该放在同一存储中,您不应该采纳我上面的建议。

关于algorithm - 减少 filenet 对象存储之间的搜索次数以根据文档创建时间查找文档的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9952554/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com