gpt4 book ai didi

vector - 用于在向量空间中搜索的 NoSQL DB

转载 作者:IT王子 更新时间:2023-10-29 06:09:57 25 4
gpt4 key购买 nike

我对 NoSQL DBS(如 Cassandra、Mongo、Redis 等)完全陌生,我想创建这种类型的结构:

{
"item_id": "ABC1",
"x1": 0.55,
"x2": -0.29,
...
"x100": 0.17
}

基本上,我有数百万个项目和 100 个与每个项目关联的 float 。我的主要任务是搜索靠近给定 float 向量(在 100 维向量空间中)的项目,并获取例如前 k 个项目或距离小于 d 的所有项目。

是否有特别适合此类任务的 NoSQL 数据库?

感谢您的任何提示,帕特里克

最佳答案

据我所知,目前还没有数据库对非 (2|3)D 空间索引提供开箱即用的支持,但您可以在应用层内实现自己的索引。

一般来说,您希望有一个高效的 N 维最近邻搜索算法,如下所示:

  • 整体复杂度为 O(log N) 的 KD 树
  • 地理哈希

但要正确实现它们都非常棘手。

关于vector - 用于在向量空间中搜索的 NoSQL DB,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30489193/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com