gpt4 book ai didi

java - 全文搜索是否支持无模式索引?

转载 作者:行者123 更新时间:2023-12-02 09:36:27 24 4
gpt4 key购买 nike

我正在尝试使用 Appengine 搜索 API 让用户查询多个数据集,每个数据集都有自己的架构。更具体地说:

用户可以访问多个数据集。每个数据集都有很多行。每个数据集都有一组列。每列都有一个名称和类型。跨数据集的列可能存在名称冲突,并且这些冲突可能具有不同的类型。

我希望用户能够通过对搜索 API 的一次查询来搜索所有数据集。如果我为每个数据集中的每一行创建一个文档,我怀疑当您对每个数据集中的所有字段进行并集时,将会有超过 1000 个不同的字段(其中一个字段 = 一列)。

我该如何解决这个问题?或者我是否必须构建多个索引(每个数据集一个)并发出多个请求?这些多个请求可以并行发生吗?这种方法的缺点/成本是什么?

最佳答案

一个好的起点是 python documents因为底层框架是相同的。话虽如此,YMMV 作为 Java 端仍然是实验性的。

并非文档中的每条记录都必须具有相同的类型。您所需要的只是一种从 document_id 到您的对象的方法,因此 : 在这里就可以了。但是,根据文档,

There is currently a limit of 1000 named fields for each a given index schema.

所以这对您来说可能是个问题。如果您不关心列上的匹配,您可以简单地将对象转换为具有单个字符串的文档,然后从那里进行文本搜索。然后所有内容都可以在一个列中。然后,您可以从 document_id 获取 : 并从数据存储中获取数据。

关于java - 全文搜索是否支持无模式索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12294522/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com