gpt4 book ai didi

Vespa - 质子 : Custom bucketing & Query

转载 作者:行者123 更新时间:2023-12-04 19:59:36 26 4
gpt4 key购买 nike

引用资料:

身份方案

Format: id:<namespace>:<document-type>:<key/value-pairs>:<user-specified>

http://docs.vespa.ai/documentation/content/buckets.html
http://docs.vespa.ai/documentation/content/idealstate.html

可以通过使用文档 ID 格式的 32 LSB(n/g 选择)在用户定义的存储逻辑中构建数据。

但是,关于如何根据预先做出的决定将查询路由到特定的桶范围,查询逻辑不是很清楚。

例如,如果我可以定义压缩范围的 n(数字),则可以将数据拆分为时间范围(开始时间/结束时间)。所有标记为此类的文档最终都将放在同一个存储桶中(这将遵循其根据配置的文档数量/大小进行拆分的过程)。

但是,我该如何针对以这种方式编制索引的数据编写搜索查询?是否可以指示处理器选择特定的存储桶或存储桶范围(以防分配算法可能移动了存储桶)?

最佳答案

您可以通过指定 streaming.groupname 查询属性在查询中选择一个桶。

要么在http请求中加入

&streaming.groupname=[group] 

或在

的搜索器中
query.properties().set("streaming.groupname","[group]").

如果您想要多个存储桶,请改用参数 streaming.selection,它接受任何文档选择 表达式:http://docs.vespa.ai/documentation/reference/document-select-language.html

要指定例如两个桶,请使用 set streaming.selection(在 HTTP 请求或搜索器中)

id.group=="[group1]" and id.group=="[group2]"

参见 http://docs.vespa.ai/documentation/streaming-search.html

请注意,只有在每个查询只需要搜索一个或几个桶时才应使用流式搜索。它避免了构建反向索引,这在这种特殊情况下(仅)更便宜。

关于Vespa - 质子 : Custom bucketing & Query,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46681642/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com