gpt4 book ai didi

可筛选与可搜索的 Azure 搜索性能过滤表

转载 作者:行者123 更新时间:2023-12-02 09:19:48 26 4
gpt4 key购买 nike

全部,

预先感谢您的帮助。我们正在考虑使用 Azure 搜索在 Multi-Tenancy 系统上进行一些新开发。我有一个关于可搜索与可过滤的基本问题。当导入数据以从 documentdb 进行搜索时,int/float/date 类型不能标记为可搜索,只能过滤。这实际上就是我们想要的。我们使用 Lucene API 进行搜索,并且必须支持范围搜索。我的问题是,如果索引仅标记为“可过滤”与“可过滤 | 可搜索”,则该值仍然是“已索引”,因此搜索速度很快并且搜索不会导致“表扫描”(对使用 SQL 术语表示歉意)。

额外加分,是否有一个像 SQL Server 中那样的搜索查询分析器可以帮助我们解决这个问题?

史蒂夫

最佳答案

您是对的,只有 Edm.String 和 Collection(Edm.String) 类型的字段可以标记为可搜索。当字段被标记为可搜索时,它将在存储到索引之前进行断词等分析。与未标记为可搜索的同一字段相比,此分析的结果会导致索引中消耗额外的空间。

无法将定量字段类型(例如 Edm.Int32 或 Edm.DateTimeOffset)标记为可搜索,因为此类数据无法从词法分析中受益。但是,这些值仍将是 Azure 搜索索引的一部分,并且可以通过 filter expressions 以高性能方式进行查询。 ,它的行为不会像 SQL 中的“表扫描”。

遗憾的是,Azure 搜索没有类似于 SQL Server 的查询分析器。但是,Azure 搜索确实提供了 Analyze API查看提供服务的各种分析器如何处理可搜索文本。请随时将查询分析器的建议发布到我们的 User Voice网站。

希望这有帮助!

阿什什

关于可筛选与可搜索的 Azure 搜索性能过滤表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43726151/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com