gpt4 book ai didi

google-app-engine - 谷歌应用引擎上的子字符串类型文本搜索

转载 作者:太空宇宙 更新时间:2023-11-03 15:32:59 24 4
gpt4 key购买 nike

我看到谷歌应用引擎现在添加了文本搜索:https://developers.google.com/appengine/docs/python/search/overview

这是否包括在字符串中搜索子字符串?

我问的原因是因为我以前写过一些代码,允许子字符串搜索字段,如姓名和电话号码。例如,您可以搜索“San”,它会找到类似“Mike DaSantos”的结果。这对于自动完成之类的东西来说很棒。

我遇到了成本问题,因为这需要大量的写操作。我这样做的每个字段都需要大约 O((n*n+1)/2) 次写操作,因为它涉及对字符串中每个字母子集的写操作。在为 6000 名客户编制电话号码、姓名、电子邮件地址和地址索引时,这增加了数美元的应用引擎成本。

我想知道使用搜索 API 是否可以以更低的成本提供此功能?

非常感谢!

最佳答案

不,它没有。

我们唯一可以搜索的“通配符”是复数。

~"car"  # searches for "car" and "cars"

不过,它可以做的是在同一个字段中保存多个标记。在 TextSearchServlet 查看他们的示例

  StringTokenizer tokenizer = new StringTokenizer(tagStr, ",");
while (tokenizer.hasMoreTokens()) {
docBuilder.addField(Field.newBuilder().setName("tag")
.setAtom(tokenizer.nextToken()));
}

例如,您可以查询“nametag”字段,假设您将名称标记化到其中,返回“Mike DaSantos”

  Results<ScoredDocument> results = getIndex().search("nametag:San"); 

我不是很清楚这里的成本和配额。

关于google-app-engine - 谷歌应用引擎上的子字符串类型文本搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11910479/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com