gpt4 book ai didi

sql - Azure 搜索 - 处理不同格式的出生日期

转载 作者:行者123 更新时间:2023-12-03 03:07:00 26 4
gpt4 key购买 nike

我们的 SQL 数据库/Azure 搜索索引中有两个字段,其中包含多种格式的出生日期,包括所有不同序列的数字、单词及其任何变体。更复杂的是,这些字段中可能包含其他文本,例如“DOB”或人名。不幸的是,由于我们从世界各地提取这些数据的大量来源,因此我们无法实现一致性。

如何在 Azure 搜索中最好地处理这个问题?我们可以要求客户在查询中采用一致的强制 DOB 格式,但是 Azure 搜索是否可以采用这种格式并以多种不同的日期格式进行查找?我们是否应该寻找一种方法在表中创建一个新字段来尝试标准化出生日期?

最佳答案

可以帮助您解决此问题的一件事是 Microsoft 语言分析器,它会在可能的情况下尝试以不同格式标准化日期。您可以使用 Analyze API查看 Microsoft 英语分析器如何处理表示日期的文本。例如,对于以下请求

 {
"text": "2015/13/04",
"analyzer": "en.microsoft"
}

分析器生成一个表示标准化日期的标记:

dd20150413

请注意,分析器识别出数字 13 代表日期,03 代表月份。将为文本 April 13th 201513-04-2015 生成相同的标记。

这意味着,使用任何支持的格式进行搜索的用户都会将文档与被识别为相同的日期进行匹配。

如果 Microsoft 分析器的默认行为不够,您可以随时创建 custom analyzer以 Microsoft 分析器为核心。要了解有关搜索引擎的默认行为以及如何自定义它的更多信息,请阅读以下文章:How full text search work in Azure Search

关于sql - Azure 搜索 - 处理不同格式的出生日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43622961/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com