gpt4 book ai didi

sql - 如何在全文搜索中处理噪声词 (NN)

转载 作者:行者123 更新时间:2023-12-04 21:50:38 24 4
gpt4 key购买 nike

我们正在使用全文搜索来检查邮政编码和地址,我们发现NNx ,其中 x 是一个数字,被认为是一个干扰词。我们知道这个问题,但想不出一个干净的解决方案,除了检查搜索词是否包含 NN然后使用 LIKE反而。

我们正在使用此代码。

SELECT  DISTINCT
*
FROM CONTAINSTABLE(dbo.AddressData, Data, N'NN1', 1000) C
INNER JOIN dbo.AddressData AD ON AD.Id = C.[KEY]
INNER JOIN dbo.Address A ON A.Id = AD.AddressId

有没有人对如何逃避或阻止全文将 NN 视为干扰词有任何想法?

更新:
我们添加了一个 if 来检查输入字符串中的 NN,如果 NN 存在,我们只使用 Like 来代替,但这对性能有很大影响。从不到一秒到超过 5 秒:/有人有更好的解决方案吗?

最佳答案

您正在使用 SQL 服务器对吗?

从 SQL Server 2005 开始,干扰词已被停用词取代。
您可以编辑“停用词列表”,使 NNx 不再是停用词。

https://docs.microsoft.com/en-us/sql/relational-databases/search/configure-and-manage-stopwords-and-stoplists-for-full-text-search?view=sql-server-2017

关于sql - 如何在全文搜索中处理噪声词 (NN),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42200667/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com