gpt4 book ai didi

sql-server-2005 - 使用 SQL Server 2005 模糊匹配可能重复项的良好 SQL 策略

转载 作者:行者123 更新时间:2023-12-04 07:01:44 25 4
gpt4 key购买 nike

我想在一个大型数据库中找到可能的候选重复记录匹配像 COMPANYNAME 和 ADDRESSLINE1 这样的字段

例子:

对于具有以下 COMPANYNAME 的记录:

  • “Acme, Inc.”

  • 我希望我的查询以这些 COMPANYNAME 值作为可能的重复输出其他记录:
  • “Acme 公司”
  • "Acme, Incorporated"
  • “极致”

  • 我知道如何进行连接、相关子查询等,以完成提取我想要的数据集的机制。我知道这之前已经在这里讨论过。我有兴趣听到关于进行模糊搜索的最佳方法的想法 - 我应该使用全文索引还是 soundex 函数或其他我不知道的方法? (我使用的是 SQL Server 2005)

    任何帮助表示赞赏!

    最佳答案

    这当然取决于您的确切要求,但在 SQL 中使用 CONTAINS 使您能够执行邻近搜索以及主题搜索和模糊搜索。

    http://www.developer.com/db/article.php/3446891/Understanding-SQL-Server-Full-Text-Indexing.htm

    http://msdn.microsoft.com/en-us/library/ms187787(SQL.90).aspx

    关于sql-server-2005 - 使用 SQL Server 2005 模糊匹配可能重复项的良好 SQL 策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1731440/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com