gpt4 book ai didi

sql - 数据质量 - SOUNDEX 是解决方案吗?

转载 作者:行者123 更新时间:2023-12-02 04:33:53 27 4
gpt4 key购买 nike

我所在的组织存在严重的名称数据质量问题。有十五个数据库包含有关人员的信息。例如:

Database 1
Name=Fre&d Blo-ggs DOB 01/01/1980

Database 2
Name=Freddy Bloggs DOB 01/01/1980

如果用户使用我的搜索工具搜索 Fred Bloggs,那么我希望找到这两条记录。我在想这样的事情:

SELECT * FROM Person WHERE Soundex('Fred Bloggs') = Soundex('Fre&d Blo-ggs')

是否建议像这样使用 Soundex 而不是像这样使用替换语句:

select Replace(Replace(Replace(Name,',',''),'&',''),'@') from Person
where Replace(Replace(Replace(Name,',',''),'&',''),'@') = @Name

@Name 是传入的变量。是否有更好的方法来做到这一点,例如使用正则表达式? Soundex 是否会影响性能。

最佳答案

好主意。但我不建议使用它。我认为“John Right”与“John Write”不同,尽管他们听到的意思是一样的。我的意思是,最后,重要的是你想要比较什么......如果你想比较名称声音是否相同,那么SOUNDEX就是很好。

但是,我建议以某种方式更正您的数据。这将是一个真正的解决方案,尽管我可以想象这不是一个简单的解决方案。

希望我有帮助!

关于sql - 数据质量 - SOUNDEX 是解决方案吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22435228/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com