gpt4 book ai didi

sql - 比较两个非标准格式的地址

转载 作者:太空狗 更新时间:2023-10-30 01:52:10 26 4
gpt4 key购买 nike

我必须比较两个表中的地址,如果地址匹配则获取 Id。每个表有三列 Houseno, street, state两个表中的地址都不是标准格式。有大约。 50,000 行,我需要扫描

在某些地方是 Ave. Avenue Ave 。海峡街,ST。巷Ln。放置 PL Cir CIRCLE。与点或逗号或空格、hypen 的任意组合。我正在考虑将这三者结合起来,例如,在 SQL 或 PLSQL 中最好的方法是什么

表 1

     HNO         STR          State
----- ----- -----
12 6th Ave NY
10 3rd Aven SD
12-11 Fouth St NJ
11 sixth Lane NY
A23 Main Parkway NY
A-21 124 th Str. VA

表2

      id   HNO         STR          state
-- ----- ----- -----
1 12 6 Ave. NY
13 10 3 Avenue SD
15 1121 Fouth Street NJ
33 23 9th Lane NY
24 X23 Main Cir. NY
34 A1 124th Street VA

最佳答案

没有简单的方法可以实现您想要的。有一种昂贵的软件(谷歌的“地址标准化软件”)可以做到这一点,但很少是 100% 自动的。

这种类型的软件所做的是获取数据,使用复杂的启发式算法来尝试找出“官方”地址,然后返回(有时确信结果是正确的,有时是按以下顺序排序的结果列表信心)。

对于一小部分数据,软件根本无法运行,您必须自行修复。

关于sql - 比较两个非标准格式的地址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15227407/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com