- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我需要在导入过程中匹配美国邮政地址。问题是地址行可以用几种不同的方式输入。示例:
123 Main Street
123 Main St.
123 Main St
如何标准化地址以便进行匹配?我们一次导入 10,000 个地址,所以我不想使用 Google、Yahoo 或 USPS 等服务。是否有非 COM 组件的用于地址标准化的开源或商业库?我不关心地址是否真实,我只关心匹配。
最佳答案
这种事情很复杂。有些公司完全基于提供此功能。
我不建议进行此操作,现有的库和服务可以执行此操作:
https://www.usps.com/business/address-management-products.htm
http://smartystreets.com/products/liveaddress-api
如果这些都不是选项,并且如果引用的链接 ( Address Match Key Algorithm ) 对您没有帮助,您基本上必须将所有内容归结为一些共同点。例如将字符串拆分为组成部分(街道编号、街道编号后缀、单元/套房编号、街道名称、街道类型和街道方向)。然后,将每个(如果适用)的所有可能缩写转换为该公分母。在街道类型“St.”的情况下,您可以选择“街道”作为公分母,在这种情况下您将转换“St.”。或“St”到“Street”,然后进行任何匹配——假设数据库中的所有数据都包含该街道类型的“street”。
关于c# - 如何匹配不同的邮政地址?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12306215/
我想检查一个列字符串是否包含在另一列中。 表电子邮件列表: complete_email --------------------------------- zazumba@hotma
我有字符串 'test\data'或者只是一个反斜杠符号 '\' . 它如何转换为bytea? 最佳答案 如果从 到 bytea 转换,则后冲需要特殊处理见 src/backend/utils/adt
我有一个 jQuery Mobile 应用程序与 WCF REST 服务进行通信。我对 REST 服务的大部分调用都是 GET。但是,有一个函数使用带有 JSON 数据的 POST。 POST 在我们
具有以下内容: engine = sqlalchemy.create_engine(url) df = pd.DataFrame({ "eid": [1,2], "f_i": [123
在我的名为 Payment 的 API Controller 中,我有以下方法: [HttpPost] public HttpResponseMessage Charge(Payment paymen
需要将更新的 html 从前端发送到我的 spring mvc Controller 。如果我的文件大小超过 1MB, Controller 会将我返回 ajax 调用的 302 重定向。 下面的代码
我的所有照片上都有 GPS 坐标。我想包括城市、州、 zip 等的标签/IPTC 数据。但是我只有 GPS 坐标。我怎样才能以自动化的方式获取这些并获得有意义的信息(我有成千上万张照片,所以将每一张都
我是一名优秀的程序员,十分优秀!