gpt4 book ai didi

duplicates - 匹配姓名/地址数据的工具

转载 作者:行者123 更新时间:2023-12-02 23:52:59 24 4
gpt4 key购买 nike

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

5年前关闭。




Improve this question




这里有一个有趣的问题。

我有一个 oracle 数据库,其中包含需要保持最新的名称和地址信息。

我们从许多不同的政府来源获取数据馈送,需要找出匹配项,以及是否使用数据更新数据库,或者是否需要创建新记录。

没有任何类型的唯一标识符可用于将记录联系在一起,并且数据质量并不总是那么好 - 总会有拼写错误、使用不同名称的人(即 Joe vs. Joseph)等。

我很想听听之前解决过此类问题的任何人的意见,了解他们是如何解决问题的,或者至少是自动化的部分。

最佳答案

活跃在该领域的每个主要软件公司都提供处理名称和地址解析、数据标准化、记录重复数据删除或匹配、记录链接/合并、生存等的解决方案套件。不过,它们都有点贵。

例如,Oracle 自己针对此问题的解决方案是产品“Oracle Data Quality (ODQ) for Oracle Data Integrator (ODI)”,它是其融合中间件堆栈的一部分。顾名思义,ODQ 需要 ODI(即,它是一个单独许可的附加模块,依赖于 ODI)。

IBM 的 Websphere 解决方案套件(通过收购 Ascential 获得)包括 QualityStage .

Business Objects 现在是一家 SAP 公司,拥有 Data Quality其企业信息管理 (EIM) 套件下的产品。

其他主要的数据质量品牌包括 Dataflux (SAS 公司)和 Trillium Software (一家 Harte-Hanks 公司)

Gartner Group 发布了数据质量解决方案套件的年度魔力象限。在这些魔力象限中评分较高的供应商通常会在其网站 ( example 1 , example 2 ) 上向注册用户在线提供整个报告。

关于duplicates - 匹配姓名/地址数据的工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46007/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com