gpt4 book ai didi

database - 名字拼写的变化

转载 作者:太空狗 更新时间:2023-10-30 01:51:27 25 4
gpt4 key购买 nike

作为联系人管理系统的一部分,我有一个庞大的姓名数据库。人们经常编辑这个,结果我们遇到了以不同形式存在的同一个人的问题(John Smith 和 Jonathan Smith)。我研究了单词相似度,但很容易想到根本不相似的名称变体(Richard vs Dick)。我想知道是否有一个常见的英文名字变体列表,我可以用它来检测和更正此类错误。

最佳答案

我会爬取所有关于人名的维基百科页面(有可用的维基百科数据转储),例如 http://en.wikipedia.org/wiki/Teresa (来自 http://en.wikipedia.org/wiki/Category:English_given_names ),并创建一个索引,您可以使用该索引来建议人们正确的形式(您将根据数据库中名字变体的数量对它们进行排名)。不幸的是我不知道。这样的数据库。

关于database - 名字拼写的变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3809257/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com