gpt4 book ai didi

algorithm - 识别一个人的名字与字典中的单词

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:25:34 24 4
gpt4 key购买 nike

有没有什么方法可以识别一个词很可能是/不太可能是一个人的名字?

因此,如果我看到“理解”这个词,我会得到 0.01 的概率,而“约翰逊”这个词会返回 0.99 的概率,而像 Smith 这样的词会返回 0.75,像 Apple 这样的词会返回 0.15。

有什么办法吗?

目标是,如果有人搜索 Charles Darwin galapagos,搜索引擎会猜测它应该在作者字段中搜索 CharlesDarwin 以及 galapagos 的标题和摘要字段。

最佳答案

我的快速技巧是这样的:

从人口普查局获取按受欢迎程度排序的名单,它是免费提供的。给每个名字一个标准化的受欢迎程度得分(1.0 = 最受欢迎,0.0 = 最不受欢迎)。

然后,获取一本开源词典,并进行一些研究以汇总每个单词的频率分数。你可以找到一个 here, at wiktionary .为每个词分配一个流行度分数,从 1.0 到 0.0。方便的是,如果您无法在频率列表中找到某个词,您会假设它是一个非常不常见的词。

在两个列表中寻找一个词。如果它只是一个或另一个,你就完成了。如果两者都存在,请使用公式来计算加权概率......类似于(名称流行度)/(名称流行度+其他流行度)。如果它不在任何一个列表中,它可能是一个名字。

关于algorithm - 识别一个人的名字与字典中的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12290667/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com