gpt4 book ai didi

algorithm - 了解 PageRank 和类似算法背后的数学原理

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:03:29 24 4
gpt4 key购买 nike

我查看了本网站上提出的类似问题所提供的大量资源,目前最有帮助的是在此讨论中找到的,资源链接在这里:PageRank Explained. .

虽然这提供了详细的概述,但我正在寻找更具体的内容。虽然我意识到还有其他因素在起作用,并且算法自诞生以来已经发生了多次变化,但从每个链接传递的值的一个很好的指示是:PageRank 除以链接的总页数。因此,如果一个站点(页面)的 PR 为 8,并且链接到 20 个站点,则传递给每个站点的总值(value)为 8/20。至少我是这么认为的。我知道 PageRank 是一个介于 1 - 10 之间的对数值,这意味着从 PR 1 到 2 比 PR 9 到 10 困难得多。这就是我感到困惑的地方 - 如何计算数量PR 转移到每个链接。我非常简化事情,因为具有 PR 10 和大约 10 个出站链接的页面应该仍然比具有 2 个出站链接的 PR 5 站点传递更多的值(value)。在简单的层面上理解其背后正确数学的最佳方法是什么?

最佳答案

首先,值得注意的是,当前实现的 PageRank 与论文中的原始想法大不相同,并且由于它一直在变化,甚至该 SO 问题中的其他信息也不完全可靠。但我想基本面是相似的。

我认为 PageRank 在转换为对数刻度之前被划分,因此如果您的 PageRank 为 P 并且 n > 0 出站链接,则转移的 PR 将是(由于衰减因子,略小于)P - log_10名词因此,如果有 10 个链接,PR 将下降 1,如果有 100 个链接,则 PR 会下降 2,依此类推。当然,如果 n 为 0,则不会为其他页面提供 PageRank,这只是浪费。

关于algorithm - 了解 PageRank 和类似算法背后的数学原理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3841851/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com