gpt4 book ai didi

algorithm - pageranking算法如何处理没有出站链接的网页?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:44:43 26 4
gpt4 key购买 nike

我正在学习 PageRanking 算法,很抱歉有一些新手问题。我知道 PR 值是通过对自身的传入链接求和来计算每个页面的。

现在,我对 wikipedia 处声明“PageRank 值总和为 1”的声明感到困扰。 .

如维基百科所示的例子,如果每个页面都有一个出站链接,那么每个页面的整体概率之和应该是 1。但是,如果页面没有任何出站链接,例如示例中的页面 A,则总和不应为值 1,对吗?

因此,Pagerank 算法是否必须假设每个页面至少有一个出站链接? 有人可以详细说明 Pageranking 如何处理没有任何传入或传出链接的页面吗?公式将如何相应地改变?谢谢

最佳答案

由于page-rank在原文中有描述,在维基百科的文章中,对于某些v,当out-degree(v)=0时确实没有定义>,因为你得到 P(v,u)=d/n+(1-d)*0/0 - 这是未定义的

没有出边的节点称为悬挂节点,基本上有 3 种常见的方法来处理它们:

  1. 从图中消除此类节点(并反复重复该过程,直到没有悬垂节点。
  2. 考虑将这些页面链接回链接到它们的页面(即 - 对于每条边 (u,v),如果 out-degree(v) = 0,将(v,u)视为一条边。
  3. 将悬挂节点链接到所有页面(通常包括它本身),并有效地使从该节点随机跳转的概率为1。

关于没有传入节点的页面 - 这应该不是问题,因为一切都已完美定义。这样一个节点的页面排名将恰好为 d/n - 因为您只能通过从任何节点随机冲浪才能到达它 - 这就是进入其中的概率。

希望这能回答您的问题!

关于algorithm - pageranking算法如何处理没有出站链接的网页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21507375/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com