gpt4 book ai didi

algorithm - 关于网页排名的疑问

转载 作者:可可西里 更新时间:2023-11-01 14:22:12 26 4
gpt4 key购买 nike

我正在尝试使用 Mapreduce 查找维基百科的内部页面排名。我在一小部分维基页面上实现了我的 Pagerank 算法。有6349页。我使用这个公式来计算 pagerank (d = 0.85)。

enter image description here

我想验证所有 pagerank 的总和是否等于页面总数(6349)。

到目前为止我发现了什么:

1.所有6349个页面的总排名为1001.26044

2.根据WikiPedia如果我使用上述公式,则 每个 PageRank 乘以 N,总和变为 N。我将每个页面排名乘以 N (6349) 并计算总和,我得到了 6356789.5

页面排名总和不等于页面总数是否有原因?我应该使用第二个公式来验证吗?

enter image description here

注意:我运行 mapreduce 代码 10 次迭代以获得良好的近似值。

最佳答案

我想,您的迭代太少了。为什么是 10?为什么是 100?还是 100000?您应该数一数,最后两次更改的中值或最大值是多少。并由此评估可能的错误。

而 PR 是一个概率。所有这些的总和应该是1! “所有 pagerank 的总和等于总页数”这句话是错误的。

至于另一个公式,属于另一个模型,另一个PR。当然,你也可以使用它。或两者。但是你不能检查使用它。

关于algorithm - 关于网页排名的疑问,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13572763/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com