Cas*_*sie 5 algorithm search-engine pagerank google-search
我正在学习PageRanking算法,对一些新手问题感到抱歉.我知道PR值是通过对自身的传入链接的总和来计算每个页面的.
现在,我对维基百科上的 "PageRank值总和为1"的声明感到困扰.
如维基百科所示,如果每个页面都有一个出站链接,那么每个页面的整体概率总和应为1.但是,如果页面在示例中没有任何出站链接(例如页面A),那么求和值不应该是值1对吗?
因此,Pagerank算法是否必须假设每个页面至少有一个出站链接?有人可以详细说明Pageranking如何在没有任何传入或传出链接的情况下处理页面吗?公式将如何相应变化?谢谢
ami*_*mit 11
由于在原始文章和维基百科文章中描述了页面排名,因此确实没有out-degree(v)=0为某些人定义v,因为你得到P(v,u)=d/n+(1-d)*0/0- 这是未定义的
没有传出边缘的节点称为悬空节点,基本上有3种常用方法可以处理它们:
(u,v)如果out-degree(v) = 0,对于(v,u)作为边缘).关于没有传入节点的页面 - 这应该不是问题,因为一切都是完美定义的.这样的节点将具有精确的页面排名d/n- 因为您只能通过从任何节点进行随机冲浪来达到它 - 这就是它的概率.
希望能回答你的问题!