Pageranking算法如何在没有出站链接的情况下处理网页?

Cas*_*sie 5 algorithm search-engine pagerank google-search

我正在学习PageRanking算法,对一些新手问题感到抱歉.我知道PR值是通过对自身的传入链接的总和来计算每个页面的.

现在,我对维基百科上的 "PageRank值总和为1"的声明感到困扰.

如维基百科所示,如果每个页面都有一个出站链接,那么每个页面的整体概率总和应为1.但是,如果页面在示例中没有任何出站链接(例如页面A),那么求和值不应该是值1对吗?

因此,Pagerank算法是否必须假设每个页面至少有一个出站链接?有人可以详细说明Pageranking如何在没有任何传入或传出链接的情况下处理页面吗?公式将如何相应变化?谢谢

ami*_*mit 11

由于在原始文章和维基百科文章中描述了页面排名,因此确实没有out-degree(v)=0为某些人定义v,因为你得到P(v,u)=d/n+(1-d)*0/0- 这是未定义的

没有传出边缘的节点称为悬空节点,基本上有3种常用方法可以处理它们:

  1. 从图中消除此类节点(并迭代地重复该过程,直到没有悬空节点.
  2. 考虑这些网页链接回链接到他们的网页(即-每个边缘(u,v)如果out-degree(v) = 0,对于(v,u)作为边缘).
  3. 将悬空节点链接到所有页面(通常包括其自身),并有效地使从该节点1随机跳转的概率.

关于没有传入节点的页面 - 这应该不是问题,因为一切都是完美定义的.这样的节点将具有精确的页面排名d/n- 因为您只能通过从任何节点进行随机冲浪来达到它 - 这就是它的概率.

希望能回答你的问题!