Page Rank 算法

以前 筛选关键字, 提取概要 的时候 用过PR算法,当时的目标是需要从 分词的结果里面提取出重要的词,现在重新温故下。

PR算法的最终目标是达到一个平衡,在一个大小个数确定的网络里面,最后每个节点每次迭代的值是确定的,

我见到挺多博客是通过 模拟人的行为,比如进入一个环形 队列之后,可能每次都是由外部节点分配权重给 闭环内部的,而却很少向外部分配权重,是不利于pr的准确计算的,需要模拟一个随机概率到任一节点的请求概率。

我觉得 可以话说的更直白一点,每次迭代过程中,衰减因子的作用,整个静态网络的 权重值是不断衰减的,比如最初权重总和 为N吧,然后因为衰减的存在,不论是什么样的存在重新分配过程,最后的权重总和 一定是 factor * N,然后 若干次迭代之后,就会趋近于零,so,为了一个稳定的动态 存在,所以需要向每个节点添加随机请求,保证每个节点最终衰减的,与添加的平衡。

假定 节点 n 个,每次添加 随机请求的概率为 t 则, n * t = N * ( 1 – factor), 解释为,在整个网络中每次添加的随机请求与每次衰减的请求相当,则为稳定状态。

Leave a comment

Your email address will not be published.

*