ネットワークサイエンスのPageRankを完全理解した話

概要

  • Googleの検索エンジンで使われている(た)PageRankについての解説記事
  • 考え方としては「あるページが他のページによってどれくらい推薦されているか」
  • ユーザがランダムにページを変移していくというiterationを複数回回して、以下の値が収束するまで続ける
    • あるノードのランクは隣接するノードが持つランクをエッジ数で割った値にする
    • 初期値は単純に1をノード数で割った値などにする
  • 上のに対してさらに以下のような問題を解決して改良していく
    • 終端ノードではどこにもpathがないので、終端ノードの価値が0になってしまうのを防ぐために、randomにテレポートする
    • 終端ノードで自己回帰のpathがある場合、重要でもないに関わらずrank scoreが溜まってしまい大きな値を持ってしまう。これもrandomにテレポートすることで解決する。
  • 最終的には以下のような式
    • はどれくらい存在するエッジだけで遷移を行うかのパラメータでダンピングファクターという