Question

Je vais vous montrer 2 scénarios (N.B. d = facteur d'amortissement = 0,5)

Premier scénario : supposons avoir 4 noeuds A, B, C, D:

  • lien B, C, D sur A.

PageRank est: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

Je peux résoudre cette équation en mettant 0.25 sur PR(B)=PR(C)=PR(D) et je vais obtenir la valeur 0.875as. I ne pas besoin de résoudre tout système

Deuxième scénario : supposons avoir 4 noeuds A, B, C, D:

  • lien A sur B et C
  • lien B sur C
  • lien C sur A

De cette façon, PageRank sera:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

Je dois résoudre ce système pour obtenir le résultat. Je ne mets pas la 1/N sur PR(A), PR(B), PR(C) and PR(D)

En fait, je recherche sur internet la solution et les valeurs sont:

$ PR (A) = 14/13 = 1,07692308 $

$ PR (B) = 10/13 = 0,76923077 $

$ PR (C) = 15/13 = 1,15384615 $

Alors pourquoi deux scénarios semblables j'utilise 2 comportement différent?

quelqu'un l'espoir peut me aider :) Vive

Était-ce utile?

La solution

Les deux scénarios sont différents en raison de la symétrie dans le premier problème: B, C et D à liaison et sont liés aux mêmes pages (à savoir tous points à points A et rien pour eux). Par conséquent, leur rang de page sera le même, cela vous donne la contrainte supplémentaire que PR (B) = PR (C) = PR (D), vous permettant de résoudre le problème facilement.

Le deuxième problème n'a pas de symétrie et doit être résolu de longue main.

Autres conseils

On suppose un petit univers de quatre pages: A, B, C et D. Liens d'une page à lui-même, ou plusieurs liens sortants d'une seule page à une autre page, sont ignorés. PageRank est initialisé à la même valeur pour toutes les pages. Dans la forme originale du PageRank, la somme de PageRank sur toutes les pages est le nombre total de pages sur le Web à ce moment-là, de sorte que chaque page dans cet exemple aurait un PageRank initial 1. Cependant, les versions ultérieures de PageRank, et reste de cette section, on suppose une distribution de probabilité entre 0 et 1. Par conséquent la valeur initiale pour chaque page est de 0,25.

Le PageRank transféré d'une page donnée aux objectifs de ses liens sortants sur la prochaine itération est divisée à parts égales entre tous les liens sortants.

Si les liens que dans le système sont des pages B, C et D à A, chaque lien transférerait 0,25 PageRank à A lors de la prochaine itération, pour un total de 0,75.

PR (A) = PR (B) + PR (C) + PR (D)

Supposons maintenant que la page B avait un lien vers les pages C et A, page C avait un lien vers la page A, et page D avait des liens avec les trois pages. Ainsi, lors de la prochaine itération, page B transférerait la moitié de sa valeur existante, ou 0,125, à la page A et l'autre moitié, ou 0,125, à la page C. Page C transférerait toute sa valeur actuelle, 0,25, à la seule page, il lie à, A. Comme D avait trois liens sortants, il transférerait un tiers de sa valeur actuelle, soit environ 0,083, A. a l'issue de cette itération, page a aura un PageRank de 0,458.

PR (A) = \ frac {PR (B)} {2} + \ frac {PR (C)} {1} + \ frac {PR (D)} {3}. \,

En d'autres termes, le PageRank conféré par un lien sortant est égal à propre score PageRank du document divisé par le nombre de liens sortants L ().

PR (A) = \ frac {PR (B)} {L (B)} + \ frac {PR (C)} {L (C)} + \ frac {PR (D)} {L (D )}.

Dans le cas général, la valeur PageRank pour une page u peut être exprimée sous la forme:

PR (u) = \ sum_ {v \ in B_u} \ frac {PR (v)} {L (v)},

i.e.. la valeur PageRank d'une page u est fonction des valeurs de PageRank pour chaque page v contenu dans l'ensemble Bu (l'ensemble contenant toutes les pages de liaison à la page u), divisé par le nombre L (v) des liens de la page v.

Pour plus de requêtes visiter

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top