Googles PageRank Algoritme

Komplet matematisk guide til Googles grundlæggende link-analyse algoritme

Henrik Bondtofte
20 min læsning
Matematisk guide
Google PageRank algoritme illustration
PR(A) = (1-d) + d × Σ(PR(Ti)/C(Ti))

Indholdsfortegnelse

Hvad er PageRank?

PageRank er navnet på den linkanalyse-algoritme, som Sergey Brin og Larry (Lawrence) Page opfandt på Stanford University, og samtidig den formel, som var bevæggrund for stiftelsen af Google.

Mange tror fejlagtigt, at PageRank ikke længere er en del af Googles algoritmer. Det er vigtigt at forstå, at PageRank er en af Googles grundstene og en hel essentiel del af Google.

I al sin enkelthed går formlen ud på at påsætte numeriske værdier til hyperlinks for på denne måde at måle en sides relative vigtighed. Med andre ord er PageRank en popularitetsalgoritme baseret på henvisningsanalyser.

Navnets oprindelse

Det var Larry selv, der lagde navn til formlen og deraf navnet PageRank. Det hedder dermed ikke PageRank, fordi værdien dækker over et website som helhed. PageRank akkumuleres på alle sider på et website, som Google har adgang til, og ikke på domæneniveau.

Almindelig misforståelse

PageRank pålægges på sideniveau, og det betyder, at der ikke er noget, der hedder eksempelvis et PageRank-4-domæne. Det vil hedde et website med en forside, der har en PageRank på 4 – det er ikke selve domænet.

Historien bag PageRank

1996

Opfindelsen

Larry Page og Sergey Brin udvikler BackRub (senere Google) på Stanford University

Første iteration af PageRank algoritmen baseret på citation analysis

1998

Patent indgivelse

Stanford University indgiver patent på PageRank algoritmen

Patent US6285999B1 beskriver den matematiske algoritme i detaljer

1998-2000

Google stiftelse

Google Inc. grundlægges med PageRank som kernealgoritme

PageRank bliver den primære ranking-faktor for søgeresultater

2000-2013

Toolbar PageRank

Google Toolbar viser offentlige PageRank værdier (0-10 skala)

Webmasters kan se deres siders PageRank score i Google Toolbar

2013

Toolbar nedlagt

Google stopper med at opdatere offentlige PageRank værdier

PageRank bliver internt Google-værktøj, ikke længere offentligt tilgængeligt

2016+

Moderne implementering

PageRank integreres med hundredvis af andre ranking-signaler

Stadig fundamentalt for Google, men kombineret med machine learning

Den oprindelige PageRank formel

Basis PageRank Formel

PR(A) = (1-d) + d × Σ(PR(Ti)/C(Ti))

PR(A) = PageRank for side A

d = Damping factor (typisk 0.85)

PR(Ti) = PageRank for side Ti der linker til A

C(Ti) = Antal udgående links fra side Ti

Forenklet version

Formlen i dens oprindelige form deler vægten ligeligt mellem de links der findes på en side, uanset om det er interne eller eksterne links.

Værdi = PageRank + (PageRank fra kilder × 0.85) / antal links

Praktisk eksempel

Har du eksempelvis 10 udgående links på en side, overfører hvert link 10% af den PageRank-værdi, du har mulighed for at overføre.

PageRank ÷ 10 links = 10% per link

Matematisk analyse

Matrix repræsentation

PageRank kan udregnes ved hjælp af matrix algebra, hvor web'et repræsenteres som en transition matrix M:

M = d × H + (1-d)/N × J

Hvor:
H = Link matrix (hij = 1/L(j) hvis j linker til i, ellers 0)
J = Matrix af kun 1'ere 
N = Antal sider
d = Damping factor

Egenvektorberegning

PageRank vektoren er den dominerende egenvektor af transition matrix M:

π = M × π

Hvor π er PageRank vektoren og M er transition matrix

Konvergenskriterier

Algoritmen konvergerer når forskellen mellem iterationer er tilstrækkelig lille:

||π(k+1) - π(k)|| < ε

Hvor ε typisk er 10⁻⁶ for høj præcision

Damping Factor (0.85)

Hvad er damping factor?

Damping factor (d = 0.85) repræsenterer sandsynligheden for at en bruger fortsætter med at klikke på links, i stedet for at begynde en ny søgning. Med andre ord er der 85% chance for at følge et link og 15% chance for at hoppe til en tilfældig side.

Med damping factor (d = 0.85)

  • ✓ Forhindrer ranking manipulation
  • ✓ Håndterer dangling nodes (sider uden udgående links)
  • ✓ Sikrer konvergens af algoritmen
  • ✓ Modellerer realistisk brugeradfærd

Uden damping factor (d = 1.0)

  • ✗ Rank sinks (sider der samler al PageRank)
  • ✗ Algoritmen konvergerer ikke altid
  • ✗ Mere sårbar over for manipulation
  • ✗ Urealistisk brugermodel

Matematisk betydning af damping factor

15%
Random teleport
(1-d) component
85%
Link following
d × link component
~100
Iterationer
til konvergens

Iterativ beregningsproces

PageRank beregnes iterativt, hvor hver iteration forbedrer estimatet af alle siders PageRank værdier:

Iterativ algoritme

1. Initialiser: PR⁰(i) = 1/N for alle sider i
2. For k = 0, 1, 2, ... indtil konvergens:
   PR^(k+1)(i) = (1-d)/N + d × Σ(PR^k(j)/L(j))
   hvor j linker til i
3. Stop når ||PR^(k+1) - PR^k|| < ε
Iteration 0
Initial værdier
PR(i) = 1/N
Iteration 1-99
Konvergens proces
Gradvis stabilisering
Iteration 100+
Konvergens
Stable værdier

Matrix-baseret beregning

Adjacency Matrix Eksempel

For et simpelt 4-siders netværk kan vi repræsentere link-strukturen som en matrix:

     A    B    C    D
A  [ 0   1/2  1/2   0 ]
B  [1/3   0   1/3  1/3]  
C  [1/2   0    0   1/2]
D  [ 0    1    0    0 ]

Matrix H (link transition matrix)

Google Matrix Konstruktion

G = d × H + (1-d)/N × J

Hvor J er matrix af 1/N værdier:
     A     B     C     D
A  [0.25  0.25  0.25  0.25]
B  [0.25  0.25  0.25  0.25]
C  [0.25  0.25  0.25  0.25] 
D  [0.25  0.25  0.25  0.25]

Final Google Matrix (d=0.85)

       A      B      C      D
A  [0.0375  0.4625  0.4625  0.0375]
B  [0.3208  0.0375  0.3208  0.3208]
C  [0.4625  0.0375  0.0375  0.4625]
D  [0.0375  0.8875  0.0375  0.0375]

Network visualisering

Interactive PageRank Network

APR: 2.5BPR: 1.8CPR: 3.2DPR: 1.9

Visualisering forklaring

  • Node størrelse: Repræsenterer PageRank værdi
  • Pile: Viser link-retning
  • Animation: Simulerer PageRank flow
  • Farver: Blå = normal, Lilla = aktiv iteration

Praktiske beregningseksempler

Interaktiv PageRank Beregner

Beregning:

PR(A) = (1-d) + d × (PR(B)/L(B))

PR(A) = (1-0.85) + 0.85 × (5/10)

PR(A) = 0.150 + 0.425

PR(A) = 0.575

Eksempel 1: Simpel beregning

Side A får et link fra side B med PageRank 5.0

Side B har 10 udgående links

PR(A) = 0.15 + 0.85 × (5.0/10) = 0.15 + 0.425 = 0.575

Eksempel 2: Multiple links

Side A får links fra side B (PR=3.0, 5 links) og C (PR=2.0, 2 links)

PR(A) = 0.15 + 0.85 × (3.0/5 + 2.0/2) = 0.15 + 0.85 × 1.6 = 1.51

Moderne vs. original PageRank

Original PageRank (1998-2010)

  • • Primær ranking faktor
  • • Offentligt tilgængeligt (Toolbar)
  • • Simpel link-baseret algoritme
  • • Vulnerabel for manipulation
  • • Månedlige opdateringer

Moderne PageRank (2010+)

  • • En af hundredvis af faktorer
  • • Internt Google-værktøj
  • • Integreret med machine learning
  • • Spam-resistente forbedringer
  • • Real-time opdateringer

Moderne forbedringer

Personaliseret PageRank:

Justeret baseret på brugerens interesser og søgehistorie

Topical PageRank:

Vægtning baseret på emne-relevans og kontekst

TrustRank integration:

Kombineret med trust-signaler for spam-beskyttelse

Temporal faktorer:

Tidsmæssig vægtning af links og freshness-signaler

Begrænsninger og udfordringer

Manipulation og spam

  • • Link farms og PBN netværk
  • • Artificielle link exchanges
  • • Køb af links for manipulation
  • • Comment spam og forum spam

Tekniske udfordringer

  • • Computational kompleksitet for milliarder af sider
  • • Dangling nodes (sider uden udgående links)
  • • Spider traps og infinite loops
  • • Skalering til real-time opdateringer

Konceptuelle begrænsninger

  • • Fokus kun på link-popularitet, ikke indhold
  • • Bias mod ældre, etablerede websites
  • • Ignorerer bruger-intentioner og kontekst
  • • Static model vs. dynamisk web

PageRanks betydning i dag

Stadig fundamental

PageRank er stadig en kernedel af Googles algoritme, selvom den nu fungerer i kombination med hundredvis af andre ranking-faktorer. Den grundlæggende idé om link-baseret autoritet forbliver central for hvordan Google vurderer websider.

~200
Ranking faktorer
PageRank er én af mange
25+
År aktiv
Siden 1998
Core
Status
Stadig fundamental

Praktiske implikationer for SEO

Links er stadig vigtige:

Kvalitets links fra autoritære sider har stadig høj værdi

Fokus på kvalitet:

Få links fra relevante, troværdige kilder

Interne links:

Distribuer PageRank strategisk på dit eget site

Holistisk tilgang:

Kombiner link-building med content og technical SEO

Vil du mestre moderne linkbuilding?

Nu hvor du forstår den matematiske baggrund for PageRank, kan du lære at anvende denne viden praktisk i moderne SEO og linkbuilding strategier.

Læs Linkbuildingbogen