Wie Digg den Traffic verwaltet

25. April 2007 | WebDev

Ein, für mich, spannendes Thema ist die Verwaltung von extrem hohem Traffic auf Webseiten.

Was könnte also schöner sein, als einen Blick hinter die Kulissen von Digg.com werfen zu können?

Auf Computerworld.com bekommt man diesen Einblick, wenn auch nur sehr oberflächlich. Laut dem Artikel läuft die Website auf einem System mit dem Namen memcached, das für sehr dynamische Seiten designt wurde und die Datenbankauslastung vermindert. Bei einem, sich ständig ändernden, Angebot an News also keine schlechte Wahl für Digg.

Die Server-Architektur besteht aus 30 Webservern und 20 Datenbankservern mit einer Master-Datenbank, sowie einer Hand voll Server mit der Open-Source Java Bibliothek Lucene, die zum Durchsuchen von Texten benutzt werden.

Trotz der hohen Änderungsrate des Inhalts von Digg.com, können sich die Betreiber glücklich schätzen: 98% der Besucher rufen nur die Hauptseite auf um dann auf externen Seiten zu verschwinden. Bei so einer Trafficverteilung arbeitet man eigentlich nur noch für die restlichen 2%, die Digg intensiver benutzen. Die Startseite zu cachen ist nun wirklich nicht schwierig. ;)

Quelle: digg.


Antworten