Wo überall Statistik drin steckt – Der PageRank

Ich habe ja in der Vergangenheit schon mal darüber geschrieben, wo überall Statistik drin steckt, ohne dass man es vermutet. Beispielsweise warum die Straßenbahn Statistik braucht. Fast noch präsenter ist allerdings ein anderes Einsatzfeld, das sich fast jeder Leser jeden Tag nutzt, nämlich in Suchmaschinen.

Die dahinter stehende Statistik ist im Prinzip die Zahl der Links, die auf jede Seite verweisen oder von ihr ausgehen. Es gibt viele schönes Seiten mit vielen schönen Formeln. Wie im Statistiker-Blog üblich werde ich allerdings vesuchen, das System mit Worten verständlich zu erklären. Im ersten Teil gibt es alledings nur ein bisschen Hintergrund, die Erklärung folgt in den nächsten Beiträgen.

Soziogramm einer Gruppe. Darauf baut auch Googles Page Rank auf, das geht allerdings keine Ablehnung. Quelle: Wikipedia

Natürlich geht es nicht um irgendeine Suchmaschine, sondern um den Page Rank von Google. Das dahinter stehende System ist allerdings weit älter als das Internet. Es wurde im Prinzip bereits 1949 vom Soziologen John Seeley eingeführt und wenig später vom Statistiker Leo Katz in ein dem heutigen Page Rank schon sehr ähnliches Format gebracht. Während die Google Gründer Milliardäre wurden, ist Seeley in Wikipedia unbekannt, über Leo Katz findet man nur auf englisch ein paar Zeilen, in denen nicht viel mehr steht als dass er ein amerikanischer Statistiker war. Die Tatsache, dass die Grundidee zu dem Algorithmus recht alt war, hinderte das amerikanische Patentamt auch nicht daran, darauf ein Patent zu vergeben. Allerdings nicht an Google, sondern an die Stanford University. Google übertrug ihr für die exklusiven Nutzungsrechte Aktien, die 2005 für 335 Millionen US-Dollar verkauft wurden.

Den grundlegenden Text von Leo Katz kann man sogar online abrufen, leider nur gegen Bezahlung.

Gedacht wer er ursprünglich, um damit die Stellung von Personen in Gruppen beschreiben zu können. Mit Hilfe des Verfahrens sollte die Vernetzung der Akteuer auch quantitativ beschreiben zu können.

Tagged with: , ,

0 Comments on “Wo überall Statistik drin steckt – Der PageRank

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .