Der menschliche Algorithmus – wie Relevanz im Social Web gemessen wird
03. Mai 2010, 20:08
Uhr
Auf Twitter werden 55 Millionen
Kurznachrichten produziert - am Tag. Auf Facebook
sind es sogar mehr als 60 Millionen Statusmeldungen. Dazu kommen noch Blogbeiträge
und Hunderttausende Videos, die von den mehr als eine Milliarde Internetnutzern
in aller Welt jeden Tag ins Netz gestellt werden. Die Flut der von den Nutzern
erzeugten Inhalte wird täglich größer - und damit das Problem, die wirklich
relevanten Inhalte zu finden. An dem Problem hat sich sogar Google bisher die Zähne ausgebissen.
„Das Sortieren der Inhalte aus den sozialen Medien ist eine unserer größten
Herausforderungen", sagte Google-Chef Eric Schmidt.
Konkret
geht es darum, die Relevanz dieser Inhalte
zu messen, zu bewerten und in eine Reihenfolge zu bringen. Relevanz ist dabei
meist persönlich zu nehmen: Welcher Inhalt für einen Nutzer wichtig ist, hängt
von Faktoren wie seinen Interessen, der Zeit und seinem Aufenthaltsort ab.
Beispiel Twitter: Der Kurznachrichtendienst liefert wie keine andere
Internetseite Informationen in Echtzeit.
Etwa jeder fünfte Tweet enthält einen Link auf einen Medieninhalt. Wer
aber nur wissen möchte, welche Rockband gerade im Park nebenan ein Konzert
gibt, wird ebenfalls fündig. Dafür genügt es meist, den Namen des Parks in die
Twitter-Suche einzugeben. Der Name der Band wird mit einiger Sicherheit in den
angezeigten Tweets der Konzertbesucher erscheinen. Diese Information ist in
diesem Fall relevant (beantwortet also die Frage des Nutzers), weil sie in
Echtzeit kommt, was in großem Stil nur im Social Web zustande kommen kann.
In
diesem Beispiel war es leicht, Relevanz über den Ort zu generieren. Aber gerade
auf Twitter mit seinen 55 Millionen Tweets am Tag ist das Herausfiltern
relevanter Inhalte eine große Herausforderung, an der viele Unternehmen
arbeiten. Auch Twitter selbst. Das Unternehmen hat den Dienst @TopTweets
entwickelt. „Top Tweets ist ein neuer Algorithmus, der Tweets identifiziert,
die das Interesse unserer Nutzer gefunden haben", sagte der
Twitter-Chefwissenschaftler Adbur Chowdhury dem Informationsdienst Search
Engine Land.
„Der Algorithmus schaut auf alle
Arten von menschlichen Interaktionen mit Tweets wie das Retweeten oder als
Favorit markieren, um die Tweets mit der größten nicht erwartbaren
Geschwindigkeit zu identifizieren", sagte Chowdhury.
Der
Punkt ist die Formulierung „nicht erwartbare Geschwindigkeit". Denn jeder
Twitterer erzeugt ein erwartbares Niveau an Aufmerksamkeit. Ashton Kutcher
(@aplusk) mit rund 5 Millionen Followern oder Sascha Lobo (@saschalobo) in
Deutschland mit mehr als 35000 Followern generieren sicher stetig Resonanz auf
ihre Tweets, aber es sollen eben nicht nur die Tweets der Promis auf @TopTweets
auftauchen. „Wir wollen Tweets von allen Nutzern herausheben und nicht die
Twitterer mit vielen Followern bevorzugen", sagte Chowdbury. Noch scheint
@TopTweets aber nicht die wirklich relevanten Ergebnisse zu liefern, denn der
Account hat bisher nur rund 50.000 Follower.
Auch
Google versucht sich daran, in seiner Echtzeitsuche
möglichst relevante Ergebnisse zu liefern. Dort werden Echtzeitinformationen
von Twitter, Facebook, MySpace, Friendfeed und weitere Web-Inhalte erfasst und
nach Relevanz sortiert. Die Relevanz wird ebenfalls anhand des
Beziehungsgeflechts auf Twitter ermittelt. Nach Angaben von Marissa Mayer, die
bei Google für Suchprodukte und Nutzererfahrung verantwortlich ist,
berücksichtigt der Sortieralgorithmus unter anderem, wie häufig ein Tweet
weitergeleitet oder beantwortet wurde und wie viele hochqualifizierte/populäre
Follower ein Nutzer hat.
Google
hat dazu das PageRank-System, das den Ursprung seiner Suchmaschine darstellt,
auf Twitter angewendet. PageRank bedeutet,
dass die Zahl der Links, die auf eine Seite verweisen, entscheidend für die
Reputation einer Seite ist. Je mehr Links die verlinkenden Seiten selber zuvor
erhalten haben, desto höher ist der Reputationseffekt. Übertragen auf Twitter
bedeutet das PageRank-Prinzip, dass das Folgen eines Twitterers wie ein Link bewertet
wird. „Beides sind Formen von Empfehlungen", sagte Amit Singhal, der für die
Echtzeitsuche zuständige Softwareingenieur bei Google, der Fachzeitschrift
„Technology Review". Haben die Follower eines Twitterers selber viele Follower,
erhält dieser Twitterer eine hohe Reputation
im Google-System - unabhängig davon, wie viele Follower er tatsächlich hat.
„Das ist definitiv mehr als ein Popularitätswettbewerb", sagte Singhal. Tweets
dieser Menschen mit hoher Reputation werden dann bevorzugt in die Google-Echtzeitsuche
integriert. „In den Augen von Google kreiert die Anwendung des PageRank für
Social Media einen menschlichen Algorithmus oder PeopleRank, der als Messgröße
für die Autorität eines Menschen im Social Web dient", sagte Brian Solis von
der Medienagentur Futureworks.
Neben
Google und anderen Suchmaschinen versuchen auch viele Start-Ups, Ordnung und Autorität in die sozialen Medien zu
bringen. So zum Beispiel das Unternehmen My6sense, das die Inhalte filtert, die ein Nutzer verbreitet oder liest. Nach und
nach soll die Anwendung dabei lernen, welche Inhalte den Nutzer besonders
interessieren. Noch steckt das System aber in den Anfängen; am Markt hat es
sich noch nicht durchgesetzt.
Auch
Risikokapitalgeber suchen nach einer Lösung für das Problem. Jüngster
Hoffnungsträger ist das junge kalifornische Unternehmen Klout.com, das gerade
immerhin 1,5 Millionen Dollar von Investoren zur Verfügung gestellt bekommen
hat. Mit Hilfe von Ranking-Algorithmen
und semantischen Verfahren versucht das Unternehmen, einflussreiche Menschen
auf Twitter zu identifizieren und wer von wem beeinflusst wird. Das Ergebnis
ist der „Klout Score", der als Wert zwischen 1 und 100 den Maßstab für den
Einfluss auf Twitter anzeigen soll. Klarer Spitzenreiter in der Liste der 100 einflussreichsten
Twitterer in Deutschland ist nach den Berechnungen von Klout der
Twitter-Account @smashingmag mit einem Score-Wert von 81, gefolgt von
@frauenfuss (73), @HerrTutorial (73), @Piratenpartei und @DerWesten (66). Die
Twitterer haben allerdings wenig gemeinsam: Hinter Smashingmag verbirgt sich
der Chefredakteur eines Designmagazins, Frauenfuss ist eine Künstlerin, die
ihre Follower malt, HerrTutorial twittert vornehmlich über Videos, während die
Piratenpartei über Netzpolitik und DerWesten als Nachrichtenmedium agiert. Das
Problem, Relevanz nach Themen zu ordnen, löst auch Klout nicht.

Doch
ob Echtzeit schon die Königsdisziplin im Internet bedeutet, ist umstritten.
„Das ,Right-Time-Internet‘ bringt in einigen Fällen mehr Wert als das
,Echtzeit-Web‘. Echtzeitdaten sind nur interessant, wenn ich aktuell nach
Informationen schaue. Es gibt aber keinen Dienst heute, der die Informationen
liefert, wenn man sie wirklich braucht. Wenn Ihre Firma das kann - ich bringe
mein Scheckbuch mit", sagte der amerikanische Risikokapitalgeber David Pakman
jüngst auf der Twitter-Entwicklerkonferenz Chirp.
_________________________________________________________________________________________