Wunsch oder Wahrheit: Die Statistik
09. August 2010, 10:45
Uhr
worin vorgestellt werden: die Statistik, die Korrelation, die
Kausalität, deren Nutzen, Frommen und Mißbrauch, wie auch allerlei
Diebe und Verdreher derselben.
Bei dem Wort Statistik denken wir an
endlose Zahlenkolonnen, an Mittelwerte und Korrelationen und andere
langweilige, wüstentrockene Dinge. Für Menschen, die die Welt in
Zahlenkolonnen erfassen wollen, Schreibtischhengste, Bürokratentäter,
Datensammler. Interessant ist das allenfalls, wenn es im sexy Kostüm
daherkommt: Unfallstatistik zum Beispiel, oder Kriminalstatistik. Da wittert man latente Skandale, Gruselgeschichten, obskure Gefahren.
Statistiken sind zuallererst nur eine
Sammlung von Fakten in Zahlen. Unzählige Reihen und Spalten, gerne
deutlich jenseits des Fassungsvermögens der gängigen
Tabellensoftware (ja! da gibt es Grenzen), Unmengen von kleinen
Informations-Puzzleteilen. Bestenfalls langweilig. Schlimmstenfalls
ein Alptraum für den Datenschutz, nämlich wenn wertvolle -
schlimmstenfalls persönliche - Daten verloren gehen. Und je
persönlicher, desto schlimmer. Manches Unternehmen, hier und im
Ausland, mußte in den letzten Jahren so eine Datenkuh vom Eis
ziehen, und man kann nur hoffen, daß sie daraus gelernt haben.

Immerhin, über Datenverlust,
Datenschutz und Datenschlamperei werden wir gelegentlich informiert,
wann immer Daten an unerwarteten Orten (bevorzugt dem Internet)
auftauchen. Das ist nicht schön, aber es sensibilisiert für die
Gefahren. Überhaupt nicht sensibilisiert sind wir hingegen für die
vielen Mißverständnisse, die schon bei der Interpretation der
einfachsten statistischen Kennzahlen entstehen können.
Die Informationsfülle eines
umfangreichen Datensatzes ist so komplex, daß damit in Rohform nicht
viel anzufangen ist. Ein Puzzle durch die Summe seiner Teile zu
beschreiben wäre ein mühevolles Unterfangen, einfacher ist es,
Angaben zum Gesamtbild zu machen und das tut auch die Statistik.
Zentrale Maße, die Informationen kondensiert und aggregiert
wiedergeben, müssen her, damit die Information handlich und
portionsgerecht für den 2-Minuten-Einspieler im Fernsehen oder drei
Absätze in der Zeitung werden. Der unumstrittene Herrscher unter den zentralen
Maßen ist natürlich der Durchschnitt. Eigentlich ist es nicht
schwer, sich klarzumachen, wie verzerrend der Durchschnitt ist -
das sollte man schon in der Schule begriffen haben: ob eine Klasse
lauter Dreier-Schüler hat oder nur Streber mit Einsen und Trottel
mit Fünfen, der Durchschnitt kann in beiden Fällen der gleiche
sein, obwohl die Klassen völlig unterschiedlich sind. Erst die
Standardabweichung gibt näheren Aufschluß über die Verteilung
(weit gestreut oder eng fokussiert um den Durchschnittswert), aber
das geht im Alltag unter. Ich jedenfalls habe noch nie in einem
Zeitungsartikel neben dem Durchschnitt die Standardabweichung zitiert
gesehen.

Etwas komplizierter und noch
verheerender in verständnislosen Händen ist die Korrelation,
gewissermaßen die kleine Schwester des kausalen Zusammenhangs. Im
Frühling werden besonders viele Kinder geboren und gleichzeitig
kommen die Störche aus dem Süden zurück - das ist Korrelation.
Der Storch bringt die Kinder - das wäre Kausalität, allerdings
wissen wir es seit der Bravo-Lektüre besser: die gibt es in diesem
Fall nicht. Kausalität ohne statistische Korrelation ist
ausgeschlossen, aber Korrelation ohne Kausalität sehr gut möglich.
Der gute Statistiker wird das sorgfältig vermerken, wenn er die
Ergebnisse seiner Studie in einem schönen, langen Bericht zu Papier
bringt, dafür hat er schließlich lange genug studiert. Hoffentlich.
Der Bericht hat jedoch noch einen
langen Weg vor sich, wandert durch viele Hände und nicht immer durch
die richtigen. Auf ihrem Weg über die Schreibtische von
wissenschaftlichen Mitarbeitern im Bundestag, politischen Referenten
und Journalisten verwandelt sich die sachliche, statistische Angabe
in eine politisch instrumentalisierbare Neuigkeit, ein
Wahlkampfargument oder eine Schlagzeile. Wo Wissenschaftler eine
simple Korrelation bei der Nutzung von Computerspielen und Fernsehern
und den schulischen Leistungen herstellen, folgt rasch die
Forderung, Computerspiele zu indizieren. Weil schlecht für
die Bildung. Oder auch: Daddeln macht Doof. Nun ist der Zusammenhang unbestreitbar
intuitiv ansprechend und Wasser auf die Mühlen der Zensurfanatiker.
Die Korrelation als Beweis für die Kausalität heranzuziehen, oder
auch nur durch Formulierungen zu unterstellen, der statistische
Zusammenhang mache diese Schlußfolgerung logisch, ist jedoch
grundfalsch.

Denkt man etwas länger über die
möglichen Ursachen nach, gibt es drei verschiedene Möglichkeiten.
Nennen wir, um beim Beispiel zu bleiben, den Medienkonsum A und die
schulischen Leistungen B. Tatsächlich gibt es drei alternative
Erklärungen:
1. A verursacht B. Kinder mit hohem
Medienkonsum werden dadurch in der Schule schlechter, sprich: dümmer.
2. B verursacht A. Nur zu Anfang
abwegig, aber ist es wirklich so unwahrscheinlich, daß weniger
intelligente Kinder von sich aus mehr Fernsehen gucken?
3. Irgendein verdeckter Faktor C
beeinflußt A und B. Zum Beispiel: Fürsorge und Bildung des
Elternhauses beeinflussen Medienkonsum wie auch die Schulleistungen.
Wollte man der Politik raten, so fielen
die Maßnahmen sehr unterschiedlich aus, je nachdem welche Kausalität
man unterstellt. Und wäre der Grund für das Schulversagen im
Elternhaus zu sehen (und nicht im Medienkonsum) müßte man
folgerichtig genau dort ansetzen, bei der Betreuung der Kinder. Das
jedoch sind ganz offensichtlich völlig unterschiedliche Strategien.
Die simple Korrelation zwischen Medienkonsum und Schulleistungen sagt
jedenfalls nicht, welches der bestimmende Zusammenhang ist. In
Verbindung mit anderen Studien und Methoden mag das Bild klarer
werden, aber diese Studie allein ist kein tragfähiger Beweis. Was
natürlich Politiker und Journalisten nicht davon abhält, ihr
lausiges Mißverständnis statistischer Grundlagen in die Welt zu
schreien. Und schnell entsprechende Maßnahmen zu fordern.
Beides, die Fehlerinterpretation und
ihre Folgen, entwickeln in der schönen, neuen Internet-Welt schnell
eine Eigendynamik. Die These wird aufgegriffen, im Internet noch schneller weitergetragen als früher auf dem Papier, und obwohl es so einfach wäre, die Originalquelle zu verlinken, sucht man oft vergeblich danach. Während man sich also bemüht, den vielen
Verbindungen ins Dickicht der Meinungs- und Meldungsvielfalt zu folgen, um die
ursprüngliche Studie ausfinding zu machen, wird die verdrehte Statistik fröhlich
weitergereicht wird und vervielfältigt sich selbst.
Am Ende solcher Mißverständnisse
werden nach einigem politischen Ringen Entscheidungen über die
Verwendung von Steuergeldern und die Kontrolle von Medien getroffen,
basierend auf einer Fehlinterpretation statistischer Daten.
Hätten mehr Menschen begriffen, daß eine Korrelation noch keine
Kausalität ist, wäre das nicht passiert.
Also bitte: passen Sie das nächste Mal
auf, wenn Ihnen eine Kausalität begegnet, bitten Sie sie, sich
ordentlich vorzustellen, mit ganzem Namen - um sicherzugehen, daß
es nicht nur eine Korrelation ist. Die wäre nämlich mit Vorsicht zu
genießen.