Stichprobenverteilung des Mittelwerts

Die Stichprobenverteilung des Mittelwerts ist zentral für viele Konzepte in der Statistik.

Wenn wir eine Stichprobe aus einer Population ziehen und das Mean berechnen, dann wissen wir nicht, wie weit das Mean unserer Stichprobe von dem Mean unserer Population entfernt ist. Wir könnten uns zum Beispiel dafür interessieren, wie der IQ aller Schüler oder Studierenden im Gebäude ist, aber das es zu aufwändig ist, alle zu testen, nehmen wir eine Stichprobe. Wie wahrscheinlich ist es, dass das arithmetische Mittel des IQs unseres Samples genau mit dem Mittelwert des IQs übereinstimmt?

Tatsächlich wissen wir es nicht. Aber stellen wir uns einmal vor, dass wir nicht nur ein Sample nehmen, sondern ganz viele Samples. Und bei jedem Sample berechnen wir den Mittelwert. Dann können wir alle erhaltenen Mittelwerte der Stichproben plotten, zum Beispiel in einem Histogramm, und dann erhalten wir meistens etwas, das sehr ähnlich aussieht wie eine Normalverteilung. Und das funktioniert auch, wenn unsere Population nicht normalverteilt ist! Ein sehr schönes Tool, um das selber festzustellen, findet sich hier. Dies ist die Aussage des Zentralen Grenzwertsatzes, sofern die Samples groß genug sind. “Groß genug” bedeutet hier, dass sie größer als 30 sein sollten. Dies wird häufig damit verwechselt, dass man nur 30 Beobachtungen benötigt, um statistisch signifikant zu sein. Tatsächlich ist damit nur besagt, dass wir dann annähernd eine Normalverteilung bei der Stichprobenverteilung des Mittelwerts erhalten. Allerdings haben Normalverteilungen viele Eigenschaften, die wir kennen und mit denen wir leichter arbeiten können 🙂 So ist der Mittelwert dieser Mittelwertverteilung ein erwartungstreuer Schätzer des Mittelwerts der Population.

Zur Verdeutlichung dieses Konzepts kann noch dieses Video angesehen werden:

Nun kommt die große Überraschung: Wir nehmen gar nicht mehrere Samples. Wir bleiben bei einem Sample. Alles andere wäre eh zu aufwändig. Aber schon bei einem Sample wissen wir eine ganze Menge, denn da wir uns in einer Normalverteilung befinden, wissen wir, dass sich ca. 95% aller Sample-Means innerhalb von 2 Standardabweichungen +/- vom Mean befinden, von dem wir wissen, dass es dem Populations-Mean sehr nah ist. Der Mittelwert unseres Samples ist also mit einer Wahrscheinlichkeit von ca. 95% innerhalb von 2 Standardabweichungem! Vielleicht haben wir Pech, und wir sind in den 5% außerhalb der beiden Standardabweichungen. Aber vielleicht auch nicht. Statistik ist, wie wir gerade sehen, keine Wissenschaft, in der man sich konkret festlegt, dass etwas zu 100% sicher ist 🙂

Vergleichen wir also 2 Means miteinander, zum Beispiel aus einem Sample mit der Gesamtpopulation und einem Sample aus einer Population, die ein Treatment hatte (ein Kurs bei mir, der Statistik-Verständnis-Pillen genommen hat), dann ist es unwahrscheinlich, dass sich kein Unterschied im Statistik-Verständnis ergeben hat, wenn meine Studierenden nach Konsum der Statisik-Verständnis-Pille im Mean mehr als 2 Standardabweichungen besser abgeschnitten haben. Wir befinden uns also nun bereits im Gebiet der Statistischen Signifikanz und den p-Werten…