data > opinion

Tom Alby

Stichprobenverteilung des Mittelwerts (Sampling Distribution of the Mean)


Sie sind hier: start / lehrveranstaltungen / glossar / stichprobenverteilung des mittelwerts /

Die Stichprobenverteilung des Mittelwerts ist zentral für viele Konzepte in der Statistik. Wird eine Stichprobe aus einer Population gezogen und ein Mittelwert berechnet (zum Beispiel die Größe der Menschen in dieser Stichprobe), dann muss dieser Mittelwert nicht dem Mittelwert der Population entsprechen. Allerdings ist der Mittelwert der Größe aller Menschen in der Population in der Regel auch nicht bekannt. Es ist also nicht bekannt, wie weit der Mittelwert der Stichprobe von dem tatsächlichen Mittelwert abweicht.

Wird nun noch eine Stichprobe genommen, wird der Mittelwert dieser Stichprobe wahrscheinlich nicht dem Mittelwert der vorherigen Stichprobe entsprechen. Bei jeder weiteren Stichprobe jedoch ergibt sich eine Verteilung, die sich einer Normalverteilung annähert und den Mittelwert der Population enthält. Und das funktioniert auch, wenn die Population nicht normalverteilt ist. Eine anschauliche Animation findet sich hier Dies ist die Aussage des Zentralen Grenzwertsatzes, sofern die Samples groß genug sind. „Groß genug“ bedeutet hier, dass sie größer als 30 sein sollten. Dies wird häufig damit verwechselt, dass man nur 30 Beobachtungen benötigt, um statistisch signifikant zu sein. Tatsächlich ist damit nur besagt, dass wir dann annähernd eine Normalverteilung bei der Stichprobenverteilung des Mittelwerts erhalten. Allerdings haben Normalverteilungen viele Eigenschaften, die wir kennen und mit denen wir leichter arbeiten können 🙂 So ist der Mittelwert dieser Mittelwertverteilung ein erwartungstreuer Schätzer des Mittelwerts der Population.

Zur Verdeutlichung dieses Konzepts kann noch dieses Video angesehen werden:

Nun kommt die große Überraschung: Es werden gar nicht mehrere Stichproben genommen, sondern nur eine. 95% aller Stichproben-Mittelwerte befinden sich innerhalb von 1,96 Standardabweichungen +/- vom Mittelwert dieser Verteilung befinden, von dem wir wissen, dass er dem Populations-Mittelwert sehr nah ist. Oder anders gesagt, mit einer Wahrscheinlichkeit von 5% können wir eine Stichprobe erwischen, deren Mittelwert sich nicht innerhalb dieser +/- 1,96 Standardabweichungen befindet.

Tags: