Vor kurzem las ich Jordan Ellenbergs How Not to Be Wrong. The Power of Mathematical Thinking. Darin beschreibt er die Fallstricke der linearen Regression, unter anderem am Beispiel des Artikels Will all Americans become overweight or obese?. Laut diesem Paper werden bis 2048 alle Amerikaner übergewichtig oder adipös sein. Das klingt dramatisch – ist aber statistisch unsinnig. Die zugrundeliegende Regression ignoriert, dass mit zunehmender Zahl an Übergewichtigen immer weniger Schlanke übrig bleiben, die „konvertieren“ könnten. Wenige Jahre nach der Veröffentlichung des Artikels zeigte sich, dass die Zunahme des Übergewichts natürlich nicht linear, sondern logistisch verläuft – sie flacht ab, weil Bevölkerungen keine unendlichen Prozesse kennen.
Weiterlesenstatistik
Es gibt 4 Beiträge mit dem Schlagwort statistik.
Material zum Web Analytics Wednesday 8. April 2020
Schön, dass Du beim ersten virtuellen Web Analytics Wednesday dabei warst. Hier sind die versprochenen Links:
- Mein aktuelles Buch Einführung in die Webanalyse, am besten direkt beim Verlag kaufen+ oder bei Amazon+
- Meine Mailing-Liste, ich schreibe nur selten, zum Beispiel wenn ich ein neues Buch geschrieben habe
- Der ursprüngliche Artkel über die Analyse und das Plotten von Corona-Daten mit R (auf Englisch)
- Der Link zu R
- Der Link zu RStudio (man benötigt R als Grundlage)
- Der Link zum tiyverse
- Das Beispiel-Notebook auf GitHub, dafür brauchst Du auf jeden Fall R und RStudio!
- Die Daten der John Hopkins-Universität auf GitHub
- Das Buch von Hadley Wickham über Data Science mit R, einmal als kostenloses Online-Buch oder hier als deutsches Buch bei Amazon+
- Ein allgemeines Buch über die Grundlagen der Datenanalyse mit R+; ein dicker Brocken, eher als allgemeine Einführung gedacht. Ich würde aber immer eher das Buch von Hadley empfehlen
- Das Buch Fundamentals of Data Visualization+ von Claus O. Wilke ist eine der besten Einführungen in die Datenvisualisierung, auch dieses Buch gibt es kostenlos online
- ggplot2 ist Teil des tidyverse, eine sehr gute Einführung neben dem allgemeinen Data Science-Buch von Wickham stammt ebenfalls aus seiner Feder, ggplot2 – Elegant Graphics for Data Analysis+
- Als generelle Einführung in die Statistik empfehle ich The Art of Statistics+ oder Naked Statistics+, beides sehr gute und unterhaltsame Bücher (nicht nur für Statistiker)
- Für angehende Data Scientists sei noch Practical Statistics for Data Scientists+ empfohlen
Alle mit + markierten Link sind Affiliate-Links
Google Optimize hacken: Von Bayes, p-Werten, A/A-Tests und vergessenen Metriken
Google Optimize ist eines meiner Lieblings-Tools, denn es ermöglicht jedem schnell a/b-Tests zu bauen; in meinen Kursen staunen die Teilnehmer häufig, wie schnell so ein Test online sein kann. Natürlich ist die Vorarbeit, das saubere Erstellen einer Hypothese, nicht so schnell getan, aber es macht auch keinen Spaß, monatelang auf die Live-Schaltung eines Tests zu warten. Über die Vorzüge von Google Optimize will ich auch gar nicht weiter eingehen, sondern stattdessen auf drei Feinheiten hinweisen, die nicht so offensichtlich sind.
WeiterlesenStatistik ist keine Routine
Most real life statistical problems have one or more nonstandard features. There are no routine statistical questions; only questionable statistical routines.
David R. Cox