Schlagwort: Analytics

Mittelwert, Median und Modus

When talking about an average, most people refer to the mean which is officially called the arithmetic mean. It is built by summing up all values of a population and dividing this sum by the number of elements. Unfortunately, the mean can easily be skewed by outliers in the data. Let’s look at the following list of ages of people in a course (obviously, the oldest person is the teacher):

22
26
27
21
22
22
20
20
25
21
21
21
25
46

The mean here is 24,21 years. Without the teacher, the mean would be 22.54. This single outlier skews the data.

Another perspective on the average is the median, the middle value of a list sorted by their values. The advantage of the median is that it is less influenced by outliers. In our example, the sorted list looks like this:

20
20
21
21
21
21
22
22
22
25
25
26
27
46

Since we have 14 elements in the list, there is no element in the middle, so we have to take the two values that are in the middle and divide them by 2, in this case (22+22)/2=22. The median of 22 is closer to the mean of the ages without the teacher as the median is less vulnerable to outliers.

Finally, we have the mode (there are also other averages in statistics, but we will not cover these). The mode is the most frequent value in a list. It is always a good idea to plot data, especially when distributions of data are examined. In this case, we create a histogram:

Histogram Age Distribution

21 years is the most frequent number in the data, it is the mode of this data set. Also, the mode works with categorial data. If you have 13 students, 6 from Germany and 7 from France, you have two groups. You cannot ask “what is the arithmetic mean of countries of origin?” but the mode works just fine with such data.

Without any visualisation, mean, median and mode already reveal a lot about our data set. We know that there are outliers in our dataset that skew the numbers. In general, the mean alone may not be a good statistic to examine data although it is widely used.

Filed under: Data ScienceTagged with: , , ,

Warum die Web Analyse (wie wir sie heute kennen) aussterben wird

Das Zeitalter der sinnvollen Webanalyse hat gerade erst begonnen. Mehr und mehr Unternehmen verstehen, dass PageViews kein geeigneter KPI sind, um den Erfolg der Content-Investments zu überprüfen. Und dennoch naht das Ende dessen, was wir gerade liebgewinnen, bevor es zu schön werden kann. Continue reading

Filed under: Data ScienceTagged with: , , ,

Wird mein Content gelesen? Sichtbarkeit von Elementen messen!

Im September 2017 hatte ich noch darüber geschrieben, dass die Scrolltiefe ein besserer Indikator dafür wäre, ob ein Inhalt gelesen wurde als die reine Sitzungsdauer, die eh Quatsch ist. Einen Monat später veröffentlichte Google dann eine neue Funktion im Google Tag Manager, einen Trigger für die Sichtbarkeit von Elementen (in der deutschen Version der Release Notes fehlte der Hinweis). Damit lassen sich einige Nachteile des Scrolltiefen-Ansatzes kompensieren, vor allem die Einschränkung, dass nicht jede Seite gleich lang ist und “75% gelesen” nicht immer bedeuten muss, dass der Inhalt auch bis zum Ende gelesen wurde (75% wurde deswegen gewählt, weil viele Seiten einen immensen Footer haben und die Nutzer daher nicht zu 100% runterscrollen). Eine Seite bei mir hat so viele Kommentare, dass sie mehr als die Hälfte des Inhalts ausmachen.Continue reading

Filed under: Data ScienceTagged with: , , , , ,

Woher kommen die SimilarWeb-Daten?

[Dies ist die Neuauflage eines älteren Artikels]

Wie bei Google Trends bin ich immer wieder überrascht, wie schnell Rückschlüsse aus Daten gezogen werden, ohne dass einmal überlegt wird, woher die Daten eigentlich kommen und wie plausibel sie sind. Vor allem bei Similar Web ist das erstaunlich, denn Google hat ja die Suchdaten und kann Trends daraus ablesen, aber woher kann eigentlich Similar Web Daten darüber haben, wie viele Besucher eine Webseite oder eine App hat? Wie zuverlässig sind diese Daten? Ist die Zuverlässigkeit ausreichend, um daraus wichtige Business-Entscheidungen zu treffen?Continue reading

Filed under: Data ScienceTagged with: , , , , ,

10 Google Analytics Basics (auch für andere Web Analyse-Tools)

Google Analytics hatte letztes Jahr seinen 10. Geburtstag, und in den letzten mehr als 10 Jahren durfte ich einiges an Erfahrung sammeln, was man beim Einsatz von Web Analytics-Systemen beachten muss. Hier sind meine 10 Basic-Tipps, angefangen mit den absoluten Basics, den Abschluss bilden dann die Basics für diejenigen, die auch wirklich was mit ihren Daten anfangen wollen 🙂Continue reading

Filed under: Data ScienceTagged with: ,