Wird mein Content gelesen? Scroll-Tiefe pro Artikel als Conversion

Nicht jeder Inhalt wird nur deswegen produziert, damit die Werbung drumherum angeklickt wird 🙂 Manchen Autor interessiert sogar, ob die Nutzer das produzierte Werk auch lesen. Eine geeignete Metrik oder sogar ein geeigneter KPI ist die Scroll-Tiefe, also wie weit ein Nutzer herunter gescrollt hat. Time on Site oder Time on Page sind keine gute Metrik, da oftmals nur eine Seite angeschaut wird und Google Analytics dann gar nicht messen kann, wie viel Zeit der Nutzer auf der Seite war. Auch die Bounce Rate ist aus dem gleichen Grund keine gute Metrik, und selbst die Adjusted Bounce Rate sagt ja nur, dass die Nutzer nicht gleich wieder verschwunden sind. Natürlich kann ein Nutzer auch ganz schnell runterscrollen um zu schauen, wie lang ein Inhalt ist, aber das klammern wir jetzt mal aus. 

Die Scroll-Tiefe kann als Event in Google Analytics oder (fast) jedem Web Analyse-System gemessen werden, d.h., wenn ein Nutzer runterscrollt, dann wird gemessen, bei wie viel Prozent der Seite der Nutzer mittlerweile angekommen ist. Da wir nicht bei jedem Prozent ein Event auslösen wollen, empfiehlt es sich die Schritte 25%, 50% und 75% zu nehmen. Warum nicht 100%? Weil ein Nutzer aufhört zu scrollen, wenn er sieht, dass der Footer bald erreicht ist, und mittlerweile hat fast jede Seite einen fetten Footer. Je nach Setup der Seite sind 75% eine Conversion im Sinne von “Inhalt gelesen”. Das Erreichen dieses Events kann in Google Analytics als Conversion angelegt werden.

Leider ist Google Analytics etwas sperrig. Will ich sehen, wie die Conversion Rate pro Artikel ist, dann sehe ich die Anzahl der Conversions, aber nicht die Rate. Und hier kommt nun R ins Spiel. Ein Rezept für die Anbindung von R an Google Analytics habe ich bereits beschrieben, nun schauen wir uns an, wie wir eine Übersicht der “75% gelesen” Conversion Rate pro Artikel in R bauen können.

Wir ziehen uns erst einmal die Daten, in diesem Beispiel aus meinem eigenen Blog:

gadata <- google_analytics(id = ga_id,
start="2017-09-07", end="2017-09-08",
metrics = "ga:timeOnPage",
dimensions = c("ga:dimension1", "ga:pageTitle", "ga:deviceCategory", "ga:eventCategory","ga:eventLabel"),
max = 45000)

In der Benutzerdefinierten Dimension 1 habe ich eine User ID, so dass ich die Events jedes einzelnen Nutzers untersuchen kann. Wir benötigen die eventCategory und das eventLabel: Ich kann nicht nur die Events auswerten, die das Label “75%” haben, da ich dann ja nicht weiß, wie viele Visits ich pro Artikel hatte. Zum Glück löse ich bei jedem PageView für jeden Nutzer ein Event aus, so dass ich dies als Basis nehme. Als nächstes erstelle ich ein Subset meiner Daten, in dem ich nur die Zeilen auswähle, die eine Conversion hatten. Dabei unterscheide ich zwischen Desktop und Mobile, denn es könnte ja sein, dass Nutzer auf dem Mobiltelefon weniger lesen als Nutzer auf dem Desktop.

gadata75 <- gadata[ which(gadata$eventLabel=="75%" & gadata$deviceCategory == "desktop"),]
gadata75Mobile <- gadata[ which(gadata$eventLabel=="75%" & gadata$deviceCategory=="mobile"),]

Zum Schluss rechne ich noch die Conversion Rate aus, hier für Mobile:

gadataFinal$MCVR <- with(gadataFinal, (gadataFinal$MConv/gadataFinal$Mobile))

Und so sieht nun das Ergebnis aus (ich bin das beste schlechte Beispiel, wenn es um Spaltentitel geht… die CVR ist für Desktop, die MCVR für Mobile):

Die Hypothese, dass Mobile Nutzer weniger lesen, kann nicht aufrechterhalten werden. Manche Themen werden nicht nur häufiger auf dem Mobiltelefon gelesen, sondern auch intensiver. Dass ein Artikel mobil mehr gelesen wird, kann zum Beispiel daran liegen, dass Nutzer bestimmte Themen eher mobil suchen und ich deswegen mehr mobilen Traffic bekomme. Der Vorwerk-Artikel scheint ein Beispiel dafür zu sein. Ein anderer Faktor kann sein, dass ich einen Artikel auf Facebook gepostet habe, was eventuell mehr mobil genutzt wird. Der Roller Derby-Bericht ist ein Beispiel dafür, er ist hier noch ganz frisch.

Die Conversion Rate variiert allerdings stark, aber nur wenn man die Artikel kennt, dann sind die Zahlen aussagekräftig. Zunächst hatte ich überlegt, die Länge des Artikels in Bezug auf die Anzahl der Wörter als weitere Spalte hinzuzufügen, um eine Korrelation zwischen Scroll-Tiefe und Artikellänge überprüfen zu können; vielleicht mache ich das auch noch. Aber gleich beim ersten Artikel hätten wir ein verzerrtes Bild: Der Artikel ist nämlich relativ kurz, die Kommentare darunter sind viel länger. Vielleicht sehen die Nutzer nicht, dass es noch Kommentare gibt. Ich könnte mit dem Design experimentieren, damit das offensichtlicher wird.

Beim Kindle Clippings Manager ist die Conversion Rate mickrig, allerdings findet der Nutzer den Download-Link sofort, so dass man auf einem ausreichend großen Screen gar nicht zu scrollen braucht. Vielleicht ist die reine Scroll-Tiefe in diesem Fall also gar nicht die richtige Metrik um das zu verstehen, was uns interessiert, nämlich ob ein Nutzer den Inhalt tatsächlich gelesen hat. Vielleicht muss noch ein Bezug dazu erstellt werden, ob der Nutzer bei ausreichend großem Screen den Inhalt schon komplett sieht?

Aber es gibt auch interessante Erkenntnisse: Der Google Trends-Artikel scheint etwas zu haben, was mobile Nutzer abschreckt. Zwar ist die Fallzahl niedrig, aber auch bei einem längeren Zeitraum ist das Bild zu beobachten:

Auch der Clustering mit Google Analytics und R-Artikel scheint mobile Nutzer eher abzuschrecken. Vielleicht sind diese analytischen Themen etwas zu anstrengend für mal kurz nebenbei auf dem Mobile lesen. Auch der Similar Web-Artikel weist das Muster auf. Allerdings ist der Unterschied beim Clustering-Artikel nicht statistisch signifikant, was auf den ersten Blick verwunderlich ist bei einem so großen Unterschied, aber auch hier sind die Fallzahlen noch zu niedrig.

Keine Daten ohne Handlungsempfehlung! Was ich aus diesen Daten lerne und was ich aus dem Gelernten mache:

  • Der Google Trends-Artikel scheint zu lang zu sein. Irgendwo verliere ich die Leser. Das gleiche gilt für die Analytics Basics oder den Similar Web-Artikel. Indem ich mir für diesen Artikel die 25% und 50%-Werte anschaue, könnte ich sehen, wo das passiert.
  • Ich muss mir überlegen, ob die Scroll-Tiefe wirklich bei jedem Artikel die geeignete Metrik ist. Beim Kindle-Artikel ist der Download wahrscheinlich interessanter.
  • Wie oben bereits beschrieben ist die Anbindung der Kommentare eventuell suboptimal, da nicht weiter gescrollt wird.

Aus einer kleinen Entspannungsübung mit R ist ein handlungsrelevanter Report geworden, den ich so in Google Analytics selbst wahrscheinlich nicht so einfach hätte bauen können (ich habs zumindest nicht hinbekommen, aber ich lerne gerne dazu :-).

Filed under: Data ScienceTagged with: , ,

No comment yet, add your voice below!


Add a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Comment *

Name *
Email *
Website