Wird mein Content gelesen? Scroll-Tiefe pro Artikel als Conversion

Nicht jeder Inhalt wird nur deswegen produziert, damit die Werbung drumherum angeklickt wird ­čÖé Manchen Autor interessiert sogar, ob die Nutzer das produzierte Werk auch lesen. Eine geeignete Metrik oder sogar ein geeigneter KPI ist die Scroll-Tiefe, also wie weit ein Nutzer herunter gescrollt hat. Time on Site oder Time on Page sind┬ákeine gute Metrik, da oftmals nur eine Seite angeschaut wird und Google Analytics dann gar nicht messen kann, wie viel Zeit der Nutzer auf der Seite war. Auch die Bounce Rate ist aus dem gleichen Grund keine gute Metrik, und selbst die Adjusted Bounce Rate sagt ja nur, dass die Nutzer nicht gleich wieder verschwunden sind. Nat├╝rlich kann ein Nutzer auch ganz schnell runterscrollen um zu schauen, wie lang ein Inhalt ist, aber das klammern wir jetzt mal aus.┬á

Die Scroll-Tiefe kann als Event in Google Analytics oder (fast) jedem Web Analyse-System gemessen werden, d.h., wenn ein Nutzer runterscrollt, dann wird gemessen, bei wie viel Prozent der Seite der Nutzer mittlerweile angekommen ist. Da wir nicht bei jedem Prozent ein Event ausl├Âsen wollen, empfiehlt es sich die Schritte 25%, 50% und 75% zu nehmen. Warum nicht 100%? Weil ein Nutzer aufh├Ârt zu scrollen, wenn er sieht, dass der Footer bald erreicht ist, und mittlerweile hat fast jede Seite einen fetten Footer. Je nach Setup der Seite sind 75% eine Conversion im Sinne von “Inhalt gelesen”. Das Erreichen dieses Events kann in Google Analytics als Conversion angelegt werden.

Leider ist Google Analytics etwas sperrig. Will ich sehen, wie die Conversion Rate pro Artikel ist, dann sehe ich die Anzahl der Conversions, aber nicht die Rate. Und hier kommt nun R ins Spiel. Ein Rezept f├╝r die Anbindung von R an Google Analytics habe ich bereits beschrieben, nun schauen wir uns an, wie wir eine ├ťbersicht der “75% gelesen” Conversion Rate pro Artikel in R bauen k├Ânnen.

Wir ziehen uns erst einmal die Daten, in diesem Beispiel aus meinem eigenen Blog:

gadata <- google_analytics(id = ga_id,
start="2017-09-07", end="2017-09-08",
metrics = "ga:timeOnPage",
dimensions = c("ga:dimension1", "ga:pageTitle", "ga:deviceCategory", "ga:eventCategory","ga:eventLabel"),
max = 45000)

In der Benutzerdefinierten Dimension 1 habe ich eine User ID, so dass ich die Events jedes einzelnen Nutzers untersuchen kann. Wir ben├Âtigen die eventCategory und das eventLabel: Ich kann nicht nur die Events auswerten, die das Label “75%” haben, da ich dann ja nicht wei├č, wie viele Visits ich pro Artikel hatte. Zum Gl├╝ck l├Âse ich bei jedem PageView f├╝r jeden Nutzer ein Event aus, so dass ich dies als Basis nehme. Als n├Ąchstes erstelle ich ein Subset meiner Daten, in dem ich nur die Zeilen ausw├Ąhle, die eine Conversion hatten. Dabei unterscheide ich zwischen Desktop und Mobile, denn es k├Ânnte ja sein, dass Nutzer auf dem Mobiltelefon weniger lesen als Nutzer auf dem Desktop.

gadata75 <- gadata[ which(gadata$eventLabel=="75%" & gadata$deviceCategory == "desktop"),]
gadata75Mobile <- gadata[ which(gadata$eventLabel=="75%" & gadata$deviceCategory=="mobile"),]

Zum Schluss rechne ich noch die Conversion Rate aus, hier f├╝r Mobile:

gadataFinal$MCVR <- with(gadataFinal, (gadataFinal$MConv/gadataFinal$Mobile))

Und so sieht nun das Ergebnis aus (ich bin das beste schlechte Beispiel, wenn es um Spaltentitel geht… die CVR ist f├╝r Desktop, die MCVR f├╝r Mobile):

Die Hypothese, dass Mobile Nutzer weniger lesen, kann nicht aufrechterhalten werden. Manche Themen werden nicht nur h├Ąufiger auf dem Mobiltelefon gelesen, sondern auch intensiver. Dass ein Artikel mobil mehr gelesen wird, kann zum Beispiel daran liegen, dass Nutzer bestimmte Themen eher mobil suchen und ich deswegen mehr mobilen Traffic bekomme. Der Vorwerk-Artikel scheint ein Beispiel daf├╝r zu sein. Ein anderer Faktor kann sein, dass ich einen Artikel auf Facebook gepostet habe, was eventuell mehr mobil genutzt wird. Der Roller Derby-Bericht ist ein Beispiel daf├╝r, er ist hier noch ganz frisch.

Die Conversion Rate variiert allerdings stark, aber nur wenn man die Artikel kennt, dann sind die Zahlen aussagekr├Ąftig. Zun├Ąchst hatte ich ├╝berlegt, die L├Ąnge des Artikels in Bezug auf die Anzahl der W├Ârter als weitere Spalte hinzuzuf├╝gen, um eine Korrelation zwischen Scroll-Tiefe und Artikell├Ąnge ├╝berpr├╝fen zu k├Ânnen; vielleicht mache ich das auch noch. Aber gleich beim ersten Artikel h├Ątten wir ein verzerrtes Bild: Der Artikel ist n├Ąmlich relativ kurz, die Kommentare darunter sind viel l├Ąnger. Vielleicht sehen die Nutzer nicht, dass es noch Kommentare gibt. Ich k├Ânnte mit dem Design experimentieren, damit das offensichtlicher wird.

Beim Kindle Clippings Manager ist die Conversion Rate mickrig, allerdings findet der Nutzer den Download-Link sofort, so dass man auf einem ausreichend gro├čen Screen gar nicht zu scrollen braucht. Vielleicht ist die reine Scroll-Tiefe in diesem Fall also gar nicht die richtige Metrik um das zu verstehen, was uns interessiert, n├Ąmlich ob ein Nutzer den Inhalt tats├Ąchlich gelesen hat. Vielleicht muss noch ein Bezug dazu erstellt werden, ob der Nutzer bei ausreichend gro├čem Screen den Inhalt schon komplett sieht?

Aber es gibt auch interessante Erkenntnisse: Der Google Trends-Artikel scheint etwas zu haben, was mobile Nutzer abschreckt. Zwar ist die Fallzahl niedrig, aber auch bei einem l├Ąngeren Zeitraum ist das Bild zu beobachten:

Auch der Clustering mit Google Analytics und R-Artikel scheint mobile Nutzer eher abzuschrecken. Vielleicht sind diese analytischen Themen etwas zu anstrengend f├╝r mal kurz nebenbei auf dem Mobile lesen. Auch der Similar Web-Artikel weist das Muster auf. Allerdings ist der Unterschied beim Clustering-Artikel nicht statistisch signifikant, was auf den ersten Blick verwunderlich ist bei einem so gro├čen Unterschied, aber auch hier sind die Fallzahlen noch zu niedrig.

Keine Daten ohne Handlungsempfehlung! Was ich aus diesen Daten lerne und was ich aus dem Gelernten mache:

  • Der Google Trends-Artikel scheint zu lang zu sein. Irgendwo verliere ich die Leser. Das gleiche gilt f├╝r die Analytics Basics oder den Similar Web-Artikel. Indem ich mir f├╝r diesen Artikel die 25% und 50%-Werte anschaue, k├Ânnte ich sehen, wo das passiert.
  • Ich muss mir ├╝berlegen, ob die Scroll-Tiefe wirklich bei jedem Artikel die geeignete Metrik ist. Beim Kindle-Artikel ist der Download wahrscheinlich interessanter.
  • Wie oben bereits beschrieben ist die Anbindung der Kommentare eventuell suboptimal, da nicht weiter gescrollt wird.

Aus einer kleinen Entspannungs├╝bung mit R ist ein handlungsrelevanter Report geworden, den ich so in Google Analytics selbst wahrscheinlich nicht so einfach h├Ątte bauen k├Ânnen (ich habs zumindest nicht hinbekommen, aber ich lerne gerne dazu :-).

Update: Siehe hierzu bitte auch den Artikel ├╝ber das Messen der Sichtbarkeit von Elementen, die noch genauer ist!

Filed under: Data ScienceTagged with: , ,

1 Comment

  1. […] September 2017 hatte ich noch dar├╝ber geschrieben, dass die Scrolltiefe ein besserer Indikator daf├╝r w├Ąre, ob ein Inhalt gelesen wurde als die reine Sitzungsdauer, die eh Quatsch ist. Einen Monat sp├Ąter ver├Âffentlichte Google dann […]


Add a Comment

Deine E-Mail-Adresse wird nicht ver├Âffentlicht. Erforderliche Felder sind mit * markiert.

Comment *

Name *
Email *
Website