Kategorie: Data Science

Wird mein Content gelesen? Scroll-Tiefe pro Artikel als Conversion

Nicht jeder Inhalt wird nur deswegen produziert, damit die Werbung drumherum angeklickt wird 🙂 Manchen Autor interessiert sogar, ob die Nutzer das produzierte Werk auch lesen. Eine geeignete Metrik oder sogar ein geeigneter KPI ist die Scroll-Tiefe, also wie weit ein Nutzer herunter gescrollt hat. Time on Site oder Time on Page sind keine gute Metrik, da oftmals nur eine Seite angeschaut wird und Google Analytics dann gar nicht messen kann, wie viel Zeit der Nutzer auf der Seite war. Auch die Bounce Rate ist aus dem gleichen Grund keine gute Metrik, und selbst die Adjusted Bounce Rate sagt ja nur, dass die Nutzer nicht gleich wieder verschwunden sind. Natürlich kann ein Nutzer auch ganz schnell runterscrollen um zu schauen, wie lang ein Inhalt ist, aber das klammern wir jetzt mal aus. Continue reading

Filed under: Data ScienceTagged with: , ,

Woher kommen die Similar Web-Daten?

[Dies ist die Neuauflage eines älteren Artikels]

Wie bei Google Trends bin ich immer wieder überrascht, wie schnell Rückschlüsse aus Daten gezogen werden, ohne dass einmal überlegt wird, woher die Daten eigentlich kommen und wie plausibel sie sind. Vor allem bei Similar Web ist das erstaunlich, denn Google hat ja die Suchdaten und kann Trends daraus ablesen, aber woher kann eigentlich Similar Web Daten darüber haben, wie viele Besucher eine Webseite oder eine App hat? Wie zuverlässig sind diese Daten? Ist die Zuverlässigkeit ausreichend, um daraus wichtige Business-Entscheidungen zu treffen?Continue reading

Filed under: Data ScienceTagged with: , , , , ,

Ein Jahr Erfahrung mit Scalable Capital

In diesem Monat feiert meine Anlage bei Scalable Capital ihren ersten Geburtstag; Zeit, sich die bisherige Leistung genauer anzuschauen. Über erste Erfahrungen mit Scalable Capital sowie die Situation rund um den Brexit hatte ich schon berichtet. Seitdem habe ich zwar ab und zu mal reingeschaut, aber keinen Anlass zu einer Aktion gesehen, auch wenn die Nachrichten sich seitdem fast überschlagen hatten und mit dem Schlimmsten gerechnet wurde. Aber es kam nicht so schlimm, ganz im Gegenteil, die Börsen feiern Kursgewinne ohne Ende.Continue reading

Filed under: Data ScienceTagged with: ,

Clustering mit Google Analytics und R

Manche Fragen lassen sich nicht so einfach oder auch gar nicht mit der Benutzeroberfläche von Google Analytics beantworten (das gilt übrigens auch für Adobe Analytics, Piwik, etc). Zwar bietet Google Analytics eine mächtige und einfach zu nutzende Funktionalität an, um Segmente basierend auf Geräte, Akquisitionskanäle oder Browser manuell zu bilden und miteinander zu vergleichen, aber sobald es über diese Standardsegmente hinaus oder zu Kombinationen mehrerer Dimensionen geht, wird der Aufwand komplex. Oft genug wird dann auch einfach nur in den Daten “gestochert” und gehofft, dass man etwas Wertvolles findet. Genau hier kommen die Vorteile der Kombination von Google Analytics und R ins Spiel. Eine Möglichkeit, Google Analytics und R miteinander zu verbinden ist das R Package googleAnalyticsR von Mark Edmonson, das ich in diesem Artikel beispielhaft verwenden werde.Continue reading

Filed under: Data ScienceTagged with: , , , , , , , ,

Das optimale Tracking-Konzept oder Der Segeltörn ohne Ziel

Wie oft habe ich beim Thema Tracking-Konzept schon den Satz gehört “Lass uns einfach alles tracken, wir können uns doch später Gedanken machen, was wir eigentlich brauchen. Aber das Tracking-Konzept kann natürlich schon geschrieben werden!”

In Seenot ohne Tracking-Konzept
Fischerboot in Seenot von Andreas Achenbach

Stellen wir uns einmal vor, wir wollen mit einem Segelboot einen Törn unternehmen und wir sagten “Keine Ahnung wo wir hin wollen, lass uns doch einfach alles mitnehmen, was wir für alle Eventualitäten benötigen könnten”. Unser Boot würde sinken bevor der Törn begonnen hat. Wir wüssten nicht, ob wir Wasser und Konserven für einen Tag oder mehrere Wochen mitnehmen müssten, ob wir Winterkleidung oder Sommerkleidung benötigen und so weiter. Aber um auf Nummer Sicher zu gehen, kaufen wir einfach den ganzen Segelbedarfsladen leer, irgendwas davon werden wir schon brauchen. Und haben nun mehr, als das Schiff an Last ertragen kann.Continue reading

Filed under: Data ScienceTagged with: ,

Tag Management Systems

Adding tracking pixels requires the involvement of the development and the IT department, and if there is only one simple error, the next push to production may take weeks. Also, the more pixels are included, the more complex the management of these pixels becomes, especially when a specific logic is required for the sequence of tags being fired. Worse, in some cases, tag firing depends on conditions in some cases.

Tag Management Systems solve all these problems by providing a container that is included once only.

Filed under: Data Science

Log Ins

Log Ins obviously are the best way to acquire clean data, given that the user authentificates herself so that we can be absolutely sure that this is the same user. What is more, logins also work across different devices. A good example is Facebook where users access their account via apps, web pages etc.

Filed under: Data Science

Fingerprinting

Given that users delete cookies, the online marketing industry is searching for alternatives, and one way to do that is browser fingerprinting. As described in the section about Cookies and Pixels, JavaScript allows to collect more information from a user’s browser than a web server logging mechanism can. You may want to test your browser using this tool; not only are details about your browser’s configuration available but also plugins,  etc. While most people think that they have a standard configuration similar to many other users, this is actually not the case. Using several signals such as the fingerprint, a cookie if available etc, it is possible to create a much more robust tracking mechanism.

Filed under: Data Science

Cookies and Pixels

Since it was impossible to “follow” a user based on log files, Lou Montulli invented the HTTP cookie in 1994. This enabled website owners to place a small text file on a user’s hard disk and recognize him again when another page of the site is requested, the basis for building a web store, for example. Until today, cookies are a basic means to recognize users although they have several disadvantages:

  • They can be deleted, and they are deleted.
  • They do not represent a user but a user account on a single machine.

Cookies are differentated into 1st party and 3rd party cookies. The webserver visited by a user is allowed to set a 1st party cookie; if the web page includes a reference that tries to set a cookie from a different web server, this would be regarded as a 3rd party cookie; 3rd party cookies often are blocked. As a consequence, advertising companies have a huge interest in setting 1st party cookies.

A year after the introduction of cookies, JavaScript entered the world; initially called Livescript, it was renamed due to the collaboration with Java’s inventor, SUN Microsystems, and it was supposed to add the ability to run small programs in a web browser apart from the rather static HTML documents.

Before we dive further into the advantages of JavaScript, let’s have a look at pixels. Pixels, usually, are the smallest entity on a screen, and the reason why they are so interesing is that they do not create too much traffic when they are sent over the web. In the early days when every bit was expensive to push through the networks, such a pixel was a great way to measure web traffic on a web server by including the pixel from a another server that counted the requests. However, only the information that is accessible in a typical log file can be logged, the only advantage is that users who have no access to log files can use their advantages, mostly receiving reports but not raw data. This is called page-based tracking, although the tracking still happens on a server but it is triggered from a page.

With the introduction of JavaScript, tracking via a pixel became more sophisticated, and just by virtue of the first pixels being a pixel, these pieces of JavaScript that are used for tracking are still called pixels, even if they don’t make use of a pixel graphic. The anatomy of a JavaScript pixel looks like this: A user’s browser requests a web page from a server, the server delivers the page to the browser, the page contains some JavaScript that is executed after the page has been loaded. The JavaScript requests a pixel or another resource from a tracking server that then tracks the user… by using JavaScript, however, more information is available than is available via a log file; JavaScript has access to information such as the screen size, the screen color depth and much more. This information can also be used for fingerprinting.

Another huge advantage of JavaScript pixels is that they do not log requests by bots since most of these bots do no interpret JavaScript. And, JavaScript also offers the possibility for external domains to set a 1st party cookie. Google Analytics sets 1st party cookies as well as many marketing company pixels that are placed on publisher sites in order to collect as much data as possible about users, not needing to piggybag a cookie.

Next: Fingerprinting

Filed under: Data Science