Warum die Web Analyse (wie wir sie heute kennen) aussterben wird

Das Zeitalter der sinnvollen Webanalyse hat gerade erst begonnen. Mehr und mehr Unternehmen verstehen, dass PageViews kein geeigneter KPI sind, um den Erfolg der Content-Investments zu überprüfen. Und dennoch naht das Ende dessen, was wir gerade liebgewinnen, bevor es zu schön werden kann. Continue reading

Filed under: Data ScienceTagged with: , , ,

Sistrix Traffic versus Google AdWords Keyword Planner

Wer hier öfter mitliest, der weiß, dass Sistrix eines meiner absoluten Lieblings-Tools ist (ich verlinke mal ganz dreist als bestes SEO Tool), allein schon wegen der schlanken API, dem absolut liebenswürdigen Johannes mit seinen wirklich schlauen Blog-Posts sowie der Unaufgeregtheit, mit der die Toolbox immer wieder überzeugt. Natürlich sind auch alle anderen Tools klasse, aber Sistrix ist sowas wie meine erste große Tool-Liebe, die man nicht aus seinem SEO-Gedächtnis verbannen kann oder will. Und auch wenn die folgenden Daten eventuell am Lack kratzen könnten, eine richtige Delle haben sie in meiner Sistrix-Präferenz nicht verursacht. Continue reading

Filed under: Data Science, SEOTagged with: , , , ,

Wie genau sind die Daten von keywordtool.io?

Nachdem der Google AdWords Keyword Planner nur noch für Konten mit ausreichend Budget granulare Daten ausspuckt, ist die Suche nach Alternativen groß. Rand Fishkin glaubt, dass Google Trends die Rettung sei, hat aber anscheinend nicht verstanden, dass Google Trends normalisierte, indexierte sowie Keyword-erweiterte Daten und keine absolute Zahlen liefert. In einem Punkt aber hat er Recht, auch der Keyword Planner liefert nicht wirklich genaue Daten, wie ich in diesem Artikel festgestellt hatte.Continue reading

Filed under: Data Science

Data Science meets SEO, Teil 5

Der letzte Teil dieser Serie über Suchmaschinenoptimierung/SEO und Data Science auf Basis meines Vortrags bei der SEO Campixx. Die Daten und den Code habe ich via Knit in ein HTML-Dokument überführt, das mein Notebook inklusive Daten nachvollziehbar macht. In dem Notebook sind auch ein paar mehr Untersuchungen drin, allerdings habe ich alles auf Englisch dokumentiert, da dies nicht nur für Deutsche interessant ist. Wer also alle Ergebnisse in einem Dokument lesen möchte (ohne die TF/IDF, WDF/IDF oder Stemming-Beispiele), schaut sich bitte das Data Science & SEO Notebook an. Speed und andere Faktoren sind in den vorherigen Teilen zu lesen.Continue reading

Filed under: Data ScienceTagged with: , , ,

R: dplyr/sparklyr vs data.table Performance

In their 2017 book “R for Data Science“, Grolemund and Wickham state that data.table is recommended instead of dplyr when working with larger datasets (10 to 100 Gb) on a regular basis. Having started with Wickhams sparklyr (R’s interface to Spark using the dplyr dialect), I was wondering how much faster data.table actually is. This is not the most professional benchmark given that I just compare system time before and after the script ran but it gives an indication of the advantages and disadvantages of each approach.

Continue reading

Filed under: Data ScienceTagged with: , , , , ,

R ist wie Rauchen

“Using R is a bit akin to smoking. The beginning is difficult, one may get headaches and even gag the first few times. But in the long run,it becomes pleasurable and even addictive. Yet, deep down, for those willing to be honest, there is something not fully healthy in it.”

Francois Pinard

Filed under: Data Science

Data Science meets SEO, Teil 3

In den ersten beiden Teilen ging es darum, was Data Science überhaupt ist und warum WDF/IDF-Werte sehr wahrscheinlich wenig mit dem zu tun haben, was bei Google unter der Motorhaube passiert. In diesem Teil geht es einen Schritt weiter, wir schauen nämlich, ob es Korrelationen zwischen Ranking Signalen und der Position gibt. Im Vortrag hatte ich das am Beispiel einer Suchanfrage gezeigt und angesichts der zur Verfügung stehenden Zeit auch eher kurz abgehandelt. Hier kann ich in die Tiefe gehen. Wir schauen uns hierbei allerdings erst einmal nur jedes einzelne Rankingsignal in Bezug auf die Positon an, nicht die eventuell vorhandene Wirkung der Rankingsignale untereinander.Continue reading

Filed under: Data ScienceTagged with: , , ,

Erfahrungen Vorwerk Staubsauger-Roboter VR200

Staubsauger-Roboter sind schon seit vielen Jahren mein Begleiter, angefangen mit einem Roomba iRobot über das erste Modell von Vorwerk bis hin zum aktuellen Modell Vorwerk Staubsauger-Roboter VR200, den ich kurz nach Markteinführung gekauft hatte. Der Vorteil des Vorwerk-Geräts damals war, dass es neben der angeblichen Vorwerk-Saugqualität auch möglich ist, die tägliche Reinigung zu automatisieren. Das konnten damals nur wenige Geräte. Auch dass er sich selbst merkt, wo er war wenn ihm der Strom ausgeht und sich auftankt und an diese Stelle zurückkehrt, ist eine große Erleichterung. Und da ich auch schon auf eine längere Historie mit Vorwerk zurückblicken kann, wechselte ich von Roomba auf Vorwerk. Continue reading

Filed under: Gadgets

Data Science meets SEO, Teil 2

Nachdem ich im ersten Teil erklärt habe, was Data Science ist und was es in diesem Bereich schon zum Thema SEO gibt, nun der zweite Teil, wo wir uns etwas genauer damit beschäftigen, was die linguistische Verarbeitung eines Dokuments durch eine Suchmaschine für eine Auswirkung auf SEO-Konzepte wie Keyword Density, TF/IDF und WDF/IDF hat. Da ich auf der SEO Campixx live Code gezeigt habe, biete ich hier alles zum Download an, was das Nachvollziehen der Beispiele noch erlebnisreicher macht 🙂 Das geht übrigens auch ohne die Installation von R, hier ist der komplette Code mit Erklärungen und Ergebnissen zu finden.Continue reading

Filed under: Data ScienceTagged with: , , ,