Mehr als einen Kern unter Mac OS X nutzen

Heutige Prozessoren haben meist mehr als einen Kern, aber die meisten Programme nutzen nur einen. Oft ist es egal, der Rechner ist auch so schnell genug. Aber dann kommt man manchmal in Bereiche, wo man sich ärgert, dass man nur einen Kern nutzen kann. Vor allem bei den UNIX-Befehlen, die als GNU-Version zum Teil mehrere Kerne ausnutzen können, langweilt sich ein Teil meiner Mac-CPU während der andere zu 100 Prozent ausgelastet ist. In meinem Beispiel geht es um eine Text-Datei mit 8.6 GigaByte (nicht MegaByte :-), die ich sortieren und verarbeiten muss. Was wäre, wenn man mehr als einen Kern nutzen könnte?

Wie viele Kerne hat mein Mac überhaupt? Einmal Terminal öffnen und dann

sysctl -n hw.ncpu

eingeben, schon wird die Anzahl der Kerne ausgespuckt. Nur leider kann die Mac OS X-Version von sort nur einen Kern nutzen. Abhilfe schafft Homebrew:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Danach

brew update
brew install coreutils

…und schon hat man die GNU-Version von sort, die mit gsort aufgerufen werden kann. gsort versteht den Parameter –parallel=n, mit meinen vier Kernen also…

gsort --parallel=4 datei.txt

Und siehe da, ich habe über 350% CPU-Auslastung 🙂 Achtung: Das funktioniert nicht, wenn gsort in einer Pipe auf den Output eines anderen Befehles wartet.

5 Gründe, warum Du Google Trends falsch verstehst

Im September 2015 stand ich für Google auf einer großen Bühne in Berlin und zeigte neben der Sprachsuche auch die Vorteile der neuen Features von Google Trends. Für einen Daten-Liebhaber wie mich ist Google Trends ein faszinierendes Werkzeug, wenn man alle Stolperfallen versteht und zu vermeiden weiß. Gleichzeitig bietet das Werkzeug viel Potential für Missverständnisse 🙂 Suchanfragen werden in <> Klammern gesetzt.

1. Missverständnis: Die Basis der Daten

Google Trends basiert nicht auf allen Suchanfragen, die bei Google eingegeben werden.  Zitat: „Die Google Trends-Daten sind eine zufällige Auswahl an Daten aus Google-Suchanfragen. Nur ein bestimmter Prozentsatz der Suchanfragen wird zur Ermittlung der Trends-Daten herangezogen. […] Trends analysiert nur Daten für beliebte Suchbegriffe. Begriffe mit niedrigem Suchvolumen erscheinen daher als 0. […] Trends entfernt wiederholte Suchanfragen derselben Person innerhalb eines kurzen Zeitraums.“ Eine Definition, ab wann ein Begriff beliebt ist oder was ein kurzer Zeitraum ist, existiert nicht. Es wird nicht gesagt, ob die zufällige Auswahl eine repräsentative Stichprobe für die Gesamtpopulation aller Suchanfragen ist (wobei der Begriff „zufällig“ darauf schließen lässt). Die erste Erkenntnis: Wir reden hier von Trends, nicht mehr und nicht weniger.

2. Missverständnis: Linien und Suchvolumina

Dies ist das größte und das fatalste Missverständnis. Wenn eine Kurve über der anderen liegt, dann bedeutet das nicht, dass häufiger nach dem einen Begriff gesucht wurde als nach dem anderen. Waaaaas? Wirklich? Ja. Beispiel gefällig? Wir suchen nach Akne und nach Neurodermitis (ich erkläre weiter unten, warum ich das in der Maske in Anführungszeichen schreibe) für das Land Deutschland im Jahr 2015. Akne und Neurodermitis wechseln sich ab beim Suchinteresse, Akne scheint aber häufiger ein höheres Suchinteresse vorweisen zu können:

Google Trends: Akne und Neurodermitis

Und dann schaue ich mir die Daten einmal im Google AdWords Keyword Planer an, für den gleichen Zeitraum, für das gleiche Land:

keyword-planer

Interessant ist hier nicht die Grafik (ich hab den Screenshot nur gemacht, damit man sieht, dass ich im gleichen Land für den gleichen Zeitraum suche), sondern die beiden Zeilen darunter, wo wir das durchschnittliche Suchvolumen pro Monat sehen. Neurodermitis liegt weit über Akne, 74.000 zu 18.100.

Durchschnittswerte können uns in die falsche Richtung führen, also schauen wir uns auch noch die Daten auf die einzelnen Monate geplottet an:

akne-adwords

Wir sehen zu der Google Trends-Grafik eine Ähnlichkeit, nämlich dass die Suchen für Neurodermitis ab Mai bzw Mitte des Jahres runtergehen und ab September wieder hoch. Und, das wird später wichtig, Neurodermitis kommt bei Google Trends an die 100 dran, Akne erreicht diesen Punkt aber nie. Ansonsten berühren sich die Kurven der AdWords-Daten nicht ein einziges Mal wie in Google Trends. Sie sind weit auseinander. Zweite Erkenntnis also: Wir können anhand von Google Trends-Daten nicht behaupten, dass ein Begriff häufiger gesucht wird als ein anderer (dafür wird Google Trends allerdings häufig mißbraucht). Aber wieso kann man das nicht? Weiter zum nächsten Missverständnis.

3. Missverständnis: Was ist eine Suchanfrage?

Gibt man <akne> bei Google ein oder im Google AdWords Keyword Planer, so sucht man nur nach diesem Begriff. Gibt man <akne> bei Google Trends ein, so wird automatisch auch nach anderen Begriffen mitgesucht, selbst wenn man nicht ein Thema ausgewählt hat, sondern nur diesen Suchbegriff (siehe Google Trends Hilfe).  So kann man zwar etwas einschränken, indem ein Begriff in Anführungszeichen gesetzt wird („akne creme“), aber das schränkt nur ein, dass nicht nach <akne gute creme> gesucht wird, es könnte aber <gute akne creme> miteingeschlossen werden. Welche Suchbegriffe miteingeschlossen werden, wird nicht gesagt. Ein „Exact Match“ existiert nicht, siehe wieder die Google Trends Hilfe.

Schauen wir uns einmal die Unterschiede an:

akne-2015

In diesem Beispiel vergleichen wir die Suchbegriffe <akne> und <neurodermitis>. Fügen wir Anführungszeichen hinzu, dann sehen die Kurven etwas anders aus:

akne-anfuehrungszeichen

Keine riesengroße Änderung, aber es gibt einen Unterschied, den wir uns wieder für später merken: Geben wir die Begriffe ohne Anführungszeichen ein, dann kommt <akne> an die 100, mit Anführungszeichen kommt <neurodermitis> an die 100.

Verwunderlich ist es schon, denn bei einem Einwortbegriff, wo keine Synonyme mitgesucht werden, kann es auch keine unterschiedlichen Reihenfolge für die Wörter in der Suchanfrage geben. Dieses Phänomen können wir uns nicht erklären.

Schauen wir uns zuletzt noch an, was passiert, wenn wir das automatisch identifizierte Thema „Erkrankung“ auswählen (Hinweis: Google macht aus <neurodermitis> automatisch <atopisches ekzem>, was die medizinische Bezeichnung für Neurodermitis ist):

Google Trends: Akne und Neurodermitis im Thema Erkrankung

Hier werden die Trend-Daten von Begriffen aggregiert, die in die Gruppe der Erkrankung passen. Das „Suchinteresse“ an Neurodermitis kommt zwar im Februar 2016 an das Thema Akne heran, aber Akne als Thema scheint ein größeres Suchinteresse zu haben als Neurodermitis. Auch hier wissen wir nicht, welche Begriffe in der Gruppe zusammen gefasst werden. Es könnte also sein, dass die unterschiedlichen Daten daher kommen, dass in Google Trends für beide Begriffe zusätzliche Begriffe einbezogen werden, für den Begriff Akne aber Begriffe, deren Suchinteresse anders gestaltet ist und darum das Resultat verändert. Sehr plausibel klingt das aber nicht. Dritte Erkenntnis: Google Trends-Daten sind nicht vergleichbar mit AdWords-Daten, weil die Eingabe unterschiedlich interpretiert und angereichert wird und wir bei Google Trends nicht wissen womit.

Die Unterschiede zwischen AdWords und Trends sind somit aber wahrscheinlich immer noch nicht erklärt. Was könnten andere Gründe sein?

4. Missverständnis: Alles, was steigt oder fällt, ist ein Trend

Jetzt wird es etwas mathematisch. Google Trends bietet keine absoluten Zahlen, alle Daten werden auf einer Skala von 0 bis 100 abgebildet. Und jetzt erinnern wir uns wieder an die beiden Hinweise oben, als eine der beiden Suchanfragen-Kurven die 100 berührte. Das Berühren der 100 hat eine große Bedeutung, denn von diesem höchsten Punkt des Suchinteresses aus wird alles andere berechnet!

Aber es wird noch komplizierter: Zunächst einmal ist das Suchinteresse das Suchvolumen für einen Begriff geteilt durch das Suchvolumen aller Begriffe. Da wir die Basis nicht kennen (also wie viele Suchen es insgesamt gab an dem Tag) und sich diese Basis jeden Tag ändert, kann es sein, dass sich die Linie des Suchinteresses für einen Begriff ändert, obwohl jeden Tag gleich oft nach diesem Begriff gesucht wird. Der Zeitpunkt, an dem das Maximum dieser Ratio Suchbegriff/Alle Suchbegriffe erreicht wird, wird zum Maximum, also 100 im Google Trends-Diagramm, und alle anderen Werte, auch die von Vergleichsbegriffen, werden normalisiert davon abgeleitet. Und nur für den gewählten Zeitraum. Wird dieser geändert, so wird auch das Maximum wieder neu berechnet. Dies führt zu Unterschieden, die dazu verleiten könnten, dass man sich genau den Zeitraum aussucht, der zu dem passt, was man gerne verkaufen möchte 🙂 Beispiele:

Google Trends: Trump und Wetter

Fehlinterpretation: Im Vergleich zum Wetter ist das Interesse an Trump kaum gestiegen in den letzten 12 Monaten

Google Trends: Trump und Wetter

Fehlinterpretation: In den letzten 30 Tagen ist das Interesse an Trump nicht so stark gestiegen wie das an Wetter. Tatsächlich sind die Daten von Google Trends aber noch nicht aktualisiert, der Wahltag sowie der Vortag fehlen.

Google Trends: Trump und Wetter

Das Diagramm für die letzten 7 Tage: Können wir nun behaupten, dass Trump häufiger gesucht wurde als das Wetter?

Diese letzten Grafiken sind sehr schön weil sie einleuchtend zeigen, dass die Deutschen nicht unbedingt weniger nach dem Wetter gesucht haben, aber die Suchanfragen zum Begriff Trump am 9.11 einen deutlich höheren Anteil in der Population aller Suchen hatte im Vergleich zu den 6 Tagen davor. Von diesem einen Maximum wird alles andere berechnet. Über 30 Tage hinweg hatte das Wetter aber ein Maximum (EDIT: Weil der Tag nach der Wahl noch nicht drin war und es auch zwei Tage später nicht ist! Dank an Jean-Luc für diesen Hinweis!), und dann wird von da aus gerechnet. Darum können sich diese Daten so unterscheiden.

Edit: Schaut man einen Tag nach der Wahl und schaut nur auf den letzten Tag (also Daten, die ca 10 Minuten alt sind), dann sieht das Ergebnis so aus:

trump-danach

Wieder ist das Wetter höher, obwohl Trump nah dran kommt. Oder? Nun ja, ich habe diesen Screenshot abends erstellt, und der Peak an Trump-Suchen fand wohl vor mehr als 24 Stunden statt. Es ist sehr wahrscheinlich, dass ich ein anderes Bild bekommen hätte, wenn ich heute morgen die gleiche Abfrage getätigt hätte.

Was nehmen wir aus diesem Missverständnis mit? 1. Der Zeitraum der Beobachtung ist immens wichtig, und man sollte keiner Trends-Grafik glauben, ohne sich mehrere Zeiträume angeschaut zu haben 🙂 2. Alle Beobachtungen gehen vom Maximum aus und sind dann relativ von diesem Maximum aus zu sehen, sind aber gleichzeitig abhängig vom Gesamtvolumen aller Suchanfragen, das wir nicht kennen. 3. Es ist vielleicht nicht so offensichtlich in den Grafiken, aber in der 7-Tage-Grafik wird auf Stundenbasis gerechnet, in der 30-Tage-Grafik auf Tagesbasis, in der 12-Monate-Grafik auf Wochenbasis. Der Google AdWords Keyword Planer liefert Daten auf Monatsbasis aus. Auch deswegen sind die Daten nicht vergleichbar.

EDIT: 4. Learning: „Die letzten 30 Tage“ bedeutet nicht unbedingt, dass auch wirklich die letzten 30 Tage drin sind 🙂

5. Missverständnis: Alles, was steigt oder fällt, ist ein Trend, Teil 2

Kommt darauf an, wie man Trend definiert. Nach dem Brexit-Votum fand ein Journalist durch Google Trends heraus, dass die Briten erst nach dem Votum gegoogelt hätten, was der Brexit denn bedeutet, viele Zeitungen schrieben darüber, und erst nachdem ein Datenanalyst geschaut hatte, was da wirklich geschah, ruderten alle zurück. Ja, es wurde mehr danach gesucht, basierend auf… siehe das 4. Missverständnis 🙂 Aber im Vergleich zu einer populären Suchanfrage war da nur ein Zucken. Daten müssen immer in einen Kontext gesetzt werden, um ein Gefühl dafür zu bekommen, was das wirklich bedeutet. Ich nutze, obwohl ich kein Fußballfan bin, gerne die Suchanfrage <bundesliga>, aber auch <wetter>, um zu schauen, wie relevant ein Begriff wirklich ist.

Nach dem Wetter wird immer gesucht, allerdings ist auch hier eine gewisse Saisonalität zu beobachten, Bundesliga wird vorrangig von einem Teil der Bevölkerung gesucht, und das auch nur saisonal, aber auch hier können interessante Beobachtungen gemacht werden.

Google Trends: Bundesliga und Wetter im 7-Tage-Trend

Wir sehen hier wunderbar das Freitagsspiel (erste kleine Delle in der blauen Kurve), die Samstags-Spiele (größte Delle in der blauen Kurve) und dann wieder kleinere Dellen für die Sonntagsspiele. Das Wetter hat hier die höchsten Ausschläge, vor allem am Montag und am Dienstag (vielleicht wegen des Schnees?). Wurde also häufiger nach dem Wetter gesucht? Nein, nicht unbedingt! Da hier auf Stundenbasis gerechnet wird wird alles vom Maximum am 8.11., 5 und 6 Uhr gerechnet, zu dieser Zeit war das Suchinteresse (Suchanfrage/alle Suchanfragen) am höchsten, und alles andere wird relativ berechnet. Es kann also theoretisch sein, dass am Samstag nachmittag häufiger nach Bundesliga gesucht wurde als nach Wetter am 8.11., die Gesamtpopulation der Suchanfragen aber höher war! Was nehmen wir mit? Wir benötigen immer einen Bezugspunkt, einen Benchmark, etwas, womit wir das Suchinteresse vergleichen können. Und am besten wissen wir auch etwas über diesen Bezugspunkt, wie zum Beispiel in diesem Fall, dass es geschneit hat, und es deswegen Ausreißer gab.

Zusammenfassung

Der Mechanismus „Ich gebe zwei Begriffe in Google Trends ein und sehe, welcher populärer ist“ funktioniert so einfach nicht. Das wird aus den Köpfen schwer herausbekommen zu sein, denn das Interface ist wunderbar intuitiv und verleitet förmlich zu dieser Interpretation, und komplett falsch ist sie ja auch nicht. Schwierig ist es, wenn auf Basis dieser Daten folgenschwere Entscheidungen getroffen werden sollen, hier sind zusätzliche Daten notwendig. Keyword Planer-Daten stehen nicht mehr jedem zur Verfügung, sind aber eh nicht direkt vergleichbar, da Google Trends-Daten nicht reine Begriffe vergleichen.

Und dennoch ist Google Trends mehr als nur eine Spielerei. Man muss bei all dem oben Gesagten nur etwas mehr Gehirnschmalz investieren, um eine richtige Story daraus zu bauen.

Sorry übrigens für den reißerischen Titel. Ich wollte Deine Aufmerksamkeit. Ich hoffe, sie hat sich gelohnt 🙂

 

Google-Analytics-Daten in R einlesen

Datenformat aus Analytics exportiert sieht so aus:

11.01.13,"1,79"
12.01.13,"1,81"
13.01.13,"1,86"
14.01.13,"1,83"
15.01.13,"1,79"

R kann nichts mit dem Datumsformat anfangen, da R gerne das POSIX-Datumsformat hätte (Jahr-Monat-Tag).

> analytics <- read.table(file="analytics.csv", sep=",", dec=",", quote = "\"")
> analytics$V1 <- strptime(analytics$V1,format="%d.%m.%y")
> summary(analytics)
V1 V2
Min. :2013-01-11 00:00:00 Min. :1.000
1st Qu.:2013-12-19 06:00:00 1st Qu.:1.550
Median :2014-11-26 12:00:00 Median :1.630
Mean :2014-11-26 11:23:44 Mean :1.632
3rd Qu.:2015-11-03 18:00:00 3rd Qu.:1.710
Max. :2016-10-11 00:00:00 Max. :2.520
>

In letzter Zeit habe ich mir angewöhnt, read.table anstatt read.csv oder read.csv2 zu nutzen, denn ich kann mir den Unterschied zwischen den beiden letzten eh nicht merken und welche Parameter darin true sind oder nicht, und sie sind nur vorformatierte Variationen von read.table.

So kann es passieren, dass man unhübsche Daten bekommt, an denen selbst summary() kapituliert:


V1 V2
65.65796: 3 124.7975: 4
67.34629: 3 121.1097: 3
67.94061: 3 123.5503: 3
67.97769: 3 124.0167: 3
68.30287: 3 126.2769: 3
68.93456: 3 126.7902: 3
(Other) :21062 (Other) :21061

In diesem Fall liegt es einfach daran, dass der Header nicht mit eingelesen wurde. Ganz anders mit der Angabe:


> size <- read.table("file.csv", sep=";", header = TRUE)

> summary(size)
Height Weight
Min. :60.28 Min. : 78.57
1st Qu.:66.70 1st Qu.:119.31
Median :67.99 Median :127.20
Mean :67.99 Mean :127.09
3rd Qu.:69.27 3rd Qu.:134.88
Max. :75.15 Max. :170.92
>

10 Google Analytics Basics (auch für andere Web Analyse-Tools)

Google Analytics hatte letztes Jahr seinen 10. Geburtstag, und in den letzten mehr als 10 Jahren durfte ich einiges an Erfahrung sammeln, was man beim Einsatz von Web Analytics-Systemen beachten muss. Hier sind meine 10 Basic-Tipps, angefangen mit den absoluten Basics, den Abschluss bilden dann die Basics für diejenigen, die auch wirklich was mit ihren Daten anfangen wollen 🙂

  1. Nutze ein Tag Management System, vor allem bei komplexeren Konfigurationen (zum Beispiel Cross-Domain Tracking) ist das unabdingbar. Aber selbst wenn nur die hier beschriebenen Basics umgesetzt werden sollen, ist ein Tag Management System wichtig. Die meisten Systeme bieten eine Preview an, so dass nicht am offenen Herzen operiert werden muss. Und wenn Du Deinem Web Analytics-Menschen keinen Zugang zum Verändern des Analytics-Codes geben willst, dann ist ein Tag Management System sowieso Pflicht.
  2. Wo wir gerade dabei sind: Der Google Tag Assistant ist eine gute Ergänzung, wenn Du den Tag Manager und/oder Google Analytics nutzt.
  3. Teste alles, was Du tust, mit den Echtzeit-Berichten, sofern es nicht über den Tag Manager und den Tag Assistant getestet werden kann.
  4. Nutze die Adjusted Bounce Rate. Hieran führt nichts vorbei. Die Absprungrate ist normalerweise so definiert, dass ein Absprung gezählt wird, wenn ein Benutzer auf die Seite kommt und sie „sofort“ wieder verlässt. „Sofort“ ist dann je nach Definition und System irgendetwas zwischen 5 und 10 Sekunden. Bei Google Analytics ist es so, dass ein Bounce als solcher gezählt wird, wenn ein Benutzer auf eine Seite kommt und sich keine weitere Seite anschaut, egal wie lange er darauf war. Er ist also vielleicht gar nicht wirklich gebounced/abgesprungen, sondern hat sich die ganze Seite durchgelesen, und nachdem sein Informationsbedürfnis befriedigt war, ist er wieder gegangen. Bei manchen Content-Seiten ist das ein ganz normales Verhalten. Aber es ist eben nicht wirklich ein Bounce. Ein Bounce bedeutet für mich, dass ein Benutzer die Landing Page als irrelevant betrachtet hat und deswegen sofort wieder gegangen ist. Und das ist eine Baustelle, die man erst dann erkennt, wenn man die richtige Bounce Rate konfiguriert hat.
  5. Sei Dir darüber im Klaren, was der Sinn Deiner Seite ist. Da wärst Du auch alleine drauf gekommen? Ich habe zu oft erlebt, dass es in einer Firma sehr unterschiedliche Ansichten darüber gibt, warum eine Webseite existiert. Manchmal konnten sich die Teilnehmer eines Workshops in 2 Stunden nicht einigen. Warum existiert die Seite? Welche Rolle spielt sie in der gesamten Business-Strategie Deines Unternehmens? Ist es Abverkauf? Ist es Branding? Ist es Monetarisierung via Werbung? Wolltest Du einfach nur ein www auf dem Briefkopf haben? Hat Deine Seite mehrere Ziele? Auch ok. Schreib alle auf.
  6. Wie kannst Du nun messen, ob die Geschäftsziele erfüllt werden? Dafür definierst Du die KPIs. Beispiel: Du willst etwas verkaufen, dann ist Dein Ziel die Anzahl der Conversions. Oder? Bei genauerem Hinschauen hast Du wahrscheinlich ein Umsatzziel (z.B. 1.000€ am Tag), und da hilft Dir die Anzahl der Conversions wenig, sofern Du nicht bei jeder Conversion den gleichen Betrag einnimmst. Für das Umsatzziel gibt es mehrere Stellschrauben, Traffic, Conversion Rate, Warenkorbwert, Retouren. Daraus ergeben sich Unterziele, wie zum Beispiel 2.000 tägliche Benutzer, eine Conversion Rate von mindestens 1% (was übrigens ein guter Standardwert ist), und ein durchschnittlicher Warenkorb von 50€ sowie eine Retourenrate von 0% (was sehr unrealistisch ist, sofern Du kein digitales Produkt verkaufst). Kommst Du nicht auf die 1.000€, so musst Du anhand der genannten KPIs analysieren, warum das so ist. Bei Branding-Seiten hingegen haben wir andere Metriken. Du willst Nutzer, die nicht sofort wieder gehen (siehe Adjusted Bounce Rate oben). Du willst Nutzer, die sich mit Deiner Seite auseinander setzen, also könnten Time on Site oder Pages per Visit gute Metriken sein. Wenn Du vor allem Nutzer erreichen möchtest, die Dich noch nicht kennen, so ist die Metrik Anzahl Neuer Nutzer interessant. Aber auch hier: Setze Dir Ziele. Wenn Du keine Ziele hast, dann ist jede Zahl egal. Sind 300.000 Besucher gut oder wenig? Ist ein Wachstum von 2% gut oder nicht so gut? Komplett egal, wenn Du keine Ziele hast.
  7. Das Standard-Dashboard von Google Analytics ist relativ sinnfrei. Was sagt das Verhältnis von neuen zu wiederkehrenden Nutzern aus? Was machst Du mit dieser Information? Ganz ehrlich: Mit keiner der im Standard-Dashboard aufgeführten Informationen kannst Du tatsächlich etwas anfangen. Auf ein richtiges Dashboard gehören die tatsächlich wichtigen KPIs. Nutze die Galerie (in Google Analytics). Viele Probleme sind schon von anderen Nutzern gelöst worden.
  8. Web Analytics (wie auch Datenanalyse generell) beginnt mit einer Frage. Die Antwort ist nur so gut wie Deine Frage. Beispiele für gute Fragen: Welcher Akquise-Kanal bringt mir am meisten Umsatz (und, viel wichtiger, lohnt es sich mehr davon haben)? Was ist mit den Kanälen los, die weniger Umsatz bringen? Welche demographischen Zielgruppen „funktionieren“ (je nach Ziel) am besten, und welche Inhalte passen nicht für diese Zielgruppen? Liest meine Zielgruppe die Texte der Website bis zum Ende? Welche Elemente meiner Webseite erhöhen die Wahrscheinlichkeit, dass ein Benutzer bounced? An den Fragen sieht man schon, dass Web Analytics keine einmalige Angelegenheit ist, sondern kontinuierlich erfolgen muss.
  9. Segmentierung ist das Killer-Feature in der Web-Analyse. Fast jede Fragestellung kann durch Segmentierung beantwortet werden. Beispiel: Segmentierung nach Mobil versus Desktop, Demographien, Akquise-Kanälen. Ohne Segmentierung ist Analytics ein zahnloser Tiger.
  10. Und zum Abschluss das Killer-Basic: Du willst keine Daten. Was Du willst sind Informationen, mit deren Hilfe Du entscheiden kannst, was Du tun mußt. Analytics bietet Dir Daten, daraus ziehst Du Informationen, und daraus entstehen Aktionen. Daten -> Information -> Aktion, das ist das absolute Analytics-Mantra. Wenn es keine Aktion gibt, dann brauchst Du die Daten auch nicht. Mein ehemaliger Kollege Avinash nutzt dafür den So what-Test. Wenn Du nach dreimaligem Fragen von „Na und?“ keine Aktion aus einem Datum hast, dann vergiss den KPI. Ich würde noch einen Schritt weiter gehen: Wenn Du keine Frage hast (siehe Punkt 8), aus deren Antwort eine Aktion erfolgt, dann war die initiale Frage falsch.

Diese Liste ist nicht unbedingt vollständig, aber mit diesen 10 Punkten kommt man schon verdammt weit. Feedback immer erwünscht.

Scalable Capital und der Brexit

Anderthalb Monate sind entweder eine sehr lange oder eine sehr kurze Zeit für Anleger, ganz abhängig davon, ob sie jeden Tag traden oder ab und zu mal kaufen und sich dann 10 Jahre schlafen legen. Und wie gut die Algos von Scalable Capital funktionieren, das werden wir erst nach einer längeren Phase der Auf und Abs wissen. Aber der gewählte Brexit mit seinen Kurseinbrüchen ist ein guter Anlass einmal zu schauen, wie der RoboAdvisor damit klar gekommen ist.

Ich hatte den Machern von Scalable Capital schon am Freitag nach der Wahl Twitter-Kudos dafür geschickt, dass sie die Daten im Interface mehrmals täglich aktualisiert und nicht nur wie sonst die Daten des Vortags angezeigt haben. Transparenz schafft Vertrauen, denn natürlich möchte man wissen, was der Algo mit dieser Situation jetzt macht. Und tatsächlich, am Tag nach dem Referendum ging es bei mir nicht ganz so tief runter, um genau zu sein, es ging gar nicht runter, sondern rauf. Vergleiche ich mein Portfolio mit dem Dax, so lag der Dax an „meinem ersten Tag“ (an dem alle Anlagen vom Algo gekauft waren) bei 9890€, heute liegt er gerade aktuell bei 9.500€, gestern schloss er mit 9268€ ab, und mit diesem gestrigen Minus muss verglichen werden. Dem gegenüber steht bei mir im Scalable Capital-Interface eine „zweitgewichtete Rendite“ von 1,39% und eine „einfache Rendite“ von 1,37%. Natürlich ist der Vergleich etwas unfair, schließlich wäre die Alternative kein reines DAX-Portfolio, aber auch der Dow Jones und die Euro Stoxx haben sich nach unten entwickelt. Aber generell hat der Algo hier gewonnen.

Aber wie genau hat er das gemacht? So die Aussage in der Mail von letzter Woche:

Unser dynamisches Risikomanagement hatte bereits in den letzten Monaten die Kundenportfolios in konservativere Anlagen umgeschichtet, sodass die Auswirkungen der heutigen Kurseinbrüche deutlich gemindert werden. Insbesondere die derzeit auf Staats- und Unternehmensanleihen fokussierte Positionierung trägt zur Stabilisierung bei.

Was die Mail verschweigt ist, welche Signale dazu geführt haben, dass umgeschichtet worden ist. Aber das wird wahrscheinlich geheim bleiben, eben so wie die Coca Cola-Formel.

Erste Erfahrungen mit Scalable Capital & Update Number26

[Update III: Kein Interview für das Handelsblatt, aber dafür für die Welt]

[UPDATE II: Number26 hat eine Begründung für die Kündigungen nachgeschoben]

[UPDATE: Number26 hat Konten ohne Angabe von Gründen gekündigt, es wird bisher nicht kommuniziert, warum dies geschieht.]

Meine Begeisterung für Number26 ist immer noch erhalten, auch wenn sich einiges geändert hat seit meinem ersten Artikel:

  • Benutzer können sich einen Dispo einrichten
  • Mittlerweile gibt es auch EC-Karten
  • Es gibt die Möglichkeit, bei Partnern wie REWE Geld einzuzahlen und auszahlen zu lassen

Unschön ist, dass man mit den Karten nicht wirklich überall zahlen kann. In London verweigerte ein Geldautomat die Zusammenarbeit mit der Kreditkarte, in Amerika zeigten mehrere Kartenlesegeräte eine Fehlermeldung. Man sollte also gerade im Ausland immer eine weitere Kreditkarte eines anderen Unternehmens dabei haben. In Deutschland wollten die Automaten der Nord-Ostseebahn die EC-Karte nicht akzeptieren, was laut Support daran liegt, dass den Number26-EC-Karten der Girocard-/EC-Chip fehlt. Das tut meiner Begeisterung dennoch kaum einen Abbruch, denn gerade in Amerika war es wunderbar in Echtzeit sehen zu können, wie viel da gerade vom Konto abging. Meine Miles-and-More-Kreditkarte hat selbst nach drei Tagen immer noch nicht alle Buchungen auf dem Online-Konto.

Ein weiteres Fintech, das ich gerade ausprobiere, ist Scalable Capital. Ich hege ein (un?)gesundes Mißtrauen gegenüber den von Banken und Finanzberatern empfohlenen Anlageprodukten, versteckte Kosten sind anscheinend ein Kavaliersdelikt, und in manche meiner Verträge möchte ich schon gar nicht mehr reinschauen, weil ich in jungen Jahren einfach keine Ahnung hatte. Kostentransparenz wäre also schon mal eine gewaltiger Vorteil, wenn es um ein neues Angebot auf dem Finanzmarkt geht. Die Gebühren bei Scalable Capital betragen 0.75% des investierten Vermögens plus durchschnittlich 0,25% Kosten für die ETFs, die bereits in den ETF-Kursen der Anbieter berücksichtigt sind. Moment mal, Gebühren bei ETFs? Ja, auch ETFs kosten Geld, allerdings in der Regel weniger als ein aktiv gemanagter Fonds. Diese Gebühren hätte man aber eh bezahlt, nur dass man sich dessen vielleicht gar nicht bewusst gewesen wäre. Für 0,75% ist somit alles außerhalb der ETFs bezahlt, das Depot (was es oft genug eh schon kostenlos gibt, nur nicht bei dem Kooperationspartner von Scalable Capital, der Baader Bank), die Transaktionen, das Gehirn, das die Entscheidungen trifft, sowie die Gehälter der Mitarbeiter. Da Scalable Capital eh erst ab 10.000€ Vermögen neue Kunden aufnimmt, sind das also mindestens 75€ pro Jahr.

Beleuchten wir das „Gehirn“, das die Anlageentscheidungen trifft, einmal genauer, denn das ist der eigentlich spannende Teil dieses Fintechs. Man kann sich normalerweise von einem Finanzberater etwas empfehlen lassen, und bis auf die wenigen unabhängigen Berater, die sich in Deutschland eh kaum durchgesetzt haben, ist es nicht unwahrscheinlich, dass eine Provision für das empfohlene Produkt fließt. Abgesehen von den dadurch entstehenden Kosten, die der Kunde trägt, stellt sich die Frage, ob das empfohlene Produkt tatsächlich das beste Produkt ist oder die zu erwartende Provision bei der Empfehlung nicht vielleicht auch eine Rolle gespielt hat. Und selbst wenn der Finanzberater sich davon überhaupt nicht beeinflussen ließe, wie kann sichergestellt sein, dass tatsächlich das beste Produkt empfohlen wird? Woher weiß der Finanzberater das? Und wie lange bleibt es das beste Produkt? Wie oft empfiehlt einem der Berater, doch mal umzuschichten, weil sich der Markt geändert hat? Hat man nicht gerade eine wirklich hohe Summe auf dem Konto, so dass man in den Genuss einer richtigen Vermögensberatung kommt, dann sind die Optionen für den Normalverbraucher bestenfalls suboptimal.

Warum also nicht die Anlageentscheidungen einem Algorithmus, einem RoboAdvisor, überlassen, der sich nicht davon beeinflussen lässt, wie viel Provision er erhält? (Auch das wäre natürlich rein technisch möglich… wie eine Private Auction im Realtime Bidding) Und außerdem sehr viel mehr Informationen verarbeiten kann, als ein Mensch imstande ist? Der außerdem skalierbar ist und nicht nach der Höhe des zu verwaltenden Vermögens priorisiert? Aktiv gemanagte Fonds zum Beispiel schlagen sich nicht unbedingt besser als passive Fonds, und wie es um das Denken allgemein steht, nun ja. Algorithmen könnten die besseren Anlage-Manager sein, und das ist die Idee von Scalable Capital (neben der Art der Strategie, siehe dazu weiter unten). Das Unternehmen wird stehen und fallen mit der Performance seiner Algorithmen. Das Grundprinzip hier ist, dass die Algorithmen nicht auf Renditen optimiert wurden, sondern auf die Vermeidung von Verlust, ausgehend davon, dass die meisten Modelle das Verlustrisiko unterschätzen sowie das Renditepotential überschätzen („Asymmetrie der positiven und negativen Kursentwicklungen“). Das Whitepaper auf der Webseite erklärt das Prinzip sehr gut. Sich selber keine Gedanken mehr machen zu müssen und von einer Vermögensverwaltung profitieren zu können, die ansonsten nur wirklich Vermögenden vorbehalten ist, wäre ein zweiter gewaltiger Vorteil. Plus, da Scalable Capital selbst Vermögen verwalten darf, werden die Transaktionen auch gleich für einen durchgeführt. Wie das alles genau funktioniert, darüber haben andere schon viel geschrieben.

Aber zu den ersten Erfahrungen. So schnell wie Number26 klappte die Konto-Eröffnung nicht. Zwar kann man auch hier via Video-Chat die Anmeldung vornehmen, aber bis das Konto tatsächlich eröffnet und die initiale Anlagesumme vom Referenzkonto abgebucht und dem Baader-Tagesgeldkonto gutgeschrieben ist, vergeht eine gute Woche. Baader hat mir dann auch noch ein Passwort für die Webseite geschickt, das ich nicht mal lesen konnte, weil es so dünn gedruckt war, so dass mein Zugang nach drei Fehlversuchen gesperrt war. Die Telefon-Hotline war nett, wollte das Problem aber nicht sofort beheben, und auch der Rückruf blieb aus. Alles in allem klappte aber auch das irgendwann. Und dann dauert es auch noch ein paar Tage, bis Geld von diesem Konto abgebucht und die ersten Papiere eingekauft werden. Zumindest bei mir wurde auch nicht sofort alles investiert, sondern auf zwei aufeinander folgende Tage, wobei immer noch etwas Geld auf dem Tagesgeldkonto über blieb. Und zunächst ging der Wert meines Portfolios minimal runter, aber wie es nunmal ist bei solchen Geldanlagen: erst mal schlafen legen. Auch der DAX ging in diesem Zeitraum runter.

Die App wie auch die Webseite sind ästhetisch und funktional gestaltet, kein Schnickschnack, schnell ladend. Die App hat lediglich Informationswert, Auf der Webseite und mittlerweile auch in der App kann man Ein- und Auszahlungen veranlassen sowie die monatliche Sparrate verändern. Das Portfolio zeigt genau, in welche Produkte investiert wurde, auch hier herrscht absolute Transparenz. Aus irgendeinem Grund kann ich keine Screenshots erstellen aus der App, anscheinend ist das durch die App unterbunden.

Screenshot 2016-05-23 14.11.30Das Portfolio wird verglichen mit einem Durchschnittsportfolio, wobei nicht wirklich klar ist, wie sich dieses Durchschnittsportfolio gestaltet. In der Hilfe steht lediglich, dass es um repräsentatives Portfolio der letzten 15 Jahre handelt, aber woher wurde dieses Portfolio genommen? Und welche Relevanz hat diese Information? Ich kann mein Portfolio eh nicht ändern.

Insgesamt macht Scalable Capital einen guten Eindruck auf mich. Es wird einige Zeit dauern, bis die Qualität der Algorithmen bewertet werden kann, ab und zu werde ich hier ein Update geben.

Warum Number26 allen Banken Angst machen sollte

Seit einigen Wochen bin ich Kunde bei number26 (momentan nur auf Einladungsbasis), und das ist das erste Mal, dass ich so begeistert bin von einem Finanzprodukt, dass ich davon auch anderen gerne erzähle.

  • Die Kontoeröffnung dauert tatsächlich nicht länger als 10 Minuten, und man kann sie kurz mal nebenbei machen via Internet und Videokonferenz. Sehr innovativ.
  • Die Kreditkarte sieht einfach nur cool aus. Ich werde regelmäßig darauf angesprochen. Gesendet wurde sie auf einem schwarzen Karton, der sehr edel aussah.
  • Die App wie auch die Webseite sind unglaublich. Hier wurde nicht einfach ein Bankprodukt vom Desktop auf eine App geschoben, sondern tatsächlich nachgedacht, was dem Nutzer mit seinem Mobiltelefon das Leben einfacher macht und welche Infos sowohl im Web als auch auf der App wirklich nützlich sind. Hier wurde viel Gehirnschmalz investiert, um den Benutzer zu unterstützen. Ästhetisch außerdem einfach wunderschön.
  • Was manche vielleicht als Nachteil sehen, ist für mich ein Vorteil: Es gibt keinen Kredit, aber dafür sehe ich jederzeit, wie viel Geld ich noch habe, und zwar in Echtzeit! Ich muss nicht warten, bis mein Kreditkartenunternehmen mir zeigt, welche Buchungen reingekommen sind (was zum Beispiel bei der Miles and More-Kreditkarte echt schwierig und mobil fast unmöglich ist). Ich kriege jedes Mal sofort eine Push-Benachrichtigung, wenn Geld angekommen oder ausgegeben worden ist, nicht erst nach 2 bis 3 Tagen. Warum hat das noch nie jemand vorher hinbekommen? Anders als bei meinen anderen Karten gebe ich jetzt nicht mehr so viel Geld aus (was für eine Bank natürlich besser wäre), da ich genau weiß, wie viel Geld ich noch habe.
  • Keine Gebühren. Weder beim Abheben noch beim Geldausgeben im Ausland. Danke! Ich fühle mich nicht mehr abgezockt!
  • Nachdem ich ein neues Handy bekam weil das alte gestorben war, konnte ich weder die App von number26 noch die meiner Hausbank noch nutzen. Bei number26 war es ein Anruf aus der App, nach 5 Minuten war das Thema erledigt. Bei meiner Hausbank musste ich mich mehrmals durch die Telefonmenüs hangeln („Wenn Sie x wollen, dann drücken Sie bitte die 1…“), mit dem Ergebnis, dass ich mein altes Handy bräuchte (Hahaha!), oder, nach Eskalation, meine iTAN-Liste. Die hatte ich natürlich nicht mehr. Und Dank des Poststreiks dauerte es 2 Wochen, bis ich wieder an mein Geld kam. Ok, ich hätte Telefonbanking machen können. Welcome to the 21st Century, liebe Hausbank.

Ich kann nur hoffen, dass number26 von den strengen Reglementierungen im Finanzsektor nicht zu viel Federn lässt.

Meditation und Low Carb

Screenshot 2015-06-27 09.32.08Das Ziel für Mai war die tägliche Meditation, dieses Mal für einen guten Zweck, und auch wenn es mit dem Spendensammeln dieses Mal nicht so gut geklappt hat, habe ich zumindest die tägliche Meditation geschafft und seitdem auch beibehalten. Hierfür nutze ich nun fast ausschließlich die Headspace App, zum einen weil man sich an das Programm (also das jeweilige Thema) gewöhnt, zum andern, weil ich so auch besser meine Historie verfolgen kann.

Für Juni hatte ich mir dann was ganz anderes vorgenommen: Ein Monat ohne Kohlenhydrate. Gleich vorab: Das geht so gut wie gar nicht, auch in Obst oder Gemüse sind Kohlenhydrate. Damit gemeint ist also eher eine Reduktion der Kohlenhydrate in der Nahrung, und da kann man schon mal gut damit anfangen, Kartoffeln, Brot, Reis und Nudeln wegzulassen. Das Frühstück besteht dann aus Rührei, Obst, vielleicht etwas Joghurt und dann noch etwas Lachs oder Käse. Zu Mittag gibt es Salat und/oder Gemüse, eventuell mit einem Stück Fisch oder Fleisch, und abends dann noch mal Salat.

Was sich durch diese Ernährung sehr schnell verbesserte war meine Haut. Das hatte ich schon mal ausprobiert, und das Ergebnis ist, dass die Haut frischer und jünger aussieht. Auch Hautrötungen, die ich gerne mal nach wenig Schlaf habe, sind verringert.

Außerdem ist man nach dem Essen nicht mehr so träge, nicht mehr so voll. Das hilft besonders bei längeren Arbeitstagen enorm.

Meine Hoffnung war, dass sich durch diese Diät auch andere Symptome verringern, so berichtete ein mir sehr lieber Geschäftspartner, dass er keine Entzündungen mehr in seinem Körper hätte, was ihm beim Laufen sehr helfen würde. Tatsächlich habe ich keine Probleme mehr mit der Patella-Sehne gehabt, die mich beim Laufen am meisten gequält hatte. Leider führte das dazu, dass ich dann eher zu viel trainiert habe :-/

Gleichzeitig hatte ich mir etwas Literatur empfehlen lassen, in diesem Fall ein Buch von Dr. Strunz, was mich ehrlich gesagt sehr enttäuscht hat. Abgesehen von den Halbsätzen ohne Subjekt und dem oberlehrerhaften Ton wiederholt sich der Autor in einer Tour. Der Informationswert eines Buches für 20 Euro kann wahrscheinlich auf 2 Seiten reduziert werden. Das einzige, was ich für mich hier mitgenommen habe, ist, dass ich mehr Eiweiß zu mir nehmen muss und was ich bei dem Kauf eines Eiweiß-Präparats beachten muss (Tryptophan-Anteil so hoch wie möglich).

Was ich auch noch versucht habe: Sport vor dem Frühstück. Zunächst dachte ich, dass ich umkippe. Und tatsächlich war mir manchmal etwas übel, ist es auch heute noch, aber ich schaffe mehrere Kilometer. Trotzdem wird das meine 30-Tage-Challenge für Juli sein: Früh morgens Sport, vor dem Frühstück, weiterhin Low Carb. Dabei wird mir mein neues Gadget helfen, ein Gerät von Omegawave, das die Herzfrequenzvariabilität misst und mir sagt, welche Intensität mein Training haben kann. Es hat etwas länger als die 8-14 Business Days gedauert, bis das Gerät bei mir ankam, aber der erste Test heute morgen war ganz interessant: Nach knapp 6 Stunden Schlaf sagte es mir, dass meine Belastbarkeit „fair“ sei, bei einem zweiten Test gleich danach „poor“. Mehr dazu nächsten Monat, wenn ich mehr Erfahrungen mit Omegawave gesammelt habe.