Überschneidungen von ETFs in einem UpSet-Diagramm visualisieren

Heute kommen mal zwei für mich spannende Themen zusammen, nämlich Datenanalyse- und visualisierung sowie Finanzen. Die Wahl der richtigen ETFs füllt unzählige Internetseiten und Finanzmagazin-Artikel, spannend ist hierbei aber auch, welche Überschneidungen ETFs haben. Verglichen hatte ich schon mal den Vanguard FTSE All-World High Dividend Yield UCITS ETF USD Distributing (ISIN: IE00B8GKDB10) und den iShares STOXX Global Select Dividend 100 UCITS (ISIN: DE000A0F5UH1). Ich hatte auch schon die Performance verglichen von diesen beiden und dem VanEck Morningstar Developed Markets Dividend Leaders ETF (NL0011683594) und einem MSCI World ETF (IE00B4L5Y983).

Die Holdings, die in einem ETF enthalten sind, können auf den Webseiten der jeweiligen Anbieter heruntergeladen werden; diesen Download habe ich am 5. Oktober getätigt. Die Daten benötigen einiges an Transformation, damit sie miteinander verglichen werden können. Mein in R geschriebenes Notebook kann man sich hier ansehen. Für die Visualisierung habe ich ein UpSet-Diagramm gewählt, eine relativ neue Visualisierungsart, die ich für ein Paper und noch ein anderes genutzt habe. Für Überschneidungen zwischen Datensätzen werden häufig Venn-Diagramme genutzt, aber wenn man mehr als 3 oder 4 Datensätze hat, dann wird das schnell unübersichtlich, wie man hier schön sehen kann:

Die Größe der Kreise sagt zum Beispiel nicht unbedingt etwas aus über die Größe der Datensätze. Ganz anders ein UpSet-Diagramm:

Ja, das braucht auch ein bisschen, aber es zeigt viel klarer, wie sich die Datensätze miteinander verhalten. Ganz links sehen wir die Größe der Datensätze, und der Vanguard FTSE All-World High Dividend Yield hat die meisten Holdings, über 2.000. Auf der rechten Seite sehen wir die Überschneidungen. Der Punkt ganz unten unter dem höchsten vertikalen Balken bedeutet, dass der Vanguard FTSE […] 1.376 Aktien hat, die kein anderer ETF hat. Ebenso hat der iShares Core MSCI World 757 Titel, die kein anderer ETF hat. Und in der dritten Spalte sehen wir, dass diese beiden ETFs 486 Titel haben, die die beiden anderen ETFs nicht haben. Das finde ich schon mal sehr spannend. Ich hätte zum Beispiel nicht gedacht, dass der Vanguard so viele Aktien drin hat, die der MSCI World nicht hat. Der VanEck hat angeblich eine Aktie, die kein anderer ETF hat, aber das stimmt nicht, in der Zeile war das lediglich Cash. Ansonsten sind 81 von seinen 100 Titeln auch im MSCI World drin. Alle seine Titel sind im Vanguard drin.

Spannend wäre jetzt noch zu sehen, wie die Gewichtungen übereinstimmen. Aber das ist eine zusätzliche Dimension, die sich wahrscheinlich nur schwer in einem UpSet-Diagramm abbilden lässt. Trotzdem ist es notwendig, hier einmal genauer drauf zu schauen, denn es könnte sein, dass man durch die jeweiligen Überlappungen etwas übergewichtet, was man nicht übergewichtet haben möchte. Das wäre ein Thema für den nächsten Blogeintrag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert