data > opinion

Tom Alby

01 Zur Vorbereitung: R und RStudio installieren

2021-10-21


Was ist R?

R ist eine Umgebung zur statistischen Datenverarbeitung und gleichzeitig eine Programmiersprache. Sie wurde 1996 veröffentlicht und ist eine Open Source-Implementierung der Sprache S.

Im Gegensatz zu SPSS, das mittlerweile zu IBM gehört, ist R eine kostenlose Lösung. Ein weiterer Unterschied zu SPSS: R ist sozusagen “nackt”, es kommt nicht mit einer graphischen Benutzeroberfläche wie SPSS, bei der vieles mit ein paar Klicks abgehandelt werden kann.

Programme, die in R geschrieben sind, werden nicht kompiliert, es handelt sich bei R also um eine dynamische Programmiersprache, deren Anweisungen in Echtzeit interpretiert werden.

R “pur”

R pur ## Installation R

R kann von der R Project Website heruntergeladen werden. Sofern Sie danach gefragt werden, nutzen Sie bitte einen CRAN-Mirror, der Ihrem Standort am nächsten ist. Dann ist der Download-Link eventuell etwas versteckt:

Wählen Sie hier bitte die aktuelle Version, falls bereits eine neuere Version als die im Screenshot dargestellte existiert.

Nach der Installation und dem Start von R wird der Nutzer mit einer Eingabeaufforderung begrüßt, wie ein UNIX/Linux-Terminal oder die altehrwürdige DOS-Benutzeroberfläche. Einige Befehle können auch mit dem Menü ausgeführt werden, aber die meiste Zeit verbringt der Analyst hier mit der sogenannten Konsole. Befehl eingeben, Ausgabe ansehen. Dies ist die interaktive Art, R zu nutzen.

Möchte man ein längeres Programm schreiben, so ergibt es jedoch wenig Sinn, den Programm-Code jedes Mal neu einzugeben. Daher werden Programme meistens in Dateien geschrieben, zum Beispiel hello_world.R, und diese Dateien dann in der R-Konsole ausgeführt, nachdem sie geladen wurden. R selbst bietet einen einfachen Editor.

Die Entwicklungsumgebung RStudio

Das Download-Paket findet sich auf der RStudio Website.

Man kann RStudio entweder als Desktop-Applikation installieren oder auf einem Server. Für die Server-Installation existieren Amazon Machine Images von Louis Aslett. Für ein paar Euro im Monat kann man sich somit eine RStudio-Instanz gönnen, die von jedem Browser aus erreichbar ist. Somit kann man zum Beispiel eine Analyse starten, den Rechner zuklappen, und den Server weiterhin rechnen lassen.

Zwar ist R auch in RStudio immer noch “nackter” als SPSS, aber schon um einiges komfortabler als das komplett “nackte” R. RStudio kann als integrierte Entwicklungsumgebung (oder IDE für Integrated Development Environment) für R angesehen werden. Alle wichtigen Funktionen und Programme für die Entwicklung von Software oder das Handling von Daten sind über eine Schnittstelle bedienbar. Es findet sozusagen kein “Medienbruch” statt, da man nicht zwischendurch zum Dateibrowser oder zum Terminal wechseln muss. Wichtig: Es muss zunächst R installiert werden (siehe vorheriger Abschnitt), dann RStudio.

RStudio GUI

Nachdem R und RStudio installiert und gestartet ist, erscheint RStudio mit drei beziehungsweise vier Fenstern, deren Funktionen unterschiedlich konfiguriert werden können. Die vier Fenster in der Standardkonfiguration haben folgende Funktionen:

  • Links oben ist der eigene Code sowie der Inhalt von Data Frames zu finden (dieses Fenster ist nicht beim Start zu sehen, sondern erst wenn eine Code-Datei oder ein Data Frame geöffnet wird)
  • Rechts oben werden alle Objekte aufgeführt.
  • Links unten ist die R-Konsole (die man auch sehen würde, wenn man nur R nutzte und nicht RStudio dazu) sowie ein Terminal-Fenster (das direkten Zugriff auf das darunter liegende Betriebssystem erlaubt)
  • Rechts unten sind die Daten im Dateisystem sowie Plots und eine Hilfefunktion zu sehen

in dem folgenden Video kann ein Rundgang durch das RStudio-Interface angesehen werden:

Eine Besonderheit bei RStudio sind die Projekte. Wird ein Projekt angelegt, so wird automatisch ein Verzeichnis erstellt und beim Wechsel von einem Projekt zum nächsten auch der jeweilige Workspace geladen. Die Projekte finden sich ganz oben rechts. Es wird empfohlen, dass für diesen Kurs ein eigenes Projekt in RStudio angelegt wird.

RStudio bietet auch eine Cloud-Lösung an; zum jetzigen Zeitpunkt ist die Nutzung noch kostenlos.