Bitte zuerst lesen!

Dies ist eine etwas andere Version als im Buch, da ich noch einige Sachen hinzugefügt habe. Selbst wenn Sie keinen Zugriff auf eine eigene Webanalyse-Plattform haben, können Sie dieses Beispiel ausprobieren, da ich Ihnen einen Datensatz von meiner eigenen Website zur Verfügung stelle.

Libraries & Authentifizierung

Die folgenden Befehle auskommentieren (das “#” entfernen), um die Libraries zu installieren. Das muss nur einmal passieren.


Am bequemsten werden Daten aus Google-APIs mit einem Service User abgefragt. Andere Möglichkeiten sind hier nachzulesen:

Ich habe die Autorisierungsdaten in meinem R-Stammverzeichnis in der Datei .Renviron gespeichert; in der Datei steht nur

GA_AUTH_FILE = “/Users/tom/Shiny-d1739b8e7809.json”

Das muss natürlich an die eigenen Gegebenheiten angepasst werden (und natürlich benötigt man auch eine eigene JSON-Datei).

Die eigentliche Abfrage

ga_id= 1952687
start_date <- "2019-06-01"
end_date <- "2019-06-30"
ga_data <- google_analytics(ga_id,
      date_range = c(start_date,end_date),
      metrics = c("ga:users"),
      dimensions = c("ga:dimension1","ga:dimension2","ga:dimension3",
max = -1
ga_data2 <- google_analytics(ga_id, date_range = c(start_date,end_date),
metrics = c("ga:eventValue"),
dimensions = c("ga:dimension1","ga:dimension3","ga:deviceCategory","ga:eventCategory","ga:eventAction","ga:eventLabel","ga:sessionCount"),
max = -1
Transformation der Daten

ga_data_id <- ga_data %>%
  mutate(id = paste(dimension1,dimension3,sep="_")) %>%

ga_data_id2 <- ga_data2 %>%
  mutate(id = paste(dimension1,dimension3,sep="_")) %>%
  select(id,deviceCategory,eventCategory,eventAction,eventLabel,eventValue, sessionCount)
ga_data_final <- merge(ga_data_id,ga_data_id2,by="id",all=T)

Wir säubern und anonymisieren die Daten erst einmal, bevor wir sie zeigen:

ga_data_final <- ga_data_final %>%
  select(dimension1, dimension2, dimension3, sourceMedium, pagePath, sessionCount.x, deviceCategory, eventCategory,eventAction,eventLabel,eventValue)
i = 1
for (i in i:nrow(ga_data_final)) {
  ga_data_final$dimension1[i] <- digest(paste(ga_data_final$dimension1[i]))
  i <- i+1

Analyse und Ergebnis

top_pages <- ga_data_final %>%
  filter(dimension2 == "pageview") %>%
  group_by(pagePath) %>%
  summarize(n=n()) %>%

cv <- ga_data_final %>%
  group_by(pagePath) %>%
  filter(eventLabel == "YARPP Visibility") %>%
  summarize(cv = n()) %>%

new_ga_data <- merge(top_pages,cv)
new_ga_data %>%
  mutate(cvr = cv/n) %>%
  filter(n>49) %>%