dplyr vereinfacht den Umgang mit Data Frames
Die Arbeit mit Data Frames in R kann ganz schon mühsam sein, es sei denn, man benutzt dplyr. Dieser Artikel führt durch die nützlichsten Funktionen dieses praktischen R-Packages. Weiterlesen
Packages, Plots & eine Prise Python. Special guest: Mathematica
Die Arbeit mit Data Frames in R kann ganz schon mühsam sein, es sei denn, man benutzt dplyr. Dieser Artikel führt durch die nützlichsten Funktionen dieses praktischen R-Packages. Weiterlesen
Das Package googleVis
versorgt R mit einer Schnittstelle zur Google Chart API. Damit lassen sich interaktive Plots erstellen und in Webseiten einbetten. Die Daten bleiben dabei lokal und werden nicht zu Google hochgeladen. Als Beispiel dient eine interaktive Weltkarte, die die Bevölkerung des Landes anzeigt, das sich gerade unter dem Mauszeiger befindet. Weiterlesen
Wenn Daten oder Messwerte in einem Plot dargestellt werden, gibt es oft Schwankungen und Ausreißer. Die Linienglättung zeigt eine Art gleitenden Mittelwert und macht die Kernaussage eines Plots verständlicher. ggplot2 stellt alle nötigen Werkzeuge dafür bereit. Weiterlesen
Wer schon mal in R mit Datums- und Zeitangeben gearbeitet hat, der weiß, dass es wie es im Englischen so schön heißt „a pain in the ass“ ist. Datumsangeben kommen in unterschiedlichen Formaten daher, aus denen sich nur schwer einzelne Komponenten wie Tag, Monat oder Jahr exrahieren lassen. Dazu kommt der umständliche Umgang mit Zeitzonen, Sommerzeit und Schaltjahren. Mit dem Package lubridate (Link) ist das alles kein Problem. Weiterlesen
Lorenzkurven sind eine grafische Darstellungsform für die Abbildung von Ungleichheit und werden typischerweise für Einkommensverteilungen verwendet. Eingeführt hat sie Max Otto Lorenz im Jahr 1905. Das Beispiel zeigt die Lorenzkurve der Einkommensverteilung in Deutschland im Jahr 2011. Weiterlesen
Eine Treemap stellt Zahlenwerte als verschachtelte Rechtecke dar, wobei die Fläche der Rechtecke die Größenverhältnisse der Zahlen abbildet. R verwendet dafür das Package treemap
. Als Beispiel wird hier der Bundeshaushalt des Jahres 2015 visualisiert. Weiterlesen
Zufallszahlen spielen oft eine wichtige Rolle bei der Analyse von Daten. R bringt eine Reihe von Funktionen mit, die solche Zahlen aus verschiedenen Verteilungen generieren. Weiterlesen
Die Sitzverteilung in einem Parlament wird häufig mit einer Grafik dargestellt, für die es keinen richtigen Namen gibt. Am treffendsden sind noch die Bezeichnungen Halbkreisdiagramm oder besser noch Halbringdiagramm. Ein solches Diagramm mit ggplot2 zu erstellen, erfordert einige Umwege. Weiterlesen
Bevölkerungspyramiden zeigen die Altersverteilung einer Population. Grafisch betrachtet handelt es sich dabei um zwei vertikale Barplots. Die entsprechenden Daten für sämtliche Länder der Erde lassen sich online von der Seite www.census.gov abrufen und direkt im Skript verwerten. Weiterlesen
Eine Art Quasi-Standard für das Plotten mit R ist ggplot2. Es benötigt aber als Datenquelle einen Data Frame. Manchmal liegen die Daten aber in einem anderen Format vor, etwa Time Series oder xts. Hier hilft ggfortify, das eine ganze Latte Formate plotten kann. Es basiert auf ggplot2, so dass sich der Plot mit ggplot2-Syntax modifizieren lässt. Weiterlesen
© 2025 Yet another R blog
Theme von Anders Norén — Hoch ↑