Packages

Was sind Packages?

Ein großer Vorteil von R sind die Packages. Packages sind Sammlungen von themenspezifischen Funktionen, die die in Base R implementierten Funktionen erweitern. Mit Packages kann R somit beliebig angepasst werden, wodurch R sehr mächtig werden kann.

Im Sinne von Open Science darf jede:r diese zusätzlichen Funktionen und zugehörigen Packages schreiben und veröffentlichen, und jede:r darf auch auf den dafür verwendeten Code zugreifen.

Für die Packages sind auf „CRAN“ (Comprehensive R Archive Network), dem Hauptrepositorium von R, die Referenzhandbücher hinterlegt. In den Referenzhandbüchern werden die Funktionen eines Packages aufgelistet und erklärt, teilweise finden sich dort auch Anleitungen der Autor:innen oder der Autor:in des Package zur Verwendung ausgewählter Funktionen des entsprechenden Package (sogenannte Vignetten).

Der einfachste Weg, diese Referenzhandbücher und Vignetten zu finden, ist eine Suchmaschine. Mit dem Suchbefehlt CRAN dplyr müsste man folgende Seite finden:

Screenshot von CRAN mit dem Ergbnis für die Websuche nach dplyr.
Screenshot von CRAN mit dem Ergbnis für dplyr

Auf der Seite befindet sich ganz oben eine Kurzbeschreibung und unter der Dokumentation das Referenzhandbuch und die Vignette (rot umrandet).

Installieren von Packages

Die Packages sind kostenlos und einfach verfügbar. Mit dem Befehl install.packages() wird das jeweilige Package auf dem Computer installiert. In die Klammern wird das Packages, welches installiert werden soll, in Anführungszeichen geschrieben. Um das Package dplyr zu installieren, ist also folgender Befehl auszuführen:

install.packages("dplyr")

Nach der Installation ist das Package lokal auf dem Computer verfügbar und muss nicht abermals heruntergeladen werden. Um jedoch mit einem Package zu arbeiten, muss dieses noch aktiviert werden.

Aktivieren von Packages

Mit dem library()-Befehl werden die Packages aktiviert. In die Klammer wird der Package-Name eingesetzt – anders als beim Installieren werden beim Aktivieren keine Anführungszeichen gesetzt. Der Befehl, um das zuvor installierte dplyr-Package zu aktivieren lautet dementsprechend:

library(dplyr)

Wenn nur eine einzelne Funktion aus einem bestimmten Package verwendet werden soll, ist auch eine Möglichkeit, das Package direkt vor dem Gebrauch temporär für die jeweilige Funktion (und nicht dauerhaft) zu aktivieren. Dazu wird der Package-Name gefolgt von zwei Doppelpunkten :: genutzt. Dies bietet sich an, wenn ein spezielles Package nur für einen Schritt benötigt wird, um zu vermeiden, dass dieses Package mit anderen Packages in Konflikt gerät. Teil des dplyr-package ist die Funktion summarize(). Um dplyr speziell für die summarize()-Funktion temporär zu aktivieren, wird folglich dieser Code (ohne einen vorherigen library()-Befehl) genutzt:

dplyr::summarize()