RStudio Tutorial - Institut für Ökologie

Grundlegendes zu RStudio (Tutorial)
Markus Bernhardt-Römermann, Institut für Ökologie, FSU Jena
Stand: 11.11.2015
Installation der Programme R und R-Studio
1. R herunterladen (Windows: https://cran.r-project.org/bin/windows/base/R-3.2.2-win.exe; Mac:
https://cran.r-project.org/bin/macosx/R-3.2.2.pkg; Linux: https://cran.r-project.org/bin/linux/)
2. Installation mit Standardeinstellungen durchführen.
3. RStudio herunterladen (https://www.rstudio.com/products/rstudio/download/, dort sind Versionen
für Windows, Mac und Linux verfügbar).
4. RStudio mit Standardeinstellungen installieren.
WICHTIG: Bei der Arbeit wird immer nur RStudio gestartet, R wird dann automatisch mitgestartet!
Vorbereitung von RStudio
1. RStudio starten (im MMZ unter „Startbutton“ -> „Alle Programme“ -> „Praktikum“ -> „RStudio“).
Unter „Tools“ -> „Global Options“ auswählen
1
In dem aufgehenden Fenster auf „Code“ klicken.
Danach bei „Soft-wrap R source files“ ein Häkchen setzen, dieses bewirkt den automatischen
Zeilenumbruch im R-Code.
WICHTIG: Im MMZ muss dieser Schritt nach jedem Neustart des Computers wiederholt werden,
auf dem privaten Rechner nur einmalig!
2
Anlegen eines R-Skripts in RStudio
1. RStudio starten (R wird automatisch mitgestartet).
2. Neues R-Skript anlegen, dazu unter „File“ -> „New File“ -> „R Skript“ auswählen.
3. Nun erscheint oben-links ein 4. Fenster. In diesem wird aller R-Code eingegeben!
3
4. Das neue R-Skript muss zunächst gespeichert werden.
WICHTIG: Unbedingt in das Verzeichnis speichern, in dem auch die Daten (Excel-files, etc.) liegen!
Zum Speichern auf die kleine Diskette klicken, danach in dem sich öffnenden Fenster den Ordner mit
den Daten auswählen und das Skript unter sinnvollem Namen speichern.
WICHTIG: Die Dateiendung muss *.R sein!!! Sollte diese nicht standardmäßig angezeigt werden,
muss sie manuell hinzugefügt werden!
HINWEIS: Falls beim Speichern nach dem „Encoding“ gefragt wird, wählt „ISO-8859-1“ aus, dann
können auch deutsche Buchstaben wie „ä“, „ü“, „ö“, etc. verwendet werden.
5. Arbeitsverzeichnis setzen.
Nach dem Abspeichern der R-Skripts muss noch das Arbeitsverzeichnis gesetzt werden. Dieses ist
notwendig, damit R „weiß“ wo es die potentiell zu ladenden Daten (Excel-Tabellen, etc.) suchen soll.
Dazu wird unter „Session“ -> „Set Working directory“ -> „To Source File Location“ ausgewählt.
WICHTIG: Dieser Schritt muss nach jedem Neustart von RStudio, oder nach jeder Anlage eines
neuen Skripts erfolgen! Bei Anfängern ist das Vergessen dieses Schritts für ca. die Hälfte aller
Probleme verantwortlich.
4
Schreiben und Ausführen eines R-Skripts in RStudio
1. In RStudio werden 4 Fenster angezeigt, diese haben die in der folgenden Abbildung dargestellten
Funktionen. Das Schreiben von Skripten erfolgt in dem Code-Fenster oben-links, das Ergebnis des
ausgeführten Codes wir in der R-Konsole unten-links angezeigt. Die beiden rechten Fenster sind
Hilfsfenster, dazu mehr im Kurs, bzw. unten.
Code (Skripte)
Objekte/ History
R-Konsole
Datei-Explorer
Plots
Packages
Hilfe
2. Schreiben und Ausführen von Code
R-Code wird immer in das Fenster oben-links eingegeben, niemals unten-links!!!
Beim Schrieben des R-Codes können Leerzeichen und Einrückungen (Tab-Taste) beliebig verwendet
werden, um das Skript übersichtlicher zu gestalten (Ausnahme „->“, s. Kurs). Leerzeichen werden
beim Ausführen des Codes ignoriert.
RStudio macht fortlaufend Sicherheitskopien, aber nach Fertigstellung eines Skriptes muss dieses
abgespeichert werden. Dieses erfolgt durch nochmaliges Drücken des Disketten-Symbols. Wenn ein
Skript keinen umgespeicherten Code enthält ist das Diskettensymbol grau dargestellt.
WICHTIG: Durch das Schreiben des Codes wird dieser noch nicht ausgeführt, dieses erfolgt
manuell!
5
Zum Ausführen des Codes gibt es mehrere Möglichkeiten
a. Ausführen allen Codes einer Zeile: Hierzu wird der Cursor an eine beliebige Position in der Ziele
gesetzt (nichts markieren!) und entweder die Tastenkombination Strg/Enter gedrückt (beide
Tasten gleichzeitig), oder mit der Maus auf „Run“ gedrückt.
b. Ausführen allen Codes mehrerer Zeilen gleichzeitig: Hierzu werden alle auszuführenden Zeilen
komplett markiert (dann blau hinterlegt), die Ausführung des Codes erfolgt wieder durch
Drücken der Tastenkombination Strg/Enter (beide Tasten gleichzeitig), oder indem mit der Maus
auf „Run“ gedrückt wird.
c. Ausführen eines Teils des Codes einer Zeilen: Hierzu wird der auszuführende Code markiert
(dann blau hinterlegt), die Ausführung des Codes erfolgt wieder durch Drücken der Tastenkombination Strg/Enter (beide Tasten gleichzeitig), oder indem mit der Maus auf „Run“ gedrückt wird.
6
3. Kommentieren
Beim Schreiben eines R-Codes sollte dieser immer kommentiert werden! Die Kommentare können
genutzt werden, um Erklärungen zu den Funktionen aufzuschreiben, oder um seine Gedanken bei
komplexeren Codes aufzuschreiben – wenn man in einiger Zeit den Code nochmals nutzen möchte,
ist eine Dokumentation extrem hilfreich!
Kommentare funktionieren nur im Fenster oben-links, diese werden mit abgespeichert, aber nicht
mit ausgeführt (beim „runterschicken“ durch Strg/Enter).
Kommentare werden durch das Rauten-Symbol „#“ eingeleitet, sie gehen immer ab dem „#“ bis zum
Ende der Zeile. Kommentare werden in R-Studio in grün angezeigt.
4. Organisation von Skripten
Bei komplexeren Skripten ist es sinnvoll diese in benannte Abschnitte einzuteilen. Diese Einteilung
erfolgt durch mindestens 4 Rauten-Zeichen vor und hinter dem Namen (z.B. „#### Abschnitt 1
####“). Die Abschnitte werden am unteren Rand des Code-Fensters angezeigt und man kann durch
Klicken zu dem Anfang eines Abschnitts springen.
7
5. Hilfe zu einer Funktion
Zu jeder R-Funktion gibt es eine Hilfe. Dort sind alle potentialen Argumente erklärt (mehr dazu im
Kurs). Die Hilfe wird in dem Fenster unten-rechts angezeigt. Um zum Beispiel die Hilfe zu der
Funktion print() aufzurufen gibt es zwei Wege:
a. Direkter Aufruf: „?print“ ausführen (runterschicken), dann wird die Hilfe angezeigt
b. Beim Schreiben des R-Codes: Den Cursor zwischen Namen der Funktion und die Klammer
setzen und die F1-Taste drücken.
Das Ergebnis: Hilfe zur Funktion print() im Fenster unten-rechts (Reiter „Help“).
8
Installation von zusätzlichen Packages
R beinhaltet in der Standardinstallation schon die meisten Funktionen zu einfachen statistischen
Analysen, es gibt aber zusätzliche Funktionen die mit Hilfe von Paketen implementiert werden
können. Diese Pakete sind auf dem CRAN-Server (Comprehensive R Archive Network, https://cran.rproject.org/) unter „Packages“ zu finden. Aktuell (Stand 12.11.2015) gibt es dort 7469 Pakete mit
Zusatzfunktionen, diese beinhalten (fast) alle weltweit verfügbaren statistischen Techniken und viele
Sonderfunktionen wie z.B. Datenimport, Datensätze, Graphik- oder GIS-Komponenten.
Wenn wir ein solches Paket nutzen wollen, müssen wir dieses zunächst installieren, und danach in R
starten (wie bei Apps: erst installieren, dann zur Nutzung starten).
Das Installieren geht in RStudio sehr einfach, dazu gehen wir im Fenster unten-rechts auf den Reiter
„Packages“ und wählen „Install“ aus.
Danach geht ein Fenster auf, und wir können den Namen des Paketes eingeben (ACHTUNG: R
unterschiedet zwischen Groß- und Kleinbuchstaben, macht aber Vorschläge). Danach noch Install
drücken und der Rest passiert von alleine.
HINWEIS: Sollte bei „Install from“ nicht „Repository (CRAN, CRANextra)“ angegeben sein, muss das
entsprechend verändert werden.
ACHTUNG: Durch das Herunterladen (Install) wird das Packet in R installiert, aber noch nicht
gestartet! Starten geschieht durch R-Code (oben-links eingeben, dann ausführen), dazu muss
library(„Name_des_Paketes“) eingeben werden.
9