Übersicht: R-Befehle R-Kurs für Statistik-Nebenfachstudierende, SoSe 2015 Ludwig Bothmann, Cynthia Huber, Simon Prokopf Grundlegende Syntax und Befehle Befehl Beschreibung <- Zuweisung ?function Hilfe zur Funktion function # Beginn Kommentar +, -, *, /, ˆ Addition, Subtraktion, Multiplikation, Division, Potenz >, <, ==, != >=, <= größer, kleiner, gleich, ungleich &, | Logisches UND, logisches ODER sqrt() Quadratwurzel abs() Absolutbetrag sin(), cos(), tan() Sinus, Kosinus, Tangens (in Bogenmaß) exp(), log() Exponentialfunktion, natürlicher Logarithmus c(1, 2, 3) verbindet die Werte 1, 2, 3 zu einem Vektor 1:n erzeugt den Vektor 1, 2, ...,n seq(from, to, by) erzeugt einen Vektor mit Elementen von from bis to in fester Schrittweite by rep(x, n) wiederholt den Vektor x n-mal length(v) Anzahl der Elemente im Vektor v v[i] Zugriff auf das i-te Element im Vektor v is.element(a, b); a %in% b Erzeugt logischen Vektor, der angibt, welche Elemente von a in b enthalten sind which() Gibt Position(en) der Elemente, für die die logische Abfrage TRUE ist max(v), min(v) Maximum, Minimum aus einem Vektor v mean(v), median(v) arith. Mittel, Median aus einem Vektor v sum(v), prod(v) Summe, Produkt der Elemente eines Vektors v sd(v), var(v) Standardabweichung, Varianz aus einem Vektor v data.frame() erzeugt einen neuen data.frame daten$A; daten[,’A’] Zugriff auf die Spalte A des data.frames daten daten[i,] Zugriff auf die i-te Zeile des data.frames daten daten[,j] Zugriff auf die j-te Spalte des data.frames daten sapply(daten, Funktion) Wendet auf jede Spalte der Daten eine selbstgewählte Funktion an 1 matrix(data, ncol = n) erzeugt eine Matrix mit n Spalten aus den Werten in data diag(x = , ncol = n) erzeugt eine Diagonalmatrix mit n Spalten mit dem Wert x als Diagonalelementen %*% Matrix- und Vektormultiplikation solve(M) Inverse der Matrix M dim(M) Dimension der Matrix M (Reihen und Spalten) M[i, j] Zugriff auf das Element der i-ten Reihe und j-ten Spalte der Matrix M t() transponieren dimnames(M), colnames(M), rownames(M) Benennen der Dimensionen (Spalten, Zeilen) der Matrix M setwd() Arbeitsverzeichnis festlegen getwd() Arbeitsverzeichnis anzeigen read.table("path/file") Laden einer Datei write.table(x, "path/file") Speichern von x in eine Datei install.packages("Name") Installieren eines Paketes library("foreign") Laden des foreign-Pakets, das Befehle zum Einlesen und Speichern von Datensätzen in anderen Formaten (SPSS, SAS, Stata) bereitstellt load("path/file.RData") Laden eines Workspaces save() Speichern von Objekten oder des gesamten Workspace str() Struktur eines Objekts anzeigen head(), tail() Anzeige der ersten bzw. letzten Elemente eines Objekts names() Anzeige oder Zuweisung von Namen eines Objekts Befehle zur Datenaufbereitung cut() Metrische Variable gruppieren factor() Erstellen einer Faktorvariable levels() Anzeigen und Zuweisen der Levels einer Faktorvariable relevel() Festlegung der Referenzkategorie einer Faktorvariable 2 Grafische Darstellung plot(x, y) Scatterplot x gegen y bei metrischen Variablen hist() Histogramm boxplot() Boxplot barplot() Balkendiagramm pie() Tortendiagramm curve(..., add=TRUE) Zeichnen einer Kurve ins Diagramm lines() Zeichnen einer Linie ins Diagramm abline() Zeichnen einer Geraden ins Diagramm points() Zeichnen von Punkten ins Diagramm text() Einfügen eines Textes ins Diagramm legend() Hinzufügung einer Legende ?par Hilfe zu graphischen Parametern par(mfrow=c(n, m)) n x m Plots in einem Fenster main="..." Überschrift xlab=, ylab = Achsenbeschriftung col= Farbwahl cex=, pch = Größe und Symbol eines Punktes lty=, lwd = Linientyp, Liniendicke type= Typ (l=Linie, p=Punkte, b=beides) xlim = c(a, b), ylim = c(d, e) Achsenbereich von a bis b bzw. d bis e pdf(width =, height =), bmp(), jpeg() Start Speichern einer Graphik, Größe der zu speichernden Grafik dev.off() Device schließen → Speichern beenden complete.cases() Überprüfung auf vollständige Zeilen summary() Zusammenfassung table() Häufigkeits- und Kontingenztabellen prop.table(table-Objekt, margin =) Erstellt auf Grundlage eines table-Objekts eine Tabelle mit Zeilen- (margin = 1) oder Spaltenprozenten (margin = 2) round(x, n) Runden von x auf n Nachkommastellen cor() Korrelation und Korrelationsmatrix 3 Befehle für die Regressionsanalyse lm() Lineares Modell ?lm Hilfe zu lm() ?summary.lm Hilfe zur Summary zu lm() summary(mod)$r.squared R2 eines geschätzten Modells summary(mod)$adj.r.squared Adjustiertes R2 eines geschätzten Modells coef() geschätzte Koeffizienten β̂ eines geschätzten Modells residuals(mod) Residuen ε̂ eines linearen Modells rstandard(mod) Standardisierte Residuen eines linearen Modells rstudent(mod) Studentisierte Residuen eines linearen Modells fitted() Gefittete Werte ŷ eines linearen Modells predict() Prädiktion neuer Werte mit bereits erstelltem linearen Modell logLik(mod) Log-Likelihood eines geschätzten Modells AIC(mod) Akaikes Informationskriterium eines geschätzten Modells BIC(mod) Bayesianisches Informationskriterium eines geschätzten Modells glm() Generalisiertes Lineares Modell Befehle zur Modelldiagnose acf(residuals, ...) Autokorrelationsfunktion qqnorm(residuals, ...) Q-Q-Normalplot qqline(residuals, ...) Linie im Q-Q-Normalplot hatvalues(model, ...) Diagonalelemente hii der Hat-Matrix H cooks.distance(model, ...) Cook’s Distance-Werte Di cor() empirische Korrelationsmatrix vif(model, ...) Varianzinflationsfaktor (braucht Paket car) 4
© Copyright 2024 ExpyDoc