Zusammenfassung

Sind alle Voraussetzungen erfüllt?
- Normalverteilung  PQ Plot
- Intervallskalierung
- Varianzhomogenität
(Test auf Homogenität in
Signifikanztest integriert)
- (keine systematischen
Gruppenfehlerterme)
nein
nichtparametrisches
Verfahren
(nicht Teil des Seminars)
nein
ja
parametrisches
Verfahren
parametrisches
Verfahren
(Begründen, dass die Verfahren recht robust
gegen Voraussetzungsverletzungen sind nach
z.B. Bradley ,1984  wenn mehrere
Voraussetzungen verletzt sind bricht die
Robustheit zusammen)
parametrische Verfahren
Differenzierung nach Fragestellung
Vorhersage von Kriterien
mehrere
Messebenen
Untersuchen von Gruppenunterschieden
eine
Messebene
UV mit 2
Ausprägungen
t-Test
MultiLevel
Analyse
Pfadanalyse
Strukturgleichungsmodell
ModeratorMediatoranalyse
eine UV / AV
mehrere UV / AV
UV mit mehr als 2
Ausprägungen
AN(C)OVA
MAN(C)OVA
ungerichtete
Hypothese
gerichtete
Hypothese
AN(C)OVA
Kontrastanalyse
Regressionsanalyse
(simultan vs. hierachisch)
Inferenzstatistik
Zahlenmuster werden gegen den Zufall getestet
Signifikanztest
• Alpha nahezu immer bei 5% oder 1%
• Nullhypothese (H0) vs. Alternativhypothese (H1)
• Teststärke berechnen
• Interpretation des p Wertes
• keine Aussage bei n.s. Ergebnis (Fisher), außer man macht eine a priori Poweranalyse
• Signifikanzkonventionen: Statistische Signifikanz: Wahrscheinlichkeit, dass ein Ergebnis (oder extremere Ergebnisse) bei
Gültigkeit der Nullhypothese eintreten
Power abhängig von:
• Stichprobengröße
• Effektgröße
• Alpha-Fehler
Regression
Beziehungen zwischen Kriterien und Prädiktoren
Kriterien sollen aus Prädiktoren vorausgesagt werden
ŷ = mx+b (Regressionsgerade)
multiple, univariate Regression
(Vorhersage eines Kriteriums durch mehrere Prädiktoren):
• ŷ = b0 + x1*b1 + x2*b2 + … + xm*bm
Interpretation:
• ANOVA: Signifikanzniveau
• R² = vom Modell aufgeklärte Varianz
• β als Regressionsgewichte
Schrittweise vs. Hierarchische Regression
Logistische Regression bei nicht-intervallskalierten
Kriterien
Regression
Beziehungen zwischen Kriterien und Prädiktoren
Idealfall: Prädiktoren unkorreliert (keine Varianzüberlagerung): beide Prädiktoren klären einen unabhängigen Teil der Varianz
des Kriteriums auf
Kriterium
Prädiktor 1
β1
Gesamtvarianzaufklärung: R² = β1 + β2
Prädiktor 2
β2
Regression
Beziehungen zwischen Kriterien und Prädiktoren
Normalfall: Prädiktoren korreliert (Varianzüberlagerung): beide Prädiktoren klären einen unabhängigen Teil der Varianz des
Kriteriums auf und einen gemeinsamen Teil  Die Gesamtaussagekraft des Modells ist geringer als die Aussagekraft beider
Prädiktoren
Kriterium
Prädiktor 1 Prädiktor 2
β1
Gesamtvarianzaufklärung: R² < β1 + β2
β2
gemeinsamer Teil
Regression
Beziehungen zwischen Kriterien und Prädiktoren
Problemfall: Prädiktoren korreliert, aber ein Prädiktor korreliert nicht mit dem Kriterium: ein Prädiktor klärt einen Teil der
Varianz des Kriteriums auf und ein Prädiktor maskiert einen Teil der Varianz des ersten Prädiktors  Die Gesamtaussagekraft
des Modells ist größer als die Aussagekraft beider Prädiktoren, da der maskierte Teil des Prädiktors 1 nicht mehr in die
Berechnung einfließt
Kriterium
Prädiktor 1
β1
Gesamtvarianzaufklärung: R² > β1 + β2  Supression
Prädiktor 2
maskierte Varianz
Varianzanalyse (ANOVA)
Untersuchen von Gruppenunterschieden
F-Test: Ist die Varianz der Gruppenmittelwerte höher, als rein durch Zufallsabweichung (Varianz innerhalb der Gruppen) zu
erwarten ist?  Unterscheiden sich die Gruppenmittelwerte irgendwie… unspezifische
Fragestellung
Interpretation: F > 1  systematische Varianz der Mittelwerte
p  signifikante systematische Varianz?
Mehrfaktorielle ANOVA: mehrere UVS  Haupteffekte und Interaktionen
Messwiederholte ANOVA: abhängige Stichprobe  separate Berechnungsformel!
• Messwiederholungsdesigns
• Dyaden: Zweierbeziehungen, Zwillinge, Sequenzeffekte, Lerneffekte, Carry Over Effekte
Multivariate ANOVA (MANOVA): mehrere AVS mehrere separate ANOVAs
• strengere Voraussetzungen: Multivariate Normalverteilung, Homogenität der Varianz-Kovarianz-Matrizen der einzelnen
Faktorstufenkombinationen (Homoskedastizität)
Kovarianzanalyse (ANCOVA): ANOVA mit statistischer Kontrolle von Drittvariablen
Post-hoc Tests: (z.B. Bonferroni)  konkrete Einflüsse aus unspezifischem ANOVA Ergebnis herausstellen
Kontrastanalyse
Kateg…
Kateg…
150
100
50
0
Kateg…
Kateg…
150
100
50
0
Kateg…
postuliertes Muster:
30
20
10
0
Kateg…
gerichtete Hypothesen bei Gruppenunterschieden
Vergeben von Kontrastgewichten für jede Gruppe (nach vermutetem Muster  müssen in Summe 0 ergeben)
Kontrastanalyse testet die Korrelation der Gruppenmittelwerte mit den Kontrastgewichten auf signifikanz
• Gütemaß : r(effect size)
Kontrastanalyse für abhängige Stichproben mit „L“ Aggregation
Vergleich von theoretischen Mustern mit Differenzwerten (nicht signifikant: Hypothese A erklärt die Befunde nicht besser als
Hypothese B)
Effektgrößen
praktische Bedeutsamkeit
Zusammenhangsmaße (r), Abstandsmaße (d,g), Varianzaufklärung (EtaQuadrat)
Berechnung aus Rohdaten; anderen Effektgrößen, Signifikanztestergebnissen möglich
http://www.psychometrica.de/effektstaerke.html
Metaanalyse:
• Aggregieren von Effektgrößen aus vielen Studien  Schätzen des tatsächlichen Populationseffekts
besser: mit SE
• Einbeziehen diverser Effekte, Moderatoren, Mediatoren,…
• Überprüfen der Güte: Funnel-Plot und psychometrische Berechnung von Populationszugehörigkeit
Moderator-, Mediatoranalyse
indirekte Einflüsse
Pfadanalyse / Strukturgleichungsmodell
mehrere direkte / indirekte Effekte von manifesten und latenten Variablen
Pfadanalyse: Modell um möglichst weitreichende, Längsschnitthypothesen zu testen
β (r)
Strukturgleichungsmodell: Zusammenhänge und Einflüsse latenter Variablen
• lineare Zusammenhänge
• Anzahl unbekannter Parameter muss kleiner gleich der Anzahl der bekannten Varianzen
und Kovarianzen sein
• Stichprobengröße (100/200, 25x Anzahl der zu schätzenden Parameter)
Gütemaße (Auswahl):
• Chi-quadrat Test (sig  keine
Modellpassung
• GFI, CFI, RMSEA,…
Multi-Level Analyse
separate und interaktive Analyse der Effekte mehrerer Erfassungsebenen
Ebenen: Gruppenebenen oder statisch vs. zeitlich abhängig
• Effekte von versch. Ebenen können voneinander getrennt untersucht werden
• Moderatoranalysen für separate und alle Ebenen
• Einfluss beliebiger Variablen und Ebeneninteraktionen berechenbar
alternative Verfahren
Differenzierung nach Fragestellung
Berechnen von Hypothesenwahrscheinlichkeiten: Bayesianische Inferenz
„Parametrisierung“ von Daten: Bootstrap
Vergleich von Treatment Gruppen: Alternating-Treatment Designs
Populationsparameterschätzung: Konfidenzintervalle, Metaanalyse
allgemeines:
Aussagen zur praktischen Bedeutsamkeit treffen: Effektgrößen (d, r, partielles EtaQuadrat,…)
kein rituelles Signifikanztesten: Voraussetzungen und Sinnhaftigkeit überdenken
Interpretation von Signifikanztests relativieren und Falschaussagen vermeiden
Poweranalyse im Vorfeld zur Stichprobenumfangsplanung
Inferenzstatistik testet gegen den Zufall, aber ist auch Fehlern und Zufällen unterworfen