Formelsammlung Statistik Grundkurs

Formelsammlung zur Lehrveranstaltung
Statistik für Betriebswirte
12. Oktober 2015
Inhaltsverzeichnis
1 Beschreibende Statistik
1.1 Eindimensionale Daten . . . . . . . . . . .
1.1.1 Parameter . . . . . . . . . . . . . .
1.1.2 Graphiken . . . . . . . . . . . . . .
1.2 Zweidimensionale Daten . . . . . . . . . .
1.3 Konzentrationsmaße . . . . . . . . . . . .
1.4 Zeitreihen . . . . . . . . . . . . . . . . . .
1.5 Indizes . . . . . . . . . . . . . . . . . . . .
1.5.1 Indexzahlen . . . . . . . . . . . . .
1.5.2 Umbasierung einer Indexreihe . . .
1.5.3 Verknüpfung von zwei Indexreihen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Grundlagen der Wahrscheinlichkeitsrechnung
2.1 zufällige Ereignisse und Wahrscheinlichkeiten . . . . .
2.1.1 Definition der Wahrscheinlichkeit . . . . . . .
2.1.2 Rechengesetze . . . . . . . . . . . . . . . . . .
2.1.3 Bedingte Wahrscheinlichkeiten . . . . . . . . .
2.1.4 Kombinatorische Formeln . . . . . . . . . . .
2.2 Zufallsgrößen und deren Charakteristika . . . . . . .
2.2.1 Diskret verteilte Zufallsgrößen . . . . . . . . .
2.2.2 Stetig verteilte Zufallsgrößen . . . . . . . . . .
2.2.3 Erwartungswert, Varianz, Standardabweichung
2.3 Wichtige Wahrscheinlichkeitsverteilungen . . . . . .
2.3.1 Diskrete Verteilungen . . . . . . . . . . . . . .
2.3.2 Stetige Verteilungen . . . . . . . . . . . . . .
3 Grundlagen des statistischen Schließens I
(Schätzungen)
3.1 Stichproben . . . . . . . . . . . . . . . . . .
3.1.1 Stichprobenfunktionen . . . . . . . .
3.1.2 Stichprobenplanung, Datengewinnung
3.2 Parameterschätzungen . . . . . . . . . . . .
3.2.1 Punktschätzungen . . . . . . . . . .
3.2.2 Konfidenzschätzungen . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
2
4
7
8
10
10
10
10
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
und Kovarianz
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
11
11
11
12
12
13
14
15
16
17
18
18
22
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . . .
. . . . . . . . . . .
durch Stichproben
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
29
30
33
33
34
4 Grundlagen des Statistischen Schließens II (Tests)
4.1 Signifikanztest für Verteilungsparameter . . . . . . . . . . . . .
4.1.1 Statistische Tests . . . . . . . . . . . . . . . . . . . . . .
4.1.2 p-value (p-Wert) . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Parametertests . . . . . . . . . . . . . . . . . . . . . . .
4.1.4 Nichtparametrische Tests . . . . . . . . . . . . . . . . . .
4.2 Stichprobenpläne zur Qualitätskontrolle . . . . . . . . . . . . . .
4.2.1 (n, c)-Stichprobenplan . . . . . . . . . . . . . . . . . . .
4.2.2 Approximative Berechnung eines (n, c)-Stichprobenplanes
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
37
39
40
46
48
48
49
4.3
4.2.3 Sequentielle Stichprobenpläne . . . . . . . . . . . . . . . . . . .
Kontrollkarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 Varianzanalyse
5.1 einfache Klassifikation . . . . . . . . .
5.1.1 Test bei Normalverteilung . . .
5.1.2 Kruskal-Wallis-Test . . . . . . .
5.2 zweifache Klassifikation . . . . . . . . .
5.2.1 Schätzung der Modellparameter
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
50
52
52
52
53
53
55
6 Korrelationsanalyse
6.1 Zwei Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1.1 Gewöhnlicher Korrelationskoeffizient (Bravais-Pearsonscher Korrelationskoeffizient) . . . . . . . . . . . . . . . . . . . . . . . . .
6.1.2 Spearmansche Rangkorrelation . . . . . . . . . . . . . . . . . .
6.1.3 Kendallsche Rangkorrelation (Kendalls τ ) . . . . . . . . . . . .
6.2 p > 2 Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Partieller Korrelationskoeffizient . . . . . . . . . . . . . . . . . .
6.2.2 Multipler Korrelationskoeffizient . . . . . . . . . . . . . . . . . .
56
56
7 Regressionsanalyse
7.1 Lineare Regressionsanalyse . . . . . . . . . . . .
7.1.1 Einfache lineare Regression . . . . . . .
7.1.2 Multiple(parameter-) lineare Regression
7.2 Regression mit qualitativen Merkmalen . . . . .
7.2.1 Logit-Modell . . . . . . . . . . . . . . .
7.2.2 Probit-Modell . . . . . . . . . . . . . . .
61
61
61
65
67
67
67
8 Anhang
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
56
58
59
60
60
60
68
3
1
1.1
Beschreibende Statistik
Eindimensionale Daten
Stichprobe eines Merkmals X mit Stichprobenumfang n:
x1 , x 2 , . . . , x n .
Geordnete Stichprobe:
x(1) ≤ x(2) ≤ . . . ≤ x(n) .
1.1.1
Parameter
Lageparameter
empirischer Modalwert: Wert mit der größten Häufigkeit in der Stichprobe.
empirisches α− Quantil:
½
x(k) ,
falls n · α nicht ganzzahlig : k ist die auf n · α folgende ganze Zahl;
x̃α =
1
(x(k) + x(k+1) ), falls n · α ganzzahlig : k = n · α.
2
empirischer Median (α = 0.5):
x̃ = x̃0.5 .
unterer Viertelwert (unteres Quartil) (α = 0.25):
Vu = x̃0.25 .
oberer Viertelwert (oberes Quartil) (α = 0.75):
Vo = x̃0.75 .
arithmetisches Mittel:
n
1X
x=
xi .
n i=1
Streumaße
empirische Varianz (Stichprobenstreuung):
n
n
n
1 X
1 h X 2 1 ³ X ´2 i
xi −
xi
.
s2 =
(xi − x)2 =
n − 1 i=1
n − 1 i=1
n i=1
empirische Standardabweichung:
s=
√
s2 .
Quartilsabstand:
d = Vo − Vu .
empirischer Variationskoeffizient:
v=
s
.
x
1
1.1.2
Graphiken
Die Häufigkeitsverteilung einer kategoriellen Variable X kann als Kreisdiagramm oder
als Balkendiagramm dargestellt werden.
Kreisdiagramm
Balkendiagramm
gruppiert:
gestapelt:
2
Histogramm:
Die Häufigkeitsverteilung eines metrischen Merkmals X kann durch ein Histogramm
dargestellt werden. Ein Histogramm erfordert die Einteilung der Merkmalsachse in
aneinandergrenzende Klassen. Die Fläche der Rechtecke über den Klassen ist proportional zur Häufigkeit des Merkmales in der Klasse. Das optische Bild eines Histogrammes ist stark abhängig von der gewählten Klasseneinteilung. Ein Histogramm kann
als Schätzung der Wahrscheinlichkeitsdichte einer stetigen Zufallsvariable verwendet
werden. (Es gibt allerdings wesentlich bessere Dichteschätzer.)
Box-Plot
untere Ausreißergrenze:
Au = Vu − 1, 5 · d,
obere Ausreißergrenze:
Ao = Vo + 1, 5 · d.
Die Ausreißergrenzen werden nicht mit dargestellt. Die Whisker gehen bis zum (kleinsten) größten Wert der geordneten Stichprobe innerhalb der Ausreißergrenzen.
3
1.2
Zweidimensionale Daten
Zwei kategorielle Merkmale X (k Kategorien) und Y (l Kategorien) sind gekreuzt (jede
Kategorie des Merkmals X kommt mit jeder Kategorie des Merkmals Y vor).
Kontigenztafel (bzw. Kreuztabelle):
X\Y
1
..
.
1
h11
..
.
k
hk1
...
...
...
...
l
h1l
..
.
hij - Anzahl Merkmal X in Kategorie i und Y in j.
hkl
Balkendiagramm:
gruppiert:
gestapelt:
Mosaik-Diagramm
Ein Zusammenhang bzw. eine Abhängigkeit zwischen den Merkmalen zeigt sich in
den bedingten Häufigkeiten. Diese lassen sich in einem Mosaikplot darstellen.
4
Vergleich zweier (unverbundener) metrischer Merkmale X und Y .
Stichprobe des Merkmals X mit Stichprobenumfang n: x1 , x2 , . . . , xn .
Stichprobe des Merkmals Y mit Stichprobenumfang m: y1 , y2 , . . . , ym .
Histogramme
Box-Plots
5
Streudiagramm
An n Objekten werden 2 metrische Merkmale X und Y beobachtet. D.h. Stichprobe
eines 2-dimensionalen Merkmalsvektors (X, Y ) mit Stichprobenumfang n:
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).
r = 0.9375
empirischer Korrelationskoeffizient:
n
P
rx,y
(xi − x)(yi − y)
i=1
n
P
=r
(xi −
x)2
i=1
n
P
.
(yi −
i=1
6
y)2
1.3
Konzentrationsmaße
X
n
- positives metrisches Merkmal
- Objekte
Die Merkmalsausprägungen werden der Größe nach geordnet:
0 ≤ x(1) ≤ x(2) ≤ . . . ≤ x(n) .
i
Anteil der ersten i Objekte an der Gesamtanzahl n,
n
i
P
x(k)
k=1
Anteil der Merkmalssumme der ersten i Objekte an der Gesamtmerkmalssumme.
= P
n
x(k)
ui =
vi
k=1
Lorenzkurve:
1.0
Lorenzkurven
0.0
0.2
0.4
v
0.6
0.8
Nettoäquivalenzeinkommen (2005)
Anteile am Einkommensteueraufkommen (2007)
0.0
0.2
0.4
0.6
0.8
1.0
u
Gini-Koeffizient:
n
n
1X
1
2 X
G=1−
(vi + vi−1 ) = 1 + − ·
vi
n i=1
n n i=1
Minimale Konzentration: x1 = x2 = . . . = xn =⇒ G = 0.
Maximale Konzentration: x1 = x2 = . . . = xn−1 = 0 und xn > 0
=⇒
G=
n−1
.
n
Klassiertes Merkmal (m - Klassen)
Hi
hi
Mi
- Anzahl der Objekte in der i-ten Klasse
- relative Anzahl der Objekte in der i-ten Klasse
- Merkmalssumme in der i-ten Klasse
i
P
ui =
i
X
k=1
hk ,
vi =
k=1
m
P
Mk
i = 1, . . . m
Mk
und
G=1−
m
X
i=1
k=1
7
hi (vi + vi−1 ) .
1.4
Zeitreihen
3.9e+07
3.7e+07
3.8e+07
Erwerbstätige
4.0e+07
Zeitreihe
1995
2000
2005
2010
Jahr
Additives Zeitreihenmodell mit Trendkomponente
xt = gt + rt
T
xt
gt
rt
...
...
...
...
t = 1, 2, . . . , T
gleichabständige Zeitpunkte
Entwicklung des Merkmales über die Zeit
glatte Komponente (Trend)
irreguläre Komponente (zufällig)
Trenderkennung mittels Glättung (Smoothing):
gleitende Durchschnitte (moving average):
x∗t =
ungerade Ordnung (2k + 1):
1
2k+1
k
P
xt+j
j=−k
Ã
x∗t =
gerade Ordnung (2k):
1
x
2 t−k
1
2k
+
k−1
P
j=−k+1
!
xt+j + 12 xt+k
Zeitreihe
3.9e+07
3.8e+07
3.7e+07
Erwerbstätige
4.0e+07
Glättung (Ordnung 12)
1995
2000
Jahr
8
2005
2010
Additives Zeitreihenmodell mit Trend- und Saisonkomponente
xt = gt + st + rt
st
...
t = 1, 2, . . . , T
Saisonkomponente
Die Saisonkomponente ist periodisch mit Periode p und schwankt um 0:
st = st+p
und
p
X
sj = 0.
j=1
Schätzung der Saisonkomponente:
Bilde die gleitenden Durchschnitte x∗t der Ordnung n · p (n natürliche Zahl, meist
n = 1). Ist np = 2k gerade, so ist k = np
. Bei ungerader Ordnung (2k + 1) ist k = np−1
.
2
2
mj : kleinste ganze Zahl, so dass k + 1 ≤ j + mj · p ≤ T − k.
nj : größte ganze Zahl, so dass k + 1 ≤ j + (mj + nj ) · p ≤ T − k.
ĝt = x∗t
dt = xt − ĝt
nj +mj
1 X
dj =
dj+lp
nj l=m
Trendschätzung:
trendbereinigte Zeitreihe:
t = k + 1, . . . , T − k
t = k + 1, . . . , T − k
j = 1, . . . , p
j
p
1X
d =
dj
p j=1
ŝj = dj − d
geschätzte Saisonkomponente:
j = 1, . . . , p
0e+00
−2e+05
−4e+05
Saisonkomponente
2e+05
4e+05
Saisonschätzung
2
4
6
Monat
9
8
10
12
1.5
1.5.1
Indizes
Indexzahlen
Ein Warenkorb“ enthalte die n Güter.
”
p0 (j) . . .
pt (j) . . .
q0 (j) . . .
qt (j) . . .
Preis des Gutes j zur Basiszeit 0
Preis des Gutes j zur Berichtszeit t, t = 1, . . .
Menge des Gutes j zur Basiszeit 0
Menge des Gutes j zur Berichtszeit t, t = 1, . . .
Preisindex
nach Laspeyres:
n
P
P0tL =
j=1
n
P
j=1
nach Paasche:
n
P
pt (j)q0 (j)
P0tP =
p0 (j)q0 (j)
j=1
Mengenindex
nach Laspeyres:
n
P
QL0t =
j=1
n
P
j=1
1.5.2
j=1
n
P
pt (j)qt (j)
p0 (j)qt (j)
Umsatzindex
nach Paasche:
n
P
qt (j)p0 (j)
QP0t =
q0 (j)p0 (j)
j=1
n
P
j=1
n
P
qt (j)pt (j)
U0t =
q0 (j)pt (j)
j=1
n
P
j=1
pt (j)qt (j)
p0 (j)q0 (j)
Umbasierung einer Indexreihe
Die gegebene Indexreihe P01 , P02 , P03 . . . soll von der Basis 0 auf die Basis τ umgestellt
werden:
P0t
Pτ∗t =
t = . . . − 2, −1, 0, 1, 2, . . .
P0τ
1.5.3
Verknüpfung von zwei Indexreihen
Die Indexreihen P01 , P02 , . . . , P0t und Pτ t , Pτ,t+1 , . . . , Pτ,t+s sind auf eine gemeinsame
Basis zu stellen.
Fortführung des alten Index:
∗
P0,t+i
=
P0t
Pτ,t+i
Pτ t
i = 1, . . . , s
Rückrechnung des neuen Index:
Pτ∗j =
Pτ t
P0j
P0t
j = 0, 1, . . . , t
10
2
Grundlagen der Wahrscheinlichkeitsrechnung
2.1
zufällige Ereignisse und Wahrscheinlichkeiten
2.1.1
Definition der Wahrscheinlichkeit
A
zufälliges Ereignis
P(A) Wahrscheinlichkeit des zufälligen Ereignisses A
Klassische Definition:
Voraussetzungen:
– der betrachtete Versuch besitzt nur endlich viele alternative Versuchsausgänge
(Elementarereignisse)
– jedes Elementarereignis besitzt die gleichen Chancen aufzutreten
P (A) =
Anzahl der für A günstigen Elementarereignisse
Anzahl aller möglichen Elementarereignisse
Definition durch die relative Häufigkeit:
(Statistische Definition)
Hn (A)
absolute Häufigkeit des Auftretens des Ereignisses A bei n
Wiederholungen desselben zufälligen Versuches
wn (A) =
Hn (A)
n
relative Häufigkeit des Auftretens von A
wn (A) −−−→ P (A)
n→∞
Definition nach Kolmogoroff:
(Axiome)
Ω - sicheres Ereignis
1. 0 ≤ P (A) ≤ 1
2. P (Ω) = 1
3. P (A1 ∪ A2 ∪ . . .) = P (A1 ) + P (A2 ) + . . . ,
11
falls paarweise Ai ∩ Aj = ∅
2.1.2
Rechengesetze
Komplementäres Ereignis:
P (A) = 1 − P (A),
Regeln von de Morgan:
A∩B =A∪B
allgemeine Additionsregel:
(A = Ω\A).
und A ∪ B = A ∩ B.
P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
Wenn A und B unvereinbare Ereignisse [A ∩ B = ∅], dann: P (A ∪ B) = P (A) + P (B).
allgemeine Multiplikationsregel:
P (A ∩ B) = P (A|B) · P (B) = P (B|A) · P (A).
Wenn A und B (paarweise) unabhängig voneinander [P (A|B) = P (A) bzw. P (B|A) =
P (B)], dann:
P (A ∩ B) = P (A) · P (B).
Wenn A1 , . . . , Ak in der Gesamtheit unabhängige zufällige Ereignisse sind, dann gelten
k
Q
P (Ai ) und
P (A1 ∩ A2 ∩ . . . ∩ Ak ) = P (A1 ) · P (A2 ) · . . . · P (Ak ) =
i=1
P (A1 ∪A2 ∪. . .∪Ak ) = 1−((1−P (A1 ))·(1−P (A2 ))·. . .·(1−P (Ak ))) = 1−
k
Q
(1−P (Ai )).
i=1
2.1.3
Bedingte Wahrscheinlichkeiten
Voraussetzung:
P (A|B) =
P (B) > 0
bedingte Wahrscheinlichkeit für das Ereignis A unter
der Bedingung, dass das Ereignis B eingetreten ist
(Wkt. von A unter Bedingung B)
P (A∩B)
P (B)
Totale Wahrscheinlichkeit:
Voraussetzung:
P (B) =
n
P
Die Ai (i = 1, . . . , n) bilden eine Zerlegung von Ω.
P (B|Ai )P (Ai )
totale Wahrscheinlichkeit für B.
i=1
BAYES’sche Formel:
Voraussetzung:
Die Ai (i = 1, . . . , n) bilden eine Zerlegung von Ω und P (B) > 0.
P (Aj |B) =
P (B|Aj )P (Aj )
P (B|Aj )P (Aj )
= P
n
P (B)
P (B|Ai )P (Ai )
i=1
P (Ai )
P (Ai |B)
a-priori Wahrscheinlichkeiten
a-posteriori Wahrscheinlichkeiten
12
j = 1, . . . , n
2.1.4
Kombinatorische Formeln
Fakultät
n! = 1 · 2 · . . . · n =
n
Y
k
(0! = 1)
k=1
z.B.:
5! = 1 · 2 · 3 · 4 · 5 = 120
Binomialkoeffizient
µ ¶
n!
n
n(n − 1) · · · (n − k + 1)
=
=
k
k!(n − k)!
k!
Anordnung
n verschiedene Objekte sollen angeordnet werden. Dann ist die Anzahl der möglichen
Reihenfolgen:
n!
(Permutation)
n Objekte, aber nur k < n verschiedene mit den Anzahlen ni ; 1 = 1, . . . , k sollen
angeordnet werden. Dann ist die Anzahl der möglichen Reihenfolgen:
¶
µ
n!
n
(Polynomialkoeffizient)
=
n1 , n 2 , . . . , n k
n1 ! · n2 ! · · · nk !
Auswahl
Aus n Objekten werden k ausgewählt.
Anzahl der möglichen Stichproben
vom Umfang k aus
{1, 2, . . . n}
ohne Beachtung der Reihenfolge
(Kombination)
mit Zurücklegen
(mit Wiederholung)
ohne Zurücklegen
(ohne Wiederholung)
¡n+k−1¢
¡n¢
k
k
nk
mit Beachtung der Reihenfolge
(Variation)
13
¡ n¢
k
· k!
2.2
X
Zufallsgrößen und deren Charakteristika
- Zufallsgröße
Verteilungsfunktion
FX ist die Verteilungsfunktion der Zufallsgröße X:
FX (t) = P (X < t)
0.0
0.2
0.4
FX(t)
0.6
0.8
1.0
Verteilungsfunktion einer disketen Zufallsgröße X
0
5
10
15
t
Die Verteilungsfunktion ist monoton wachsend, und es gilt:
lim FX (t) = 0
t→−∞
Weiter gilt für a, b ∈ R:
und
lim FX (t) = 1.
t→∞
P (a ≤ X < b) = FX (b) − FX (a),
P (a ≤ X) = 1 − FX (a),
P (X < b) = FX (b).
14
2.2.1
Diskret verteilte Zufallsgrößen
X kann endlich viele oder abzählbar unendlich viele mögliche Werte xi mit positiver
Wahrscheinlichkeit annehmen:
pi = P (X = xi ) (i = 1, 2, . . .)
Einzelwahrscheinlichkeit
Für die Einzelwahrscheinlichkeiten (Zähldichte) gilt:
X
pi = 1 und pi ≥ 0.
i
Die Verteilungsfunktion ist damit: FX (t) =
P
pi .
xi <t
Beispiel:
P (X = 3) = P (X = 5) = 0.15, P (X = 7) = 0.5 und P (X = 11) = P (X = 13) = 0.1.
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
FX(t)
P(X = t)
0.6
0.8
1.0
Verteilungsfunktion der disketen Zufallsgröße X
1.0
Diskete Einzelwahrscheinlichkeiten der Zufallsgröße X
0
5
10
15
0
5
t
10
15
t
p-Quantil (xp ):
Jede Lösung xp der Ungleichungen P (X ≤ xp ) ≥ p und P (X < xp ) ≤ p heißt p-Quantil
der Zufallsgröße X.
Median: x0.5
Erwartungswert (EX): EX =
P
xi · P (X = xi ) =
i
P
i
15
xi · p i .
2.2.2
Stetig verteilte Zufallsgrößen
X kann jeden reellen Wert aus einem gewissen Intervall annehmen. Dabei ist die Wahrscheinlichkeit, dass X einen Wert im Intervall [a, b] annimmt, gleich:
Z b
P (X ∈ [a, b]) = P (a ≤ X ≤ b) =
fX (t)dt.
a
Dabei ist fX die Dichtefunktion der Zufallsgröße X.
Für die Dichtefunktion gilt:
Z∞
fX (t)dt = 1
und
fx (t) ≥ 0.
−∞
Die Verteilungsfunktion ist damit: FX (t) =
Rt
fX (x)dx.
−∞
Beispiel:
X ist standardnormalverteilt, d.h.
1 2
1
fX (t) = √ e− 2 t .
2π
Verteilungsfunktion der Zufallsgröße X
0.0
0.0
0.2
0.1
0.4
0.2
fX(t)
FX(t)
0.6
0.3
0.8
0.4
1.0
Dichtefunktion der Zufallsgröße X
−4
−2
0
2
4
−4
t
−2
0
2
4
t
p-Quantil (xp ):
Jede Lösung xp der Gleichung FX (xp ) = p heißt p-Quantil der Zufallsgröße X. D.h.
(−1)
xp = FX
(p).
Median: x0.5
Erwartungswert (EX): EX =
R∞
tfX (t)dt.
−∞
16
2.2.3
Erwartungswert, Varianz, Standardabweichung und Kovarianz
Erwartungswert der Zufallsgröße X (EX):
P

 xi · P (X = xi ) : X diskret
i
EX = R∞

: X stetig
 tfX (t)dt
−∞
Varianz der Zufallsgröße X (VarX):
VarX = E(X − EX)2 = EX 2 − (EX)2 .
Standardabweichung der Zufallsgröße X :
√
VarX.
Variationskoeffizient der Zufallsgröße X :
√
VarX
V =
.
EX
Kovarianz der Zufallsgrößen X und Y (Cov(X, Y )):
Cov(X, Y ) = E(X−EX)(Y −EY ) = EXY −EX · EY.
Die Zufallsgrößen X und Y heißen unkorreliert, falls Cov(X, Y ) = 0. Dabei gilt:
X und Y sind unabhängig
=⇒
EXY = EX · EY
⇐⇒
X und Y sind unkorreliert.
Eigenschaften:
Für Zufallsgrößen X und Y und reelle Zahlen a und b gilt:
E(a + bX) = a + bEX
E(X + Y ) = EX + EY
Var(a + bX) = b2 VarX
Var(X + Y ) = VarX + VarY + 2Cov(X, Y )
sind X und Y unkorreliert: Var(X + Y ) = VarX + VarY
Standardisierung einer Zufallsgröße:
Sei X eine Zufallsgröße, dann gilt für die standardisierte Zufallsgröße Y :
X − EX
Y = √
VarX
EY = 0 und VarY = 1.
17
2.3
2.3.1
Wichtige Wahrscheinlichkeitsverteilungen
Diskrete Verteilungen
Diskrete Gleichverteilung
Eine Menge M besteht aus n Elemente, die alle gleichwahrscheinlich sind.
Einzelwahrscheinlichkeit:
1
für k ∈ M
n
Momente für X ∼ U({1, 2, . . . , n}):
P (X = k) =
n+1
2
Anwendung: Laplace-Experiment
EX =
und
(Bez. : X ∼ U(M)).
VarX =
n2 − 1
12
Hypergeometrische Verteilung
Eine Menge besteht aus N Elementen. Dabei gibt es M von der Sorte 1 und N − M
von der Sorte 2. Aus der Menge werden n Stück (durch einmaliges Ziehen oder durch
Ziehen ohne Zurücklegen) gezogen. Die Zufallsgröße X ist die Anzahl der Stücke von
Sorte 1 unter den Gezogenen.
Einzelwahrscheinlichkeit:
¡M ¢ ¡N −M ¢
·
P (X = k) = k ¡N ¢n−k
k = max(0, n−(N −M )), . . . , min(n, M ) (X ∼ Hyp(N, M, n)).
n
Momente:
EX = n ·
M
N
und
VarX = n ·
M N −M N −n
·
·
N
N
N −1
Eigenschaften: Für N → ∞, M → ∞ und M
= p Übergang in eine BinomialverteiN
lung.
Anwendung: Sichprobennahme ohne Zurücklegen, Qualitätskontrolle
Beispiele:
X ∼ U({1, 2, 3, 4})
X ∼ Hyp(100, 40, 12)
18
Bernoulli-Verteilung
Bernoulli-Experiment: Experiment mit 2 möglichen Versuchsausgängen A oder A.
Das Ereignis A tritt dabei mit einer Wahrscheinlichkeit p = P (A) ein.
Tritt das Ereignis A ein, dann ist die Zufallgröße X gleich 1 und sonst gleich 0.
Einzelwahrscheinlichkeit:
P (X = 1) = p
und
P (X = 0) = 1 − p
(Bez. : X ∼ B(p)).
Momente:
EX = p
und
VarX = p · (1 − p)
Eigenschaften: Die Summe unabhängiger und identisch bernoulliverteilter Zufallsn
P
Xi ∼ Bin(n, p).
größen ist Binomialverteilt: Xi ∼ B(p) i = 1, . . . , n =⇒
i=1
Binomialverteilung
Es werden n unabhängige Bernoulli-Experimente durchgeführt. Die Zufallsgröße X ist
gleich der Anzahl, wie oft das Ereignis A eintritt.
Einzelwahrscheinlichkeit:
µ ¶
n k
p (1 − p)n−k
P (X = k) =
k
k = 0, 1, . . . , n
(Bez. : X ∼ Bin(n, p)).
Momente:
EX = n · p
und
VarX = n · p · (1 − p)
Eigenschaften: Für n → ∞, p → 0 und n · p = λ Übergang in eine Poissonverteilung
Anwendung: unabhängige Wiederholung von Versuchen, Stichprobennahme mit Zurücklegen, Qualitätskontrolle, Schadenzahlverteilung in der Versicherungsmathematik
Beispiele:
X ∼ Bin(12, 0.4)
X ∼ Bin(100, 0.03)
19
Poissonverteilung
Einzelwahrscheinlichkeit:
P (X = k) =
λk −λ
·e
k!
λ > 0, k = 0, 1, . . .
(Bez. : X ∼ Poi(λ)).
Momente:
EX = λ
und
VarX = λ
Eigenschaften: Die Summe unabhängiger poissonverteilter Zufallsgrößen ist poissonm
P
P
verteilt: Xi ∼ Poi(λi ) i = 1, . . . , m =⇒
Xi ∼ Poi(λ) mit λ = m
i=1 λi .
i=1
Anwendung: Verteilung seltener“ Ereignisse, Bedienungstheorie, Qualitätskontrolle,
”
Schadenzahlverteilung in der Versicherungsmathematik
Beispiele:
X ∼ Poi(3)
X ∼ Poi(0.7)
20
Negative Binomialverteilung
Es werden unabhängige Bernoulli-Experimente solange durchgeführt bis zum r-ten mal
das Ereignis A eingetreten ist. Die Zufallsgöße X ist gleich der Anzahl der Versuche.
Einzelwahrscheinlichkeit:
µ
¶
k−1 r
P (X = k) =
p (1−p)k−r
k = r, r+1 . . .
(Bez. : X ∼ NegBin(r, p)).
r−1
Momente:
r
r(1 − p)
und VarX =
p
p2
Anwendung: Schadenzahlverteilung in der Versicherungsmathematik
EX =
Alternative Definition:
Die Zufallsgöße Y ist gleich der Anzahl der Versuchsausgänge A.
Also ist P (Y = k) = P (X = k + r) k = 0, 1 . . . und damit EY = EX − r =
r(1−p)
.
p
Geometrische Verteilung
Es werden unabhängige Bernoulli-Experimente solange durchgeführt bis zum ersten
Mal das Ereignis A eingetreten ist. Die Zufallsgöße X ist gleich der Anzahl der Versuche. (Spezialfall der Negativ-Binomialverteilung mit r = 1.)
Einzelwahrscheinlichkeit:
P (X = k) = p(1 − p)k−1
Momente:
k = 1, . . .
(Bez. : X ∼ Geo(p)).
1
1−p
und VarX =
p
p2
Eigenschaften: Verteilung ohne Gedächtnis“ (P (X = n + k|X > n) = P (X = k)).
”
Anwendung: Lauflänge bei Kontrollkarten (erwartete Lauflänge: ARL)
EX =
Beispiele:
X ∼ NegBin(5, 0.4)
X ∼ Geo(0.4)
21
2.3.2
Stetige Verteilungen
Stetige Gleichverteilung auf [a, b]
Bezeichnung:
X ∼ U[a, b].
Dichtefunktion:
(a < b)
(
f (t) =
Verteilungsfunktion:
1
b−a
0


0
F (t) =
t−a
 b−a

1
:a≤t≤b
: sonst
:t<a
:a≤t≤b
:t>b
Momente:
a+b
(a − b)2
und VarX =
2
12
Eigenschaften: nichtinformative Verteilung
EX =
Anwendung: Grundlage für die Erzeugung von Zufallszahlen
Beispiel: X ∼ U[2, 4]
22
Exponentialverteilung
Bezeichnung:
Dichtefunktion:
X ∼ Exp(λ).
(λ > 0)
(
f (t) =
Verteilungsfunktion:
(
F (t) =
λ · e−λt
0
:t≥0
: sonst
1 − e−λt
0
:t≥0
: sonst
Momente:
1
1
und VarX = 2
λ
λ
Eigenschaften: Verteilung ohne Gedächtnis“, d.h
”
EX =
P (X ≥ x + t|X ≥ x) = P (X ≥ t)
(Markoff–Eigenschaft)
Die Summe unabhängiger und identisch exponentialverteilter Zufallsgrößen ist
Gammaverteilt.
Anwendung: Lebensdauerverteilung, in der Zuverlässigkeitstheorie und in der Bedienungstheorie
Beispiele: X ∼ Exp(0.8)
23
Normalverteilung
Bezeichnung:
Dichtefunktion:
X ∼ N(µ, σ 2 ).
(σ > 0)
1 t−µ 2
1
f (t) = √ e− 2 ( σ )
σ 2π
Momente:
EX = µ
und
VarX = σ 2
Eigenschaften:
Die Summe unabhängiger normalverteilter Zufallsgrößen ist normalverteilt:
Xi ∼
N(µi , σi2 )
i = 1, . . . , n =⇒
n
X
2
Xi ∼ N(µ, σ ) mit µ =
i=1
n
X
2
µi , σ =
i=1
n
X
σi2 .
i=1
Anwendung: Viele Verfahren der Statistik basieren auf dieser Verteilung. Auch ist
die Normalverteilung eine wichtige Näherungsverteilung (Zentraler Grenzwertsatz).
Beispiele: X ∼ N(3, 0.36)
Standardnormalverteilung
Ist X normalverteilt mit Erwartungswert µ und Varianz σ 2 (X ∼ N(µ, σ 2 )) dann ist
Y =
X −µ
σ
standardnormalverteilt,
d.h. normalverteilt mit Erwartungswert 0 und Varianz 1 (Y ∼ N(0, 1)).
Verteilungsfunktion: Die Verteilungsfunktion der Standardnormalverteilung wird
mit Φ bezeichnet und ist vertafelt.
24
Logistische Verteilung
Bezeichnung:
Dichtefunktion:
X ∼ Logi(α, β).
(β > 0)
¡
¢
exp − t−α
β
f (t) = ³
¢´2
¡
β 1 + exp − t−α
β
Verteilungsfunktion:
F (t) =
1
¡
1 + exp −
t−α
β
Momente:
EX = α
Eigenschaften:
und
VarX =
¢
β 2π2
3
f (t) = β1 F (t) · (1 − F (t)).
Anwendung: im kategoriellen Regressionsmodell (Logit-Modell),
Beispiel: X ∼ Logi(3, 0.6)
25
Weibull-Verteilung
Bezeichnung:
X ∼ Wei(α, β, m).
Parameter:
α:
Verschiebungsparameter (Lageparameter)
β > 0 : Skalenparameter
m > 0 : Formparameter
Bemerkung: Ist α = 0, so spricht man von der 2-parametrigen Weibullverteilung.
Dichtefunktion:
 ³ ´
 m t−α m−1
f (t) =
β
Verteilungsfunktion:
: sonst
(
F (t) =
Momente:
β
0
³
´
m
exp −( t−α
)
:t>α
β
³
´
m
1 − exp −( t−α
)
:t>α
β
0
: sonst
µ
¶
1
EX = Γ 1 +
β+α
m
à µ
¶ µ µ
¶¶2 !
2
1
VarX = Γ 1 +
− Γ 1+
β2
m
m
mit Γ der Gammafunktion.
Anwendung: In der mechanischen Verfahrenstechnik findet die Weibull-Verteilung
Anwendung als eine spezielle Partikelgrößenverteilung. Hier wird sie auch als RRSBVerteilung (nach Rosin, Rammler, Sperling und Bennet) bezeichnet.
Beispiele: X ∼ Wei(0, 1, m)
1.0
Verteilungsfunktionen
2.5
Dichtefunktionen
0.8
0.6
0.4
0.2
m = 0.5
m=1
m = 1.5
m=5
0.0
0.0
0.5
1.0
f(t)
F(t)
1.5
2.0
m = 0.5
m=1
m = 1.5
m=5
0.0
0.5
1.0
1.5
2.0
2.5
0.0
t
0.5
1.0
1.5
t
26
2.0
2.5
3.0
Fréchet-Verteilung
Bezeichnung:
Parameter:
X ∼ Fre(α, β, m).
α:
Verschiebungsparameter (Lageparameter)
β > 0 : Skalenparameter
m > 0 : Formparameter
Dichtefunktion:
f (t) =
 ³ ´−(m+1)
 m t−α
β
β
0
´
³
−m
:t>α
)
exp −( t−α
β
: sonst
Verteilungsfunktion:
F (t) =
³
´
(
t−α −m
exp −( β )
:t>α
0
: sonst
Momente: (mit Γ der Gammafunktion)
( ¡
¢
Γ 1 − m1 β + α : m > 1
EX =
∞
: sonst
(³ ¡
¢
¡
¡
¢¢2 ´ 2
Γ 1 − m2 − Γ 1 − m1
β
VarX =
∞
:m>2
: sonst
Anwendung: Als eine Extremwertverteilung ist sie eine wichtige Verteilung zur Bestimmung von Risiken in der Finanzstatistik.
Beispiele: X ∼ Fre(0, β, m)
1.0
Verteilungsfunktionen
1.2
Dichtefunktionen
0.8
F(t)
0.6
0.4
β = 1, m = 1
β = 1, m = 2
β = 1, m = 3
β = 2, m = 1
β = 2, m = 2
β = 2, m = 3
0.2
0.4
0.0
0.2
0.0
f(t)
0.6
0.8
1.0
β = 1, m = 1
β = 1, m = 2
β = 1, m = 3
β = 2, m = 1
β = 2, m = 2
β = 2, m = 3
0
1
2
3
4
5
0
t
1
2
3
t
27
4
5
Gumbel-Verteilung
Bezeichnung:
Parameter:
X ∼ Gum(α, β).
α:
Verschiebungsparameter (Lageparameter)
β > 0 : Skalenparameter
Dichtefunktion:
f (t) =
− t−α
1 − t−α
β
e β e−e
β
Verteilungsfunktion:
−e
F (t) = e
− t−α
β
Momente:
EX = α + βγ
β 2π2
VarX =
6
mit γ ≈ 0, 5772 der Euler-Mascheroni-Konstante.
Anwendung: Als eine Extremwertverteilung z.B. in:
- der Wasserwirtschaft (für extreme Ereignisse wie Hochwasser und Trockenzeiten),
- der Verkehrsplanung,
- der Meteorologie,
- der Hydrologie.
Beispiele: X ∼ Gum(α, β)
Verteilungsfunktionen
0.6
1.0
Dichtefunktionen
0.8
F(t)
0.4
0.3
0.2
α = 0, β = 0.7
α = 0, β = 1
α = 0, β = 2
α = 1.5, β = 1
0.2
0.1
0.0
0.0
f(t)
0.6
0.4
0.5
α = 0, β = 0.7
α = 0, β = 1
α = 0, β = 2
α = 1.5, β = 1
−2
−1
0
1
2
3
4
−2
t
−1
0
1
t
28
2
3
4
3
3.1
3.1.1
Grundlagen des statistischen Schließens I
(Schätzungen)
Stichproben
Stichprobenfunktionen
• mathematische Stichprobe:
X1 , . . . , Xn .
Xi : unabhängige und identisch verteilte Zufallsgrößen, i = 1, . . . , n.
• geordnete mathematische Stichprobe:
X(1) ≤ X(2) ≤ . . . X(n) .
• Stichprobenmittelwert: (arithmetisches Mittel):
n
1X
Xi
X=
n i=1
• (gewichtetes arithmetisches Mittel):
1
Xg = P
m
m
X
gi
gi Xi
i=1
i=1
Spezialfall: gi = ni
ni . . . absolute Häufigkeit der konkreten Messung xi
Xi . . . Klassenrepräsentant bei vorliegender Klasseneinteilung einer Stichprobe
• Stichprobenstreuung (empirische Varianz):
n
S2 =
• empirisches α-Quantil:

 X(k)
e
Xα =
 1
(X(k) + X(k+1) )
2
1 X
(Xi − X)2
n − 1 i=1
falls n · α nicht ganzzahlig: k ist die auf n · α folgende
ganze Zahl
falls n · α ganzzahlig: k = n · α
• empirischer Median:
• empirische Verteilungsfunktion:
e =X
e0,5
X
F̂n (t) =
Nt
n
Nt – Anzahl der Elemente der Stichprobe, für die Xi < t gilt.
29
3.1.2
Stichprobenplanung, Datengewinnung durch Stichproben
X – zu untersuchendes Merkmal, Zufallsgöße X (Grundgesamtheit) mit
EX = µ
VarX = σ 2 .
und
N – Anzahl der Objekte der Grundgesamtheit
Zufallsauswahl:
Aus den N Objekten der Grundgesamtheit werden zufällig und unabhängig n Objekte
nach einem Zufallsprozess (z.B. mit Hilfe von Zufallsziffern) ausgewählt.
X1 , . . . , Xn – Stichprobe aus der Grundgesamtheit mit Stichprobenumfang n.
Schätzung des Erwartungswertes µ und der Varianz σ 2 :
n
1X
µ̂ = X =
Xi
n i=1
σˆ2 = S 2 =
und
n
1 X
(Xi − X)2 .
n − 1 i=1
Beide Schätzer sind erwartungstreu.
Die Varianz der Schätzung für den Erwartungswert ist:
VarX =
σ2
.
n
Geschichtete Stichprobe:
k – Anzahl der Schichten in der Grundgesamtheit
Ni – Anzahl der Objekte in der Schicht i, i = 1, . . . , k
Aus jeder der k Schichten werden ni Objekte zur Befragung zufällig ausgewählt.
k
P
ni (deterministisch)
Stichprobenumfang: n =
i=1
Xi – Ausprägung des Merkmals X in der Schicht i.
EXi = µi
pi =
Ni
N
VarXi = σi2
und
– Wahrscheinlichkeit dafür, dass bei zufälliger Auswahl eines Objektes aus der
Grundgesamtheit ein Objekt der Schicht i ausgewählt wird.
Erwartungswert (total) der Grundgesamtheit:
µ=
k
X
pi · µi
i=1
Varianz der Grundgesamtheit:
σ2 =
k
P
i=1
pi σi2 +
k
P
i=1
pi (µi − µ)2
↓
&
Streuungszerlegung: Varianz in der = Varianz in den + Varianz zwischen den
Grundgesamtheit
Schichten
Schichten
30
Xij - Ausprägung des Merkmals X in der Schicht i beim Objekt j
(i = 1, . . . , k; j = 1, . . . , ni )
Schätzung für den Erwartungswert µ:
µ̂ =
k
X
pi µ̂i
ni
1 X
µ̂i = X i =
Xij
ni j=1
mit
i=1
Varianz der Schätzung für den Erwartungswert:
Varµ̂ =
k
X
p2i
i=1
σi2
ni
k
X
;
ni = n
i=1
Aufteilung des Stichprobenumfangs n:
• proportional:
ni = n · pi
• optimal (bzgl. der Varianz):
n
ni =
k
P
j=1
· pi σi
i = 1, . . . , k
pj σj
σi – Standardabweichung der Merkmalsausprägung in der Schicht i
• kostenoptimal:
ni =
c
k
P
j=1
√
pj σj cj
·
pi σi
√
ci
i = 1, . . . , k
c – gesamtes Kapital für die Erhebung
ci – Kosten für eine Untersuchungseinheit in der Schicht i
Für die exakt proportionale Schichtung, ni = n · p, ist die Varianz von µ̂
k
1X
Varµ̂ =
pi σi2 .
n i=1
Der absolute Schichtungseffekt VarX − Varµ̂ wird damit
k
1X
pi (µi − µ)2
n i=1
und der relative Schichtungseffekt (unabhängig von n)
k
P
VarX − Varµ̂
= k
P
VarX
i=1
pi (µi − µ)2
i=1
pi σi2
31
+
k
P
i=1
.
pi (µi −
µ)2
Klumpenstichprobe:
– die Grundgesamtheit vom Umfang N bestehe aus M Klumpen K1 , . . . , KM
– aus diesen M Klumpen werden m Klumpen zur Untersuchung zufällig ausgewählt,
Mi – Anzahl der Objekte im Klumpen i, i = 1, . . . M
zufällige Auswahl von m Klumpen aus M vorhandenen mit einer Wahrscheinlichkeit
i
proportional zur Anzahl Mi der Objekte im Klumpen Ki :
pi = M
N
Der Stichprobenumfang ist bei dieser Auswahl zufällig !
n=
m
P
j=1
µ̂(K) =
Schätzung für den Erwartungswert µ:
Mhi
1
m
m
P
j=1
µhi
h1 , . . . , hm – Indizes der m ausgewählten Klumpen
µhj – exakter Erwartungswert im Klumpen hj
Klumpeneffekt für Mi =
N
M
:
VarX − Varµ̂(K) =
32
1
m
h
1
M
M
P
j=1
³
σj2 − 1 −
M
N
´ i
σ2
3.2
3.2.1
Parameterschätzungen
Punktschätzungen
X1 , . . . , Xn - mathematische Stichprobe
ϑ - Parameter der Verteilung von Xi
ϑ̂ - Punktschätzung des Parameters ϑ (durch eine Stichprobenfunktion)
z.B:
- Schätzung des Erwartungswertes µ:
- Schätzung der Varianz σ 2 :
µ̂ = X =
σˆ2 = S 2 =
1
n−1
n
P
1
n
n
P
Xi .
i=1
(Xi − X)2 .
i=1
Eigenschaften:
- erwartungstreue Schätzung:
Eϑ̂ = ϑ.
2
2
ˆ
(µ̂ = X bzw. σ = S sind erwartungstreue Schätzer für µ = EX bzw. σ 2 = VarX.)
- asymptotisch erwartungstreue Schätzung:
Eϑ̂ −−−→ ϑ
n→∞
- Ist ϑ̂ ein asymptotisch erwartungstreuer Schätzer für ϑ und gilt Varϑ̂ −−−→ 0, dann
n→∞
ist ϑ̂ ein schwach konsistenter Schätzer, d.h. ϑ̂ −−−→ ϑ.
n→∞
2
ˆ
(µ̂ bzw. σ sind schwach konsistente Schätzer für µ bzw. σ 2 .)
Schätzung der Parameter von Verteilungen:
• Bernoulli-Verteilung:
p̂ = X.
• Poissonverteilung:
λ̂ = X.
• Normalverteilung:
µ̂ = X
σˆ2 = S 2 .
und
• Gleichverteilung auf [0, a]:
â =
n+1
· Xmax
n
mit Xmax = X(n) .
• Exponentialverteilung:
λ̂ =
1
.
X
33
3.2.2
Konfidenzschätzungen
ϑ - fester und unbekannter Parameter
I - zufälliges Intervall (Konfidenzintervall)
P (ϑ ∈ I) ≥ 1 − α.
Dabei heißt 1 − α das Konfidenzniveau.
Zentrales Konfidenzintervall
I = [Gu , Go ]:
P (Gu ≤ ϑ ≤ Go ) ≥ 1 − α.
Einseitige Konfidenzintervalle
Obere Konfidenzgrenze Go :
Untere Konfidenzgrenze Gu :
Eine Stichprobe:
P (ϑ ≤ Go ) ≥ 1 − α.
P (Gu ≤ ϑ) ≥ 1 − α.
X1 , .., Xn
Normalverteilte Stichprobe:
Xi ∼ N(µ, σ 2 )
i = 1, .., n.
Zentrales Konfidenzintervall bei normalverteilter Stichprobe für
• den Erwartungswert µ, falls die Varianz σ 2 bekannt ist:
σ
σ
X − √ z1−α/2 ≤ µ ≤ X + √ z1−α/2 .
n
n
Der notwendige Stichprobenumfang, um eine gegebene Länge l = 2d einzuhalten ist:
³z
´
1−α/2 2 2
n≥
σ .
d
• den Erwartungswert µ, falls die Varianz σ 2 unbekannt ist:
S
S
X − √ tn−1,1−α/2 ≤ µ ≤ X + √ tn−1,1−α/2 .
n
n
• die Varianz σ 2 , falls der Erwartungswert µ bekannt ist:
nS ∗2
χ2n,1−α/2
≤ σ2 ≤
nS ∗2
.
χ2n,α/2
• die Varianz σ 2 , falls der Erwartungswert µ unbekannt ist:
(n − 1)S 2
(n − 1)S 2
2
≤
σ
≤
.
χ2n−1,1−α/2
χ2n−1,α/2
n
Dabei ist S
∗2
1X
=
(Xi −µ)2 die empirische Varianz, falls der Erwartungswert µ bekannt ist.
n i=1
34
Bernoulliverteilte Stichprobe:
Xi ∼ B(p)
i = 1, .., n.
(Tritt das Ereignis A ein, dann ist die Zufallsgröße Xi gleich 1. P (A) = P (Xi = 1) = p.)
Zentrales Konfidenzintervall für p (n groß, Faustregel: np̂ > 5 und n(1 − p̂) > 5)
r
h
i
1
1 2
X(n − X) 1 2
Gu,o =
X
+
z
∓
z
+
z
1−α/2
2
n + z1−α/2
2 1−α/2
n
4 1−α/2
Dabei ist X =
n
X
Xi die absolute Häufigkeit von A und p̂ =
X
n
die Punktschätzung für p.
i=1
Der notwendige Stichprobenumfang, um eine gegebene Länge l = 2d einzuhalten ist:
³z
´
1−α/2 2
n≥
p(1 − p).
d
Einseitige Konfidenzintervalle, d.h. nur obere bzw. nur untere Konfidenzgrenzen, erhält
man, indem man bei den zentralen Konfidenzintervallen die jeweilige Grenze wählt und bei
den Quantilen α/2 durch α ersetzt.
D.h. z.B. bei einer Bernoulliverteilten Stichprobe (n groß):
Xi ∼ B(p)
h
1
1 2
Gu =
X+ z1−α
−z1−α
2
n + z1−α
2
untere Konfidenzgrenze für p:
h
1
1 2
Go =
X+ z1−α
+z1−α
2
n + z1−α
2
obere Konfidenzgrenze für p:
r
r
i = 1, .., n.
X(n − X) 1 2 i
+ z1−α .
n
4
X(n − X) 1 2 i
+ z1−α .
n
4
Weitere ausgewählte Beispiele für einseitige Konfidenzintervalle.
Normalverteilte Stichprobe:
Parameter
Xi ∼ N(µ, σ 2 )
Voraussetzungen
i = 1, .., n.
Konfidenzschätzungen
untere Grenze: X −
µ
2
√S tn−1,1−α
n
σ unbekannt
obere Grenze: µ ≤ X +
untere Grenze:
σ2
≤µ
µ unbekannt
(n−1)S 2
χ2n−1,1−α
obere Grenze: σ 2 ≤
35
√S tn−1,1−α
n
≤ σ2
(n−1)S 2
χ2n−1,α
Zwei unabhängige Stichproben :
X11 , .., X1n1 und X21 , .., X2n2
Normalverteilte Stichproben:
X1i ∼ N(µ1 , σ12 )
i = 1, .., n1
und
X2i ∼ N(µ2 , σ22 )
i = 1, .., n2 .
Zentrales Konfidenzintervall für
• die Differenz der Erwartungswerte µ1 − µ2 , falls die Varianzen unbekannt, aber gleich
sind σ12 = σ22 = σ 2 :
r
r
n1 + n2
n1 + n2
X 1 −X 2 −Sg
tn1 +n2 −2,1−α/2 ≤ µ1 −µ2 ≤ X 1 −X 2 +Sg
tn1 +n2 −2,1−α/2 .
n1 n2
n1 n2
i
h
1
Dabei ist Sg2 =
(n1 −1)S12 +(n2 −1)S22 die empirische (gemeinsame) Varianz.
n1 + n2 − 2
S12 ist die empirische Varianz der ersten und S22 die der zweiten Stichprobe (vgl. S 2 ).
σ2
• den Quotienten der Varianzen σ12 , falls die Erwartungswerte µ1 und µ2 unbekannt
2
sind:
S12
σ12
S12
F
≤
≤
Fn −1,n1 −1,1−α/2 .
n
−1,n
−1,α/2
1
S22 2
σ22
S22 2
Einseitige Konfidenzintervalle erhält man (wie auf der vorangegangenen Seite beschrieben)
durch Ersetzen von α/2 durch α in der jeweiligen Grenze.
Beispiel: Einseitige Konfidenzgrenzen für
• die Differenz der Erwartungswerte µ1 − µ2 , falls die Varianzen unbekannt, aber gleich
sind σ12 = σ22 = σ 2 :
r
n1 + n2
tn1 +n2 −2,1−α .
untere Grenze: Gu = X 1 − X 2 − Sg
n1 n2
r
n1 + n2
tn1 +n2 −2,1−α .
obere Grenze: Go = X 1 − X 2 + Sg
n1 n2
Bernoulliverteilte Stichproben:
X1i ∼ B(p1 )
i = 1, .., n1
und
X2i ∼ B(p2 )
i = 1, .., n2 .
Zentrales Konfidenzintervall für die Differenz p1 − p2 (n1 und n2 groß):
s
X1 (n1 − X1 ) X2 (n2 − X2 )
X1 X2
−
∓ z1−α/2
+
.
Gu,o =
n1
n2
n31
n32
Dabei sind X1 =
n1
X
i=1
X1i und X2 =
n2
X
X2i .
i=1
36
4
Grundlagen des Statistischen Schließens II (Tests)
4.1
4.1.1
Signifikanztest für Verteilungsparameter
Statistische Tests
Die Durchführung eines statistischen Tests verlangt die nachfolgenden Schritte:
1. Formulierung der Hypothesen, d.h. einer Nullhypothese H0 und einer Alternativhypothese HA , aus der zu bearbeitenden Aufgabenstellung.
(Ein statistischer Test ist ein einfaches statistisches Entscheidungsproblem. Aufgrund
einer Stichprobe (oder auch mehrerer Stichproben) wird für eine der beiden Hypothesen entschieden. Entweder wird die Nullhypothese H0 angenommen oder abgelehnt,
d.h. die Alternativhypothese HA wird angenommen.)
2. Vorgabe eines Signifikanzniveaus α entsprechend der durch die Aufgabenstellung geforderten Sicherheit für die Entscheidung.
(Gilt die Nullhypothese, dann soll der Test diese möglichst annehmen und höchsten
mit einer Wahrscheinlichkeit α (Signifikanzniveau) ablehnen.)
3. Auswahl einer Testgröße T .
(Dabei muss T eine Stichprobenfunktion sein, deren Verteilung, falls die Nullhypothese H0 gilt (unter H0 ), bekannt ist. Die Testgröße wird also aufgrund der Nullhypothese
ausgewählt.)
4. Festlegung des kritischen Bereiches K.
(Der kritische Bereich ist der Ablehnungsbereich für H0 und wird aufgrund der Alternativhypothese HA festgelegt. Dabei soll immer gelten:
H0
gilt: P (T ∈ K) ≤ α.
(vgl. 2.))
5. Berechnung einer Realisierung t der Testgröße T .
(Die Testgröße T ist eine Funktion der Stichprobe X1 , . . . , Xn (vgl. 3.). Setzt man
in diese Funktion die konkrete (beobachtete) Stichprobe x1 , . . . , xn (Realisierung der
Stichprobe X1 , . . . , Xn ) ein, so erhält man t, die Realisierung von T .)
6. Testentscheidung:
Falls t ∈ K
Falls t ∈
6 K
=⇒
=⇒
H0 wird abgelehnt, d.h. HA wird angenommen.
H0 wird nicht abgelehnt, d.h H0 wird angenommen“.
”
(Neben der formalen Testentscheidung (H0 wird abgelehnt bzw. H0 wird angenommen), sollte für die konkrete Fragestellung die Testentscheidung so formuliert werden,
dass der Anwender diese versteht.)
37
Beispiel:
Test für den Erwartungswert µ
Normalverteilte Stichprobe X1 , .., Xn , Xi ∼ N(µ, σ 2 )
1.
H 0 : µ = µ0
gegen
(σ 2 ist unbekannt).
HA : µ > µ0
(µ0 ist der hypothetische Wert, z.B.: H0 : µ = 3
HA : µ > 3
(µ0 = 3))
α = 0, 05
2.
(Gilt H0 , dann soll die Wahrscheinlichkeit der Ablehnung höchstens 0,05 sein.)
3.
T =
X − µ0 √ H0
n ∼ tn−1
S
(Im Wesentlichen wird in T der Mittelwert X mit dem hypothetischen Wert µ0 verglichen.
Falls H0 gilt, dann ist T t-verteilt mit n − 1 Freiheitsgraden)
Student-t Verteilung
0,4
FG
9
Dichte
0,3
0,2
0,1
0
-6
-4
-2
0
x
2
4
6
K = {t | t > tn−1,1−α }
4.
(Da die Alternativhypothese HA : µ > µ0 ist, sollen sehr große Werte der Teststatistik zur Ablehnung der Nullhypothese H0 führen. Gilt H0 , so ist P (T ∈ K) = α (vgl. 2.). Für n = 10 und
α = 0, 05 ist t9,0.95 = 1, 83.)
Student-t Verteilung
0,4
FG
9
Dichte
0,3
0,2
0,1
alpha = 0,05
0
-6
-4
-2
0
2
1,83
4
6
5. x1 = 4, 01; x2 = 3, 38; x3 = 2, 72; x4 = 3, 19; x5 = 2, 92; x6 = 3, 51; x7 = 2, 53;
x8 = 5, 08; x9 = 2, 45; x10 = 3, 16 =⇒ x = 3, 595 und s2 = 0, 616739.
3, 595 − 3 √
t= √
10 = 2, 40
0, 616739
38
6. t = 2, 40 > 1, 83
=⇒
t∈K
=⇒
H0 wird ablehnt.
Student-t Verteilung
0,4
FG
9
Dichte
0,3
0,2
0,1
0
-6
4.1.2
-4
-2
0
2
t=2,40
4
6
p-value (p-Wert)
Die Statistik-Software (z.B. Statgraphics, SPSS, R, ...) berechnet aus der Realisierung t
der Teststatistik T den p-value (p-Wert). Für die Testentscheidung wird dieser p-value mit
dem Signifikanzniveau α verglichen.
Falls
Falls
p≤α
p>α
=⇒
=⇒
H0 wird abgelehnt, d.h. HA wird angenommen.
H0 wird nicht abgelehnt, d.h H0 wird angenommen“.
”
(Ist also t die Realisierung der Testgröße, so ist der p-value das kleinste Signifikanzniveau
α, für welches die Testentscheidung des Testes H0 wird abgelehnt“wäre.)
”
Beispiel s.o.:
Die Realisierung der Testgröße ist t = 2, 40.
Da die Alternativhypothese HA : µ > 3 ist, errechnet man den p-value wie folgt:
p = PH0 (T > t) = PH0 (T > 2, 40) = 0, 020
p = 0, 020 < 0, 05 = α
=⇒
H0 wird ablehnt.
Student-t Verteilung
0,4
FG
9
Dichte
0,3
0,2
0,1
p = 0,020
0
-6
-4
-2
0
39
2
t=2,40
4
6
4.1.3
Parametertests
Eine Stichprobe
Normalverteilte Stichprobe
Xi ∼ N(µ, σ 2 ) i = 1, .., n.
• Test für den Erwartungswert µ, d.h. Test bezüglich der Lage:
H 0 : µ = µ0
HA : µ 6= µ0
HA : µ > µ 0
HA : µ < µ 0
X − µ0 √
H
(σ 2 bekannt)
T =
n
T ∼0 N(0, 1)
σ
ª
©
K = t | |t| ≥ z1− α2
K = {t | t ≥ z1−α }
(H0 : µ ≤ µ0 ist hier auch möglich.)
K = {t | t ≤ −z1−α }
(H0 : µ ≥ µ0 ist hier auch möglich.)
Der folgende Test wird auch als t-Test bezeichnet.
H 0 : µ = µ0
HA : µ 6= µ0
HA : µ > µ 0
HA : µ < µ 0
(σ 2 unbekannt)
T =
ª
©
K = t | |t| ≥ tn−1;1− α2
K = {t | t ≥ tn−1;1−α }
K = {t | t ≤ −tn−1;1−α }
X − µ0 √
n
S
H
T ∼0 tn−1
(H0 : µ ≤ µ0 ist hier auch möglich.)
(H0 : µ ≥ µ0 ist hier auch möglich.)
• Test für die Varianz σ 2 , d.h. Test bezüglich der Streuung:
H0 : σ 2 = σ02
HA : σ 2 6= σ02
HA : σ 2 > σ02
HA : σ 2 < σ02
Dabei ist S ∗2 = n1
H0 : σ 2 = σ02
HA : σ 2 6= σ02
HA : σ 2 > σ02
HA : σ 2 < σ02
nS ∗2
H
(µ bekannt)
T = 2
T ∼0 χ2n
σ0
n
o
K = t | t ≥ χ2n;1− α oder t ≤ χ2n; α
2
2
©
ª
2
2
K = t | t ≥ χn;1−α
(H0 : σ ≤ σ02 ist hier auch möglich.)
©
ª
K = t | t ≤ χ2n;α
(H0 : σ 2 ≥ σ02 ist hier auch möglich.)
n
P
(Xi − µ)2 die empirische Varianz, falls der Erwartungswert µ bekannt ist.
i=1
(n − 1)S 2
H
(µ unbekannt)
T =
T ∼0 χ2n−1
2
σ0
n
o
2
2
K = t | t ≥ χn−1;1− α oder t ≤ χn−1; α
2
2
©
ª
2
2
K = t | t ≥ χn−1;1−α
(H0 : σ ≤ σ02 ist hier auch möglich.)
ª
©
(H0 : σ 2 ≥ σ02 ist hier auch möglich.)
K = t | t ≤ χ2n−1;α
40
Bernoulliverteilte Stichprobe
Xi ∼ B(p) i = 1, .., n.
(Tritt das Ereignis A ein, dann ist die Zufallgröße Xi gleich 1. P (A) = P (Xi = 1) = p.)
n groß, Faustregel: np0 (1 − p0 ) ≥ 9.
Hypothese
H0
HA
p = p0
p 6= p0
p ≤ p0
p > p0
p ≥ p0
T =
Verteilung von T ,
falls p = p0
√ X−npo
npo (1−po )
kritischer Bereich
|t| ≥ z1−α/2
t ≥ z1−α
N(0, 1)
p < p0
X=
Dabei ist
Testgröße T
n
X
t ≤ −z1−α
Xi
die absolute Häufigkeit von A.
i=1
Zwei unabhängige Stichproben
Bernoulliverteilte Stichproben:
X1i ∼ B(p1 )
i = 1, .., n1
und
X2i ∼ B(p2 )
i = 1, .., n2 .
n1 und n2 groß, Faustregel: n1 ≥ 50, n2 ≥ 50, np̂ > 5 und n(1 − p̂) > 5.
Hypothese
H0
HA
p1 = p2
p1 6= p2
p1 ≤ p2
p1 > p2
Testgröße T
T =
p̂1 −p̂2
³
s
´
kritischer Bereich
|t| ≥ z1−α/2
t ≥ z1−α
N(0, 1)
1
+ n1
n1
2
p̂(1−p̂)
p1 ≥ p2
Verteilung von T ,
falls p1 = p2
p1 < p2
Dabei sind X1 =
n1
X
i=1
t ≤ −z1−α
n
2
X
X1
X2
X1 + X2
X1i , pˆ1 =
und X2 =
X2i , p̂2 =
und p̂ =
mit n = n1 + n2 .
n1
n
n
2
i=1
Normalverteilte Stichproben:
X1i ∼ N(µ1 , σ12 )
i = 1, .., n1
und
X2i ∼ N(µ2 , σ22 )
i = 1, .., n2 .
• Test für die Varianzen σ12 und σ22 , d.h. Test bezüglich der Streuungen:
Hypothese
H0
HA
2
2
σ1 = σ2
σ12 6= σ22
σ12 ≤ σ22
σ12 ≥ σ22
σ12 > σ22
σ12 < σ22
Testgröße T
T =
Verteilung von T ,
falls σ12 = σ22
kritischer Bereich
t ≥ Fn1 −1,n2 −1;1− α2 oder
t ≤ Fn1 −1,n2 −1; α2
S12
S22
Fn1 −1,n2 −1
41
t ≥ Fn1 −1,n2 −1;1−α
t ≤ Fn1 −1,n2 −1;α
• Tests für die Erwartungsverte µ1 und µ2 (Lagevergleich):
Doppelter-t-Test (Vorausetzung ist, dass die Varianz gleich ist, d.h. σ12 = σ22 )
Hypothese
H0
HA
µ1 = µ 2
µ1 6= µ2
µ1 ≤ µ2
µ1 > µ 2
µ1 ≥ µ2
µ1 < µ 2
Dabei ist Sg2 =
1
n1 +n2 −2
h
Testgröße T
T =
X 1 −X 2
Sg
q
Verteilung von T ,
falls µ1 = µ2
kritischer Bereich
|t| ≥ tn1 +n2 −2,1−α/2
n1 n2
n1 +n2
tn1 +n2 −2
t ≥ tn1 +n2 −2;1−α
t ≤ −tn1 +n2 −2;1−α
i
(n1 − 1)S12 + (n2 − 1)S22 die geschätzte Gesamtvarianz.
Welch-Test
Hypothese
H0
HA
µ1 = µ 2
µ1 6= µ2
Testgröße T
µ1 ≤ µ2
µ1 > µ 2
T =
µ1 ≥ µ2
µ1 < µ 2
Verteilung von T ,
falls µ1 = µ2
kritischer Bereich
|t| ≥ tm,1−α/2

³
X 1 −X 2
r
2
S2
S1
+ n2
n1
2
2
n1 −1
´2
t ≥ tm;1−α
t ≤ −tm;1−α


³ ´2 
 .
S2

Der Freiheitsgrad ist m = 
 ³ 2´
S1
n1
tm
2
S1
S2
+ n2
n1
2
+
2
n2
n2 −1
int
Dabei ist [x]int der ganzzahlige Anteil von x, z.B. [3, 78]int = 3.
• Test zum Lagevergleich zweier unabhängiger Stichproben:
Rangtest nach Wilcoxon (Wilcoxon-Mann-Whitney-Test)
Der Wilcoxon-Rangsummentest dient zum Vergleich zweier unabhängiger Stichproben hinsichtlich ihrer zentralen Tendenz (ihrer Lage). Im Falle nicht gegebener Normalverteilung
ersetzt der Wilcoxon-Rangsummentest also den doppelten-t-Test.
X1 , .., Xn1 mit stetiger Verteilungsfunktion FX .
Y1 , .., Yn2 mit stetiger Verteilungsfunktion FY .
Es gibt eine Zahl a, so dass für alle Zahlen t gilt:
FY (t) = FX (t + a)
Daraus folgt z.B. EX = EY + a.
42
Verteilungsfunktionen
Dichtefunktionen
1
1,2
F_Y
F_X
f_Y
f_X
1
0,8
a=1
0,8
0,6
0,6
0,4
0,4
0,2
0,2
a=1
0
0
0
1
2
x
3
0
4
1
2
x
3
4
µ1 = EX und µ2 = EY
Hypothese
H0
HA
µ1 = µ 2
µ1 6= µ2
µ1 ≤ µ2
µ1 ≥ µ2
µ1 > µ 2
µ1 < µ 2
Testgröße T
Verteilung von T ,
falls µ1 = µ2
T = R1
kritischer Bereich
t ≥ wn1 ,n2 ;1− α2 oder
t ≤ wn1 ,n2 ; α2
t ≥ wn1 ,n2 ;1−α
t ≤ wn1 ,n2 ;α
Wn1 ,n2
Die Tabellen für wn1 ,n2 ;α sind im Anhang zu finden. Dabei ist
wn1 ,n2 ;1−α = n1 (n1 + n2 + 1) − wn1 ,n2 ;α .
In der gemeinsamen Stichprobe (beide Stichproben zusammen) werden die Ränge bestimmt.
Bildet man die Summe dieser Ränge in der ersten Stichprobe , so erhält man R1 .
Approximativ (für grosse Stichproben, Faustregel: n1 ≥ 4, n2 ≥ 4, n1 + n2 ≥ 20)
Hypothese
H0
HA
µ1 = µ 2
µ1 6= µ2
µ1 ≤ µ2
µ1 > µ 2
µ1 ≥ µ2
µ1 < µ 2
Testgröße T
Vert. von T ,
falls µ1 = µ2
kr. Bereich
|t| ≥ z1−α/2
R1 − 12 ·n1 (n1 +n2 +1)
1
·n ·n ·(n1 +n2 +1)
12 1 2
T =√
N(0, 1)
t ≥ z1−α
t ≤ −z1−α
Oft wird der Test zum Vergleich der Lage zweier unabhängiger Stichproben verwendet, falls
die Daten ein beliebiges metrisches oder auch nur ein ordinales Skalenniveau besitzen.
43
Zwei verbundene Stichproben
Beobachtet man zwei Merkmale an ein- und demselben Objekt, so entsteht eine verbundene
Stichprobe. (Beispiel: Die Anzahl der Bestellungen der Stammkunden vor (1. Stichprobe)
und nach (2. Stichprobe) einer Werbeaktion werden erfasst.) Bei einer verbundenen Stichprobe gibt es damit zu jedem Merkmalswert in der ersten Stichprobe einen Merkmalswert in
der zweiten Stichprobe. Die Stichprobenumfänge sind damit in beiden Stichproben gleich.
Die Unabhängigkeit der beiden Stichproben kann nicht mehr vorausgesetzt werden, darum
spricht man bei verbundenen Stichproben auch von abhängigen Stichproben. Nach wie vor
werden die Werte innerhalb der 1. Stichprobe: X1 , X2 , . . . , Xn und innerhalb der 2. Stichprobe: Y1 , Y2 , . . . , Yn als unabhängige Zufallvariablen betrachtet.
Verbundene Stichprobe: (X1 , Y1 ), (X2 , Y2 ), . . . (Xn , Yn )
Durch die Bildung der Differenz der beiden Stichproben erhält man eine Stichprobe
Di = Xi − Yi
i = 1, . . . , n.
Je nach Fragestellung und weiteren Voraussetzungen an die verbundene Stichprobe kann
man jetzt Tests für eine Stichprobe verwenden. Für die folgenden Tests wird erst einmal
nur vorausgestzt, dass Di eine stetige Zufallsgröße ist.
Normalverteilte Stichproben:
Xi ∼ N(µ1 , σ12 )
i = 1, .., n
und
Yi ∼ N(µ2 , σ22 )
i = 1, .., n.
• Tests für die Erwartungswerte µ1 und µ2 (Lagevergleich):
t-Test für zwei verbundene Stichproben
Verwende den t-Test für eine Stichprobe für D1 , . . . , Dn
Di ∼ N(µd , σd ) i = 1, .., n.
Dabei ist
µ d = µ1 − µ2 .
• Weitere Tests zum Lagevergleich zweier verbundener Stichproben:
Vorzeichentest
Im Falle nicht gegebener Normalverteilung ersetzt der Vorzeichentest, oder mit stärkeren
Voraussetzungen der Wilcoxon-Vorzeichentest, den t-Test für zwei verbundene Stichproben.
(
n
X
1 : Di > 0 (≡ Xi > Yi )
Zi dann ist Z ∼ Bin(n, p) mit p = P (X > Y ).
Zi =
Z=
0 : Di < 0 (≡ Xi < Yi )
i=1
Verwende Tests für die Wahrscheinlichkeit p.
44
Wilcoxon-Vorzeichentest
Hier wird noch vorausgestzt, dass die Differenzen Di stetig und symmetrisch um den Median M verteilt sind.
Mögliche Hypothesen sind dann z.B.:
M > 0, d.h. mehr positive Differenzen bzw. X ist größer“ als Y.
”
M < 0, d.h. mehr negative Differenzen bzw. X ist kleiner“ als Y.
”
Hypothese
H0
HA
M =0
M 6= 0
M ≤0
M ≥0
M >0
M <0
Testgröße T
T =
n
P
i=1
Verteilung von T ,
falls M = 0
+
t ≥ wn;1−
α oder
2
+
t ≤ wn; α
2
Ri+
Wn+
· Zi
t≥
+
wn;1−α
+
t ≤ wn;α
(
Dabei sind
kritischer Bereich
Ri+ = Rang(|Di |)
und
Zi =
1 : Di > 0
.
0 : Di < 0
Man bestimmt also die Beträge der Differenzen Di und von diesen dann die Ränge. In der
Testgröße T werden dann alle Ränge aufsummiert, bei welchen Di > 0, d.h. die Differenzen
positiv sind.
+
Die Tabellen für wn;α
sind im Anhang zu finden. Dabei ist
+
wn;1−α
=
n(n + 1)
+
− wn;α
.
2
Approximativ (für große Stichproben, Faustregel: n ≥ 20)
Hypothese
H0
HA
M =0
M 6= 0
Testgröße T
M ≥0
M >0
M <0
kritischer Bereich
|t| ≥ z1−α/2
n
P
M ≤0
Verteilung von T ,
falls M = 0
Ri+ ·Zi − 14 n(n+1)
T = √1
i=1
24
n(n+1)(2n+1)
N(0, 1)
t ≥ z1−α
t ≤ −z1−α
45
4.1.4
Nichtparametrische Tests
Tests auf Vorliegen einer bestimmten Verteilung
Für eine Stichprobe X1 , . . . , Xn (identisch verteilte (d.h. FXi (t) = FX (t) i = 1, .., n) und
unabhängige Zufallsgrößen) soll untersucht werden, welche Verteilung vorliegt.
H0 : FX (t) = F0 (t)
gegen
HA : FX (t) 6= F0 (t)
Dabei ist F0 die Verteilungsfunktion der hypothetischen Verteilung.
χ2 -Anpassungstest
Voraussetzung: großer Stichprobenumfang
Die Stichprobe X1 , . . . , Xn wird in k Klassen eingeteilt.
hi - absolute Häufigkeit der Stichprobenwerte in der Klasse i (i = 1, . . . , k)
pi - Wahrscheinlichkeit unter H0 , dass eine Beobachtung in der Klasse i liegt
Testgröße:
Kritischer Bereich:
T =
©
k
X
(hi − npi )2
npi
i=1
K = t | t > χ2k−m−1;1−α
ª
Dabei ist m die Anzahl der Parameter der hypothetischen Verteilung, die aus der Stichprobe
geschätzt werden.
Da der χ2 -Anpassungstest ein asymptotischer Tests ist, sollten die Stichproben als ganzes
nicht zu klein sein. Auch sollte man die Klassen so wählen, dass die erwarteten Häufigkeiten (npi ) in jeder Klasse größer als 1 sind. Ist das nicht der Fall, dann lege man Klassen
zusammen. Das Testergebnis hängt von der Klasseneinteilung ab.
Kolmogorov-Smirnov-Test
Voraussetzung: F0 muss stetig sein und darf keine unbekannten Parameter enthalten.
Testgröße:
T = sup |F̂n (t) − F0 (t)|
t
Dabei ist F̂n die empirische Verteilungsfunktion.
Für die praktische Anwendung des K-S-Testes verwende man ein Statistik-Programm.
Der K-S-Test ist (im Vergleich zum χ2 −Anpassungstest) auch für kleine Stichproben anwendbar und das Testergebnis hängt nicht von einer Klasseneinteilung ab. Auch kann man
mit dem K-S-Test einseitige Fragestellungen testen. Es gibt Modifikationen des K-S-Tests,
bei denen F0 noch unbekannte und damit aus der Stichprobe zu schätzende Parameter
enthält (bei Normalverteilung z.B. Lilliefors-Test). Desweiteren kann man mit einer Version
des K-S-Test testen, ob zwei Stichproben die gleiche Verteilung besitzen.
46
Shapiro-Wilk-Test (Test auf Vorliegen der Normalverteilung)
Der Shapiro-Wilk-Test testet ausschließlich, ob bei der Stichprobe eine Normalverteilung
vorliegt. Für diese Frage ist es der Test mit der höchsten Güte. Zur Durchführung des Tests
wird eine Statistik-Software (z.B. Statgraphics, SPSS, R,.. ) benötigt, da dieser Test sehr
rechenintensiv ist.
Unabhängigkeitstest
Kontingenztafel (p × q - Tafel)
Der χ2 -Unabhängigkeitstest überprüft, ob zwei (beliebig skalierte) Merkmale X und Y
stochastisch unabhängig sind.
H0 : X und Y sind stochastisch unabhängig
Merkmal X : p Klassen A1 , . . . , Ap
Merkmal Y : q Klassen B1 , . . . , Bq
Y
B1
X
A1
...
Ap
...
Bq
h11
h1q
hij
hp1
h•1
hpg
h•q
...
h1•
...
hp•
n
hij - absolute Häufigkeit der Realisierungen in der Klassenkombination Ai und Bj
hi• - Zeilensummen
h•j - Spaltensummen
Testgröße:
³
X X hij −
p
T =
q
´2
hi• ·h•j
n
i=1 j=1
Kritischer Bereich:
hi• ·h•j
n
ª
©
K = t | t > χ2(p−1)(q−1);1−α
p . . . Anzahl der Zeilen
q . . . Anzahl der Spalten
Sind X und Y normalverteilt, dann verwendet man zum Testen der Unabhängigkeit den
Pearson - Korrelationstest (Test auf Unkorreliertheit) (s. S. 52).
47
4.2
4.2.1
Stichprobenpläne zur Qualitätskontrolle
(n, c)-Stichprobenplan
n . . . Stichprobenumfang
c . . . Annahmezahl
X . . . (zufällige) Anzahl der Ausschussstücke in der Stichprobe
p . . . (unbekannter) Anteil des Ausschusses an der Gesamtheit der Lieferung
Für diesen unbekannten Ausschussanteil p sollen folgende Hypothesen getestet werden:
H0 : p ≤ pα (Ausschussanteil p von höchstens pα =⇒ gute Lieferung.)
HA : p ≥ pβ (Ausschussanteil von mindestens pβ =⇒ schlechte Lieferung.) (pα < pβ )
X≤c
X>c
Testentscheidung:
=⇒
=⇒
H0 wird angenommen,
H0 wird abgelehnt.
L(p). . . OC-Funktion an der Stelle p.
(Die OC-Funktion des Tests gibt an, mit welcher Wahrscheinlichkeit H0 angenommen wird.)
1.) Die Wahrscheinlichkeit der Ablehnung (H0 wird abgelehnt) einer guten Lieferung ist
höchstens α (Produzentenrisiko):
L(pα ) ≥ 1 − α.
2.) Die Wahrscheinlichkeit der Annahme (H0 wird angenommen) einer schlechten Lieferung
ist höchstens β (Konsumentenrisiko):
L(pβ ) ≤ β.
Operationscharakteristik (OC-Kurve)
n=1195, c=10
1
L(p_alpha) >0,95
0,8
L(p)
0,6
0,4
0,2
L(p_beta)<0,03
0
0
0,5
p_alpha=0,05
1
1,5
p_beta=1,5
48
2
2,5
3
p
(in %)
n und c müssen so bestimmt werden, dass die Forderungen 1.) und 2.) erfüllt sind. Dazu
kann man z.B. das Statistik-Programm Statgraphics nutzen. Näherungsweise kann man
auch eine der folgenden Approximationen verwenden.
4.2.2
Approximative Berechnung eines (n, c)-Stichprobenplanes
Poisson-Approximation
χ22(c+1);1−β
2pβ
χ22(c+1);α
≤ n ≤
2pα
Normalverteilungs-Approximation
npα + z1−α
q
p
npα (1 − pα ) − 0, 5 ≤ c ≤ npβ − z1−β
npβ (1 − pβ ) − 0, 5
Man erhält folgende untere Schranke für den Stichprobenumfang:
"p
#2
p
pα (1 − pα )z1−α + pβ (1 − pβ )z1−β
n≥
pβ − pα
4.2.3
Sequentielle Stichprobenpläne
Es werden die gleichen Hypothesen wie beim (n, c)-Stichprobenplan getestet. Aber jetzt
gibt es noch eine 3-te mögliche Testentscheidung, nämlich die Fortsetzung der Prüfung.
k . . . Anzahl der geprüften Stücke
Xk . . . (zufällige) Anzahl der Ausschussstücke unter den ersten k geprüften
Testentscheidung:
X k ≤ cs · k − a
X k ≥ cs · k + b
cs · k − a < Xk < cs · k + b
=⇒
=⇒
=⇒
H0 wird angenommen,
H0 wird abgelehnt.
Prüfung wird fortgesetzt.
Dabei sind (als Funktionen von k) cs ·k−a die Annahmegerade und cs ·k+b die Ablehnungsgerade.
µ
Mit d = ln
pβ (1 − pα )
pα (1 − pβ )
³
¶
sind
a=
ln
1−α
β
d
´
,
b=
ln
³
¡ 1−β ¢
α
d
und
cs =
ln
1−pα
1−pβ
´
d
(Mit diesen Parametern werden die Forderungen L(pα ) ≥ 1 − α und L(pβ ) ≤ β näherungsweise erfüllt.)
49
.
erwarteter Stichprobenumfang:
 b−(a+b)·L(p)

 p−cs
EN =


ab
cs (1−cs )
für p 6= cs
für p = cs
Entscheidungsgebiete in einem Beispiel:
Sequentieller Test
5
Ablehnungsbereich
4
x_k
3
2
Fortsetzungsbereich
1
0
-1
Annahmebereich
-2
0
10
20
30
40
50
k
4.3
Kontrollkarten
Variablenprüfung mit der Mittelwertkarte
Merkmal X sei normalverteilt mit X ∼ N(µ, σ 2 )
a : Sollwert für den Erwartungswert µ
H0 : µ = a
gegen
HA : µ 6= a
Es wird zu verschiedenen Zeitpunkten getestet, ob der Sollwert eingehalten wird oder ob
es Abweichungen vom Sollwert gibt. Der Stichprobenumfang n ist für jeden Entnahmezeitpunkt der Gleiche. Die Varianz σ 2 sei bekannt.
X
(j)
: Mittelwert aus einer Stichprobennahme vom Umfang n zum Zeitpunkt tj , j = 1, . . .
Die Hypothese H0 wird nicht abgelehnt (d.h. H0 wird angenommen), falls der Mittelwert
(j)
X innerhalb der Kontrollgrenzen liegt, d.h.:
σ
σ
(j)
a − z1− α2 √ < X < a + z1− α2 √
n
n
mit α = 0, 01 für den europäischen Bereich.
Wählt man α = 0, 05, so erhält man die sogenannten Warngrenzen.
50
Mittelwertkarte
11,7
UCL = 9,69
CTR = 7,50
LCL = 5,31
Mittelwert
9,7
7,7
5,7
3,7
0
2
4
6
8
10
Eingriffskennlinie
g(µ). . . Gütefunktion an der Stelle µ.
(Die Gütefunktion des Testes gibt an, mit welcher Wahrscheinlichkeit H0 abgelehnt wird.)
Die Gütefunktion wird hier Eingriffskennlinie genannt, da eingegriffen wird, falls H0 abgelehnt wird.
¡ √
¢
¡ √
¢
µ−a
g(µ) = g1 (δ) = Φ δ n − z1− α2 + Φ −δ n − z1− α2
mit δ =
σ
Eingriffskennlinie
1
g(mu)
0,8
0,6
0,4
0,2
alpha = 0,01
0
9
10
11
12
13
a = 12
14
15
mu
Lauflänge
N : Anzahl der Kontrollen bis zum ersten Eingriff
p : Wahrscheinlichkeit des Eingriffs zu einem festen Zeitpunkt, p = g(µ) = g1 (δ)
N genügt einer geometrischen Verteilung : P (N = k) = p(1 − p)k−1 .
EN =
1
1
1
=
=
p
g(µ)
g1 (δ)
51
5
Varianzanalyse
5.1
einfache Klassifikation
Tests auf Lokationsunterschiede von p unabhängigen Stichproben.
1 - te Stichprobe: X11 , . . . , X1n1
..
.
mit Erwartungswert
µ1 ,
..
.
p - te Stichprobe : Xp1 , . . . , Xpnp
mit Erwartungswert
µp .
H 0 : µ1 = µ2 = . . . = µp
H A : µi =
6 µj für mindestens zwei i und j mit i 6= j
5.1.1
Test bei Normalverteilung
Die Stichproben sind normalverteilt mit unbekannter und gleicher Varianz σ 2 .
Xij ∼ N(µi , σ 2 )
i = 1, . . . , p
j = 1, . . . , ni .
⇐⇒
Xij = µi + εij
mit εij ∼ N(0, σ 2 ) i = 1, . . . , p j = 1, . . . , ni .
ANOVA-Tafel:
p
N
Quelle der
Variation
Streuung
zwischen
den Stufen
Streuung innerhalb der
Stufen (Rest)
Freiheitsgrade
Summe der
Quadrate
Mittlere
Quadrate
p−1
SSA
M SA =
SSA
p−1
N −p
SSR
M SR =
SSR
N −p
Gesamtstreuung
N −1
SST
. . . Anzahl der Stufen eines Faktors
. . . Anzahl der Messwerte insgesamt, d.h. N =
p
P
ni
i=1
kritischer Bereich:
K = {t | t > Fp−1;N −p;1−α }
52
Testgröße
T =
M SA
M SR
5.1.2
Kruskal-Wallis-Test
Beim Test von Kruskal-Wallis reicht es, dass die Stichproben einer stetigen Verteilung entstammen. Die Normalverteilung wird nicht vorausgesetzt.
p
ni
N
. . . Anzahl der Stufen
. . . Anzahl der Messwerte in der Stufe i
. . . Anzahl der Messwerte insgesamt, d.h. N =
p
P
i = 1, . . . , p
ni
i=1
In der gemeinsamen Stichprobe (alle p Stichproben zusammen) werden die Ränge bestimmt.
rij
ri•
. . . Rangzahl der j-ten Beobachtung in der i-ten Stufe
. . . Summe der Ränge in der Stufe i
Testgröße:
1
T =
B
mit
g
th
"
j = 1, . . . , ni
!
#
à p
X 1
2
− 3(N + 1)
ri•
n
i
i=1
12
N (N + 1)
g
X
1
B =1− 3
(t3h − th )
·
N − N h=1
. . . Anzahl der Bindungen
. . . Anzahl der gleichen Messwerte in der h-ten Bindung h = 1, . . . , g
kritischer Bereich: (Approximativ, Faustregel: ni > 5 (für p = 3 sollte allerdings mindestens
ein ni größer als 8 sein.))
©
ª
K = t | t > χ2p−1;1−α
Sind die p Stichproben nicht unabhängig, sondern verbunden, dann verwende man den
Friedman-Test.
5.2
zweifache Klassifikation
Modell mit Wechselwirkung:
Xijk = µ + αi + βj + γij + εijk
µ ...
αi . . .
βj . . .
γij . . .
εijk . . .
i = 1, . . . , p;
j = 1, . . . , q;
allg. Erwartungswert
Effekte der Stufen von A
Effekte der Stufen von B
Effekt durch Wechselwirkung von A und B
zufälliger und normalverteilter Fehler
εijk ∼ N(0, σ 2 )
53
k = 1, . . . nij
Die folgenden Hypothesen sollen getestet werden:
H0A : α1 = α2 = . . . = αp = 0
H0B : β1 = β2 = . . . = βq = 0
H0AB : γ11 = . . . = γpq = 0
Anova-Tabelle: gleiche Klassenbesetzung - balancierter Fall (d.h. nij = n)
Insgesamt gibt es dann N = p · q · n Beobachtungen.
Quelle der
Variation
Streuung zwischen den
Stufen von A
Streuung zwischen den
Stufen von B
Wechselwirkung
zwischen
A und B
Rest
Gesamtstreuung
Freiheitsgrade
Summe der
Quadrate
Mittlere
Quadrate
Testgröße
p−1
SSA
M SA
T =
M SA
M SR
q−1
SSB
M SB
T =
M SB
M SR
(p − 1)(q − 1)
SS(AB)
M S(AB)
T =
M S(AB)
M SR
N − pq
SSR
M SR
N −1
SST
Die Testgröße T ist (unter H0 ) jeweils F-verteilt mit folgenden Freiheitsgraden:
Der erste Freiheitsgrad ist der des Faktors und der zweite der des Restes.
Damit sind die kritischen Bereiche:
KA = {t | t > Fp−1,N −pq;1−α }
KB = {t | t > Fq−1,N −pq;1−α }
KAB = {t | t > F(p−1)(q−1),N −pq;1−α }
Modell ohne Wechselwirkung:
Xijk = µ + αi + βj + εijk
i = 1, . . . , p;
j = 1, . . . , q;
k = 1, . . . nij
(Erklärung der Modellparameter s. Modell mit Wechselwirkungen). Alles, was die Wechselwirkungen betrifft (Hypothese,..,kritischer Bereich) entfällt damit. Die einzige Änderung
(in der Anova-Tabelle, im balancierten Fall) zum Modell mit Wechselwirkung ist die Zahl
der Freiheitsgrade für Rest“:
”
N − p − q + 1.
Das Weitere ist analog zum Modell mit Wechselwirkungen.
54
5.2.1
Schätzung der Modellparameter
Modell mit Wechselwirkung: gleiche Klassenbesetzung - balancierter Fall (d.h. nij = n)
Xijk = µ + αi + βj + γij + εijk
i = 1, . . . , p;
Parameterschätzungen
Gesamterwartungswert:
j = 1, . . . , q;
k = 1, . . . n
µ̂ = X ···
Effekt vom Faktor A auf Stufe i:
α̂i = X i·· − X ···
Effekt vom Faktor B auf Stufe j:
β̂j = X ·j· − X ···
Wechselwirkungseffekt Faktor A auf Stufe i und Faktor B auf Stufe j:
γ̂ij = X ij· − X i·· − X ·j· + X ···
Diese Schätzungen gelten auch im Modell ohne Wechselwirkung:
Xijk = µ + αi + βj + εijk
i = 1, . . . , p;
j = 1, . . . , q;
k = 1, . . . n
In den Schätzungen werden folgende Mittelwerte verwendet.
Gesamt-Mittelwert:
p
q
n
1 XXX
Xijk
mit N = n · p · q
X ··· =
N i=1 j=1 k=1
Mittelwerte der Stufen der Faktoren:
q
Faktor A:
Faktor B:
n
X i··
1 XX
=
Xijk
np j=1 k=1
X ·j·
p
n
1 XX
Xijk
=
nq i=1 k=1
Mittelwert in der i-ten Stufe des Faktors A und der j-ten Stufe des Faktors B:
n
X ij·
1X
=
Xijk
n k=1
Es gelten, wie im Modell, die Reparametriesierungsbedingungen:
p
X
αi =
i=1
q
X
p
X
i=1
γij =
q
X
j=1
X
i=1
55
α̂i = 0
i=1
q
βj =
j=1
p
γij =
p
X
γ̂ij =
X
β̂j = 0
j=1
q
X
j=1
γ̂ij = 0
6
Korrelationsanalyse
6.1
Zwei Merkmale
6.1.1
Gewöhnlicher Korrelationskoeffizient (Bravais-Pearsonscher Korrelationskoeffizient)
(Maß für den linearen Zusammenhang zweier Zufallsgrößen X und Y .)
ρX,Y
Cov(X, Y )
E(X − EX)(Y − EY )
EXY − EX · EY
√
=
= √
VarX · VarY
VarX · VarY
VarX · VarY
= 0, dann heißen X und Y unkorreliert.
= Corr(X, Y ) = √
Ist ρX,Y
Dabei gilt:
X und Y sind unabhängig
=⇒
X und Y sind unkorreliert.
(Ist der Vektor Z = (X, Y )T 2-dimensional normalverteilt, dann ist für die normalverteilten
Zufallsgrößen X und Y Unkorreliertheit gleich Unabhängigkeit.)
Aus einer Stichprobe (X1 , Y1 ), . . . (Xn , Yn ) erfolgt die Schätzung von ρX,Y durch den
empirischen Korrelationskoeffizienten rX,Y = ρ̂X,Y :
n
P
(Xi − X)(Yi − Y )
i=1
rX,Y = r n
n
P
P
(Xi − X)2 (Yi − Y )2
i=1
i=1
Beispiel:
Zwei unkorrelierte Merkmale X und Y , d.h. ρX,Y = 0.
Realisierung einer Stichprobe vom Umfang 25:
Streudiagramm
3,5
2,5
Y
1,5
0,5
-0,5
-1,5
-2,5
-2,1
-1,1
-0,1
X
Aus dieser Realsierung erhält man rx,y = 0, 1633.
56
0,9
1,9
• Test auf Unkorreliertheit
H0 : ρX,Y = 0
Es wird vorausgesetzt, dass der Vektor Z = (X, Y )T 2-dimensional normalverteilt ist. Dann
ist H0 gleichbedeutend damit, dass X und Y unabhängig sind.
Testgröße:
T =q
√
rX,Y
2
1 − rX,Y
H
T ∼0 tn−2
n−2
Je nach Wahl der Alternativhypothese erhält man den kritischen Bereich (vgl. S. 40).
Beispiel: (vgl. S. 6)
rx,y = 0, 9375
(x-Alter und y-Blutdruck)
• Test auf Größe von ρ.
H0 : ρX,Y = ρ0
Voraussetzung: X und Y sind (zumindest näherungsweise) normalverteilt.
Testgröße:
T = (z − z0 ) ·
mit
1
z = ln
2
µ
1 + rX,Y
1 − rX,Y
√
n−3
¶
H0
T ≈ N(0, 1)
1
z0 = ln
2
und
µ
1 + ρ0
1 − ρ0
¶
+
ρ0
.
2(n − 1)
Je nach Wahl der Alternativhypothese erhält man den kritischen Bereich (vgl. S. 40).
57
6.1.2
Spearmansche Rangkorrelation
Für eine Stichprobe (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) ist die Spearmansche Rangkorrelation
die gewöhnliche Korrelation (Bravais-Pearsonsche Korrelation) der Ränge:
Ui = Rang(Xi ) und Vi = Rang(Yi ) i = 1, . . . , n.
(S)
ρX,Y = Corr(U, V ) = Corr(Rang(X), Rang(Y ))
Liegen sowohl in der X-Stichprobe, als auch in der Y -Stichprobe keine Bindungen vor, so
kann man die Spearmansche Rangkorrelation zwischen X und Y leicht schätzen:
6
(S)
rX,Y
=1−
n
P
(Rang(Xi ) − Rang(Yi ))2
i=1
n(n2 − 1)
R(Xi ) . . . Rang von Xi in der X-Stichprobe
R(Yi ) . . . Rang von Yi in der Y -Stichprobe
Falls es Bindungen gibt:
(S)
rX,Y
py
px
n
P
P
P
n(n2 − 1) − 12 (t3j − tj ) − 12 (s3j − sj ) − 6 (Rang(Xi ) − Rang(Yi ))2
j=1
j=1
i=1
s
s
=
py
p
x
P
P
n(n2 − 1) − (t3j − tj ) n(n2 − 1) − (s3j − sj )
j=1
j=1
px
. . . Anzahl der Bindungen in der X-Stichprobe
tj . . . Anzahl der gleichen Messwerte in der j-ten Bindung der X-Stichprobe
py
sj
. . . Anzahl der Bindungen in der Y -Stichprobe
. . . Anzahl der gleichen Messwerte in der j-ten Bindung der Y -Stichprobe
(S)
Einfacher ist er allerdings, rX,Y als gewöhliche Korrelation der Rangzahlen zu bestimmen.
• Test auf Unkorreliertheit der Ränge (Test auf Unabhängigkeit ordinaler Merkmale).
=0
H0 : ρ(S)
X,Y
Der folgende Test ist nur approximativ (großer Stichprobenumfang, Faustregel: n ≥ 30).
Testgröße:
(S)
T = rX,Y
√
H0
n−1
T ≈ N(0, 1)
Je nach Wahl der Alternativhypothese erhält man den kritischen Bereich (vgl. S. 40).
Für kleine Stichprobenumfänge verwende man den exakten Test.
(vgl. Hotelling-Pabst-Statistik)
58
6.1.3
Kendallsche Rangkorrelation (Kendalls τ )
Die Paare (Xi , Yi ) und (Xj , Yj ) heißen konkordant, falls
(Xi − Xj )(Yi − Yj ) > 0 d.h. Xi < Xj =⇒ Yi < Yj
oder Xi > Xj =⇒ Yi > Yj .
und diskordant, falls
(Xi − Xj )(Yi − Yj ) < 0 d.h. Xi < Xj =⇒ Yi > Yj
oder Xi > Xj =⇒ Yi < Yj .
Für eine Stichprobe (X1 , Y1 ), (Y2 , Y2 ), . . . , (Xn , Yn ) ist die Kendallsche Rangkorrelation:
(K)
ρX,Y = τ = P ((Xi − Xj )(Yi − Yj ) > 0) − P ((Xi − Xj )(Yi − Yj ) < 0)
(i 6= j)
Aus der Stichprobe schätzt man die Kendallsche Rangkorrelation wie folgt:
nk − nd
(K)
s
=τ = s
rX;Y
py
px
¡ n¢ 1 P
¡ n¢ 1 P
(t
−
1)t
−
−
(sj − 1)sj
j
j
2
2
2
2
j=1
j=1
nk
. . . die Anzahl der konkordanten Paare
nd
. . . die Anzahl der diskordanten Paare
px
. . . Anzahl der Bindungen in der X-Stichprobe
tj . . . Anzahl der gleichen Messwerte in der j-ten Bindung der X-Stichprobe
py
. . . Anzahl der Bindungen in der Y -Stichprobe
sj . . . Anzahl der gleichen Messwerte in der j-ten Bindung der Y -Stichprobe
Liegen keine Bindungen vor, dann vereinfacht sich die Formel zu:
4nd
nk − nd
(K)
¡ n¢ = 1 −
rX;Y
=τ =
n(n − 1)
2
Man ordne die Stichprobenpaare (X1 , Y1 ), . . . , (Xn , Yn ) so, dass X1 < X2 < . . . < Xn ist.
qj
. . . Anzahl der auf Yj folgenden Werte Yi (j < i), die kleiner sind als Yj (Yi < Yj ).
Anzahl der diskordanten Paare:
nd =
n
X
qj .
j=1
• Test, ob Kendalls τ gleich 0 (Test auf Unabhängigkeit ordinaler Merkmale).
H0 : ρ(K)
=0
X,Y
Der folgende Test ist nur approximativ (großer Stichprobenumfang, Faustregel: n ≥ 8).
Testgröße:
s
T =
9n(n − 1)
·τ
2(2n + 5)
H0
T ≈ N(0, 1)
Je nach Wahl der Alternativhypothese erhält man den kritischen Bereich (vgl. S. 40).
59
6.2
6.2.1
p > 2 Merkmale
Partieller Korrelationskoeffizient
Eine Korrelation zwischen zwei Zufallsgrößen X und Y kann möglicherweise auf einen
gemeinsamen Einfluss einer dritten Zufallsgröße U zurückgeführt werden. Die partielle Korelation ist die Korrelation zwischen X und Y unter Ausschaltung des Einflusses (d.h.
Konstanthaltung) von U .
(empirischer) Partieller Korrelationskoeffizient:
r − rX,U rY,U
rX,Y |U = q X,Y
2 ) · (1 − r 2 )
(1 − rX,U
Y,U
• Test auf partielle Unkorreliertheit
H0 : ρX,Y |U = 0
Es wird vorausgesetzt, dass X, Y und U normalverteilt sind.
Testgröße:
√
rX,Y |U
T =q
n−3
2
1 − rX,Y
|U
H
T ∼0 tn−3
Je nach Wahl der Alternativhypothese erhält man den kritischen Bereich (vgl. S. 40).
6.2.2
Multipler Korrelationskoeffizient
Betragmäßig größte Korrelation zwischen einer Zufallsgröße Y und einer Linearkombination der restlichen Zufallsgrößen X1 , . . . , Xp .
(empirischer) Multipler Korrelationskoeffizient für p = 2:
v
u 2
2
u rY,X + rY,X
− 2 · rY,X1 · rY,X2 · rX1 ,X2
1
2
rY |(X1 ,X2 ) = t
1 − rX2 ,X
1
2
• Test auf Unkorreliertheit zwischen Y und einer Linearkombination von X1 , . . . , Xp .
H0 : ρY |(X1 ,...,Xp ) = 0
gegen
HA : ρY |(X1 ,...,Xp ) > 0
Es wird vorausgesetzt, dass Y und X1 , . . . , Xp normalverteilt sind.
Testgröße:
T =
rY2 |(X
1 ,...,Xp )
(n − 1 − p)
p · (1 − rY2 |(X
1
)
,...,Xp )
kritischer Bereich:
K = {t | t > Fp,n−p−1;1−α }
60
H
T ∼0 Fp,n−p−1
7
Regressionsanalyse
7.1
Lineare Regressionsanalyse
7.1.1
Einfache lineare Regression
Modell
Y = a + bx + ε
Es gibt einen linearen Zusammenhang zwischen x und Y , welcher durch einen zufälligen Fehler ε überlagert wird.
Y . . . abhängige Variable, Wirkungsgröße, Regressand
x . . . unabhängige Variable, Einflussgröße, Regressor
ε . . . zufälliger Fehler
Für Tests und Konfidenzschätzung wird die Normalverteilung vorausgesetzt: ε ∼ N(0, σ 2 ).
Bestimmung von Schätzwerten für a und b, aus der Stichprobe (Beobachtungswerte)
((x1 , y1 ), . . . , (xn , yn )), nach der Methode der kleinsten Quadrate :
n
X
(yi − a − bxi )2 ⇒ min
a,b
i=1
Lösung:
n
P
b̂ =
(xi − x)(yi − y)
i=1
n
P
â = y − b̂x
(xi −
x)2
i=1
-
geschätzte Regressionsgerade ( Ausgleichsgerade“)
”
Beispiel (vgl. S. 6)
(x1 , y1 ) = (47, 129), . . . , (x15 , y15 ) = (63, 157)
Blutdruck = 77,3634 + 1,20645*Alter
160
150
Blutdruck
ŷ(x) = â + b̂x
140
130
120
110
30
40
50
Alter
61
60
70
Streuungszerlegung:
SST = SSE + SSR
n
P
SST = (yi − y)2 . . . Totalvarianz (der beobachteten Werte yi )
SSE =
i=1
n
P
(ŷi − y)2 . . . durch Regression erklärte Varianz (Varianz der geschätzten
i=1
SSR =
n
P
Werte ŷi )
(yi − ŷi )2 . . . Restvarianz
i=1
Schätzung der Fehlervarianz σ 2
(σ 2 = Var(ε))
σ̂ 2 = s2Rest =
1
SSR
n−2
Bestimmtheitsmaß:
SSE
SSR
=1−
= rx2 y
SST
SST
(Bei der einfachen linearen Regression ist das Bestimmtheitsmaß identisch mit dem
Quadrat der Korrelation der beiden Merkmale.)
B=
Beispiel:
Einfache Regression - Blutdruck gegen Alter
Abhängige Variable: Blutdruck
Unabhängige Variable: Alter
Lineares Modell: Y = a + b*X
Koeffizienten
Kleinste Quadrate
Parameter Schätzwert
Abs.-Glied 77,3634
Anstieg
1,20645
Standard
Fehler
5,97278
0,124208
Varianzanalyse
Ursache
Quadratsummen
Modell
2256,06
Residuum
310,869
Total (Korr.) 2566,93
FG Mittl.Quadr. F-Quotient
1
2256,06
94,34
13 23,913
14
t
Statistik
12,9527
9,71312
p-Wert
0,0000
0,0000
p-Wert
0,0000
Korrelationskoeffizient = 0,937494
R² = 87,8895 Prozent
Standardfehler der Schätzung = 4,89009
SST = 2566, 93; SSE = 2256, 06 und SSR = 310, 869.
σ̂ 2 = s2Rest =
B=
2256,06
2566,93
1
310, 869
13
= 23, 913
=⇒
sRest = 4, 89.
= 0, 87889
Tests (t-Tests) für die einzelnen Parameter:
• H0 : a = 0
gegen
HA : a 6= 0
(im Bsp.: â = 77, 3634 und p = 0, 0000 < 0, 05 = α
• H0 : b = 0
gegen
=⇒
H0 wird abgelehnt.)
=⇒
H0 wird abgelehnt.)
HA : b 6= 0
(im Bsp.: b̂ = 1, 20645 und p = 0, 0000 < 0, 05 = α
62
Test (F-Test) für das Modell (Varianzanalyse):
• H0 : b = 0
gegen
HA : b 6= 0
(im Bsp.: p = 0, 0000 < 0, 05 = α
=⇒
H0 wird abgelehnt.)
• Konfidenzinterval für die Regressionsgerade an der Stelle x, d.h. für EY (x) = a + bx:
v
u
(x − x)2
u1
[ŷ(x)−d; ŷ(x)+d] mit d = sRest ·tn−2;1− α2 u + P
(Konfidenzniveau:1−α).
n
tn
2
(xi − x)
i=1
Beispiel:
Blutdruck = 77,3634 + 1,20645*Alter
(α = 0, 05)
160
Blutdruck
150
140
130
120
110
30
40
50
Alter
60
• Prognoseintervall für Y an der Stelle x, d.h. für Y (x) = a + bx + ε:
v
u
1
(x − x)2
u
[ŷ(x) − d ; ŷ(x) + d] mit d = sRest · tn−2;1− α2 u1 + + P
n
t
n
(xi − x)2
70
(Konfidenzniveau: 1 − α).
i=1
Beispiel:
(α = 0, 05)
Blutdruck = 77,3634 + 1,20645*Alter
160
Blutdruck
150
140
130
120
110
30
40
50
Alter
63
60
70
Residuen:
ε̂i = yi − ŷi
i = 1, . . . , n.
Residuen-Diagramm
Blutdruck = 77,3634 + 1,20645*Alter
10
Residuen
6
2
-2
-6
-10
30
40
50
Alter
60
70
Studentisierte Residuen: Man bestimmt die Differenz zwischen yi und dem angepassten Wert, der sich
ergibt, wenn man die i-te Beobachtung zur Schätzung der Regressionsfunktion nicht verwendet. Diese
Differenz wird noch geeignet standardisiert, und man erhält das i-te studentisierte Residuum.
Residuen-Diagramm
Blutdruck = 77,3634 + 1,20645*Alter
Studentisierte Residuen
2,5
1,5
0,5
-0,5
-1,5
-2,5
30
40
50
Alter
64
60
70
7.1.2
Multiple(parameter-) lineare Regression
Modellierung der Abhängigkeit einer Wirkungsgröße Y von mehreren Einflussgrößen x1 , . . . , xk
Modell
Y (x) = a1 f1 (x) + a2 f2 (x) + . . . + ar fr (x) + ε
Y
x = (x1 , . . . , xk )T
f 1 , . . . , fr
a1 , . . . , ar
ε
. . . Wirkungsgröße
. . . Vektor der Einflussgrößen
. . . r - (bekannte, d.h. im Modell vorgegebene) Funktion
. . . r - unbekannte Parameter
. . . zufälliger Fehler
Für Tests und Konfidenzschätzung wird die Normalverteilung vorausgesetzt: ε ∼ N(0, σ 2 ).
Die Schätzung der r unbekannten Parameter erfolgt nach der Methode der kleinsten Quadrate.
â = (F T F )−1 F T y

f1 (x1 )

..
Dabei sind a = (a1 , . . . , ar )T , y = (y1 , . . . , yn ) und F = 
.

. . . fk (x1 )

..
..
.
.
.
f1 (xn ) . . . fk (xn )
Damit ist die geschätzte Regressionsfunktion:
ŷ(x) = â1 f1 (x) + . . . + âr fr (x)
Das Modell der einfachen linearen Regression ist ein Spezialfall der multiplen parameterlinearen Regression (r = 2). Fast alles Weitere ist analog zur einfachen linearen Regression.
Schätzung der Fehlervarianz σ 2
(σ 2 = Var(ε))
σ̂ 2 = s2Rest =
1
SSR
n−r
Für die Durchführung der Regressionsanalyse, und damit auch der folgenden möglichen Tests, nutze
man ein Statistik-Software-Programm (z.B. Statgraphics, SPSS, R,. . . ).
• Tests (t-Tests) für die einzelnen Parameter:
H0 : a i = 0
Testgröße:
âi
H0
∼ tn−r
2
sRest mi
T =p
mit mi : i-tes Diagonal-Element von (F T F )−1
• Test (F-Test) für das Modell (Varianzanalyse):
(Dabei sei f1 (x) = 1, d.h. a1 ist die Konstante im Modell).
H0 : a2 = . . . = ar = 0
gegen HA : es gibt mindestens ein i > 1 mit ai 6= 0
Testgröße:
T =
M SE H0
∼ Fr−1,n−r
M SR
65
• Test (F-Test) zur Modellüberprüfung:
( größeres“) Modell: rg Ansatzfunktion, d.h. rg Parameter, (Restquadratsumme SSRg ).
”
Wählt man von den rg Ansatzfunktionen rk (rk < rg ) aus, so erhält man ein kleineres“Modell.
”
kleineres“Modell: rk Ansatzfunktion, d.h. rk Parameter, (Restquadratsumme SSRk ).
”
H0 : Kleineres Modell ist ausreichend.“
”
Testgröße:
T =
gegen
HA : Kleineres Modell ist nicht ausreichend.“
”
n − rg SSRk − SSRg
rk
SSRg
Kritische Bereich zum Niveau α:
K = {t | t > Frk ,n−rg ;1−α }
66
7.2
Regression mit qualitativen Merkmalen
Y . . . qualitative Wirkgröße (nimmt nur zwei Werte an: Y ∈ {0, 1}
x1 , . . . , xk . . . Einflussgrößen
Aufgabenstellung: Wie groß ist die Wahrscheinlichkeit dafür, dass Y = 1 ist, in Abhängigkeit vom
Wert der Einflussgrößen x1 , . . . , xk .
Modelle für diese Wahrscheinlichkeit
p(x) := P (Y = 1 | X = x)
werden betrachtet.
Modell
p(x) = F (x)
mit
x=
r
X
aj fj (x)
j=1
F . . . eine Verteilungsfunktion
Die Parameter a1 ,. . . ,ar werden aus den Daten geschätzt.
Damit erhält man:


r
X
p̂(x) = F 
âj fj (x)
j=1
7.2.1
Logit-Modell
Verteilungsfunktion der logistischen Verteilung (mit α = 0 und β = 1):
F (x) =
7.2.2
1
.
1 + e−x
Probit-Modell
Verteilungsfunktion der Standardnormalverteilung:
F (x) = Φ(x).
Dichtefunktionen
Verteilungsfunktionen
1
0,4
N(0,1)
N(0,1)
Logi(0,1)
Logi(0,1)
0,8
0,3
0,6
0,2
0,4
0,1
0,2
0
0
-8
-6
-4
-2
0
x
2
4
6
8
-8
67
-4
0
x
4
8
Anhang
\ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Quantile 1 ,
;
2 3 6 6 6 7 7 7 8 8 8 8 9 9 9 10 10 10 11 4 10 10 11 11 12 12 13 13 14 15 15 16 16 17 18 18 19 19 20 20 5 15 16 16 17 18 19 20 21 22 22 23 24 25 26 27 28 29 29 30 31 32 6 21
22
23
24
25
26
27
28
30
31
32
33
34
36
37
38
39
40
42
43
44
45
7 28
29
31
32
34
35
37
38
40
41
43
44
46
47
49
50
52
53
55
57
58
60
8 37
38
40
42
43
45
47
49
51
53
54
56
58
60
62
64
66
68
70
71
73
75
9 45
46
48
50
52
54
56
58
61
63
65
67
69
72
74
76
78
81
83
85
88
90
92
55
57
59
61
64
66
68
71
73
76
79
81
84
86
89
92
94
97
99
102
105
107
110
10 der Wilcoxon‐Rangsummen‐Teststatistik für 3
3
3
3
3
3
3
,
11 66
68
71
73
76
79
82
84
87
90
93
96
99
102
105
108
111
114
117
120
123
126
129
13 92 94 98 101 104 108 111 115 118 122 125 129 133 136 140 144 148 151 155 159 163 166 170 14 106
109
112
116
120
123
127
131
135
139
143
147
151
155
159
163
168
172
176
180
184
188
192
122
125
128
132
136
140
144
149
153
157
162
166
171
175
180
184
189
193
198
202
207
211
216
15 12 79
81
84
87
90
93
96
99
102
105
109
112
115
119
122
125
129
132
136
139
142
146
149
,
;
16 138
141
145
149
154
158
163
167
172
177
181
186
191
196
201
206
210
215
220
225
230
235
240
17 155
159
163
168
172
177
182
187
192
197
202
207
213
218
223
228
234
239
244
249
255
260
265
18 173
177
182
187
192
197
202
208
213
218
224
229
235
241
246
252
258
263
269
275
280
286
292
19 190
193
197
202
207
212
218
223
229
235
241
247
253
259
264
271
277
283
289
295
301
307
313
319
20 210
213
218
223
228
234
240
246
252
258
264
270
277
283
289
296
302
309
315
322
328
335
341
348
21 231
234
239
245
250
256
263
269
275
282
289
295
302
309
315
322
329
336
343
349
356
363
370
377
,
;
22 253
257
262
267
274
280
287
293
300
307
314
321
328
335
342
349
357
364
371
378
386
393
400
408
23 276 280 285 291 298 305 311 319 326 333 340 348 355 363 370 378 385 393 401 408 416 424 431 439 24 300 304 310 316 323 330 337 345 352 360 368 375 383 391 399 407 415 423 431 439 447 455 464 472 25 325 330 335 342 349 357 364 372 380 388 396 404 412 421 429 437 446 454 463 471 480 488 497 505 \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Quantile 1 ,
;
2 3 4 10 10 10 11 11 11 12 12 13 13 13 14 14 14 15 15 5 15 16 16 17 17 18 18 19 20 20 21 22 22 23 23 24 25 25 6 21
22
23
24
25
25
26
27
28
29
30
31
32
33
33
34
35
36
37
7 28
29
30
31
33
34
35
36
37
38
39
41
42
43
44
46
47
48
49
50
8 36
37
38
40
41
42
44
45
47
48
50
51
53
54
56
57
59
60
62
63
65
9 46
47
48
50
52
53
55
57
59
60
62
64
66
68
70
71
73
75
77
79
81
55
56
58
60
61
63
65
67
69
72
74
76
78
80
82
84
87
89
91
93
95
98
10 der Wilcoxon‐Rangsummen‐Teststatistik für 6 6 6 6 7 7 7 7 7 ,
11 66
68
70
72
74
76
78
81
83
86
88
90
93
95
98
100
103
106
108
111
113
116
12 13 92 94 96 99 102 105 108 111 114 117 120 123 126 129 133 136 139 142 145 149 152 155 14 106
108
111
114
117
120
124
127
130
134
137
141
144
148
151
155
159
162
166
169
173
177
78
80
82
85
87
90
92
95
98
101
103
106
109
112
115
118
120
123
126
129
132
135
15 ,
121
124
127
130
134
137
141
144
148
152
156
160
163
167
171
175
179
183
187
191
195
199
;
16 138
141
144
147
151
155
159
163
167
171
175
179
184
188
192
196
201
205
209
214
218
222
17 153
155
158
162
166
170
174
178
182
187
191
196
200
205
210
214
219
223
228
233
238
242
247
18 171
174
177
181
185
189
194
198
203
208
213
217
222
227
232
237
242
247
252
257
262
267
273
19 190
193
197
201
205
210
215
219
224
230
235
240
245
250
256
261
267
272
277
283
288
294
299
20 210
213
217
222
226
231
236
242
247
252
258
264
269
275
280
286
292
298
304
309
315
321
327
21 232
235
239
243
249
254
259
265
271
276
282
288
294
300
306
312
318
325
331
337
343
349
356
,
;
22 254
257
261
266
272
277
283
289
295
301
307
314
320
326
333
339
346
352
359
365
372
379
385
23 277 280 285 290 296 302 308 314 321 327 334 340 347 354 361 367 374 381 388 395 402 409 416 24 301 305 310 315 321 327 334 340 347 354 361 368 375 382 389 396 404 411 418 426 433 440 448 25 326 330 335 341 347 354 361 368 375 382 389 397 404 411 419 427 434 442 450 457 465 473 480 \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Quantile 1 ,
;
2 3 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 4 10 11 12 13 14 14 15 16 17 18 19 20 21 21 22 23 24 25 26 27 27 28 5 15 16 17 18 20 21 22 23 24 26 27 28 29 30 32 33 34 35 37 38 39 40 42 6 22
23
24
26
27
29
31
32
34
35
37
38
40
42
43
45
46
48
50
51
53
54
56
7 29
31
33
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
8 36
38
40
42
44
46
49
51
53
55
58
60
62
65
67
70
72
74
77
79
81
84
86
89
9 45
47
49
52
55
57
60
62
65
68
71
73
76
79
82
84
87
90
93
95
98
101
104
107
55
58
60
63
66
69
72
75
78
81
84
88
91
94
97
100
103
107
110
113
116
119
122
126
10 der Wilcoxon‐Rangsummen‐Teststatistik für 3
3
3
3
4
4
4
4
4
5
5
5
5
6
6
6
6
6
,
11 66
69
72
75
79
82
85
89
92
96
99
103
106
110
113
117
121
124
128
131
135
139
142
146
13 92 95 99 103 107 111 115 119 124 128 132 136 141 145 150 154 158 163 167 171 176 180 185 189 14 106
110
114
118
122
127
131
136
141
145
150
155
160
164
169
174
179
183
188
193
198
203
207
212
121
125
130
134
139
144
149
154
159
164
169
174
179
184
190
195
200
205
210
216
221
226
231
237
15 12 79
82
85
89
92
96
100
104
107
111
115
119
123
127
131
135
139
143
147
151
155
159
163
167
,
;
16 137
142
147
151
157
162
167
173
178
183
189
195
200
206
211
217
222
228
234
239
245
251
256
262
17 155
159
164
170
175
181
187
192
198
204
210
216
222
228
234
240
246
252
258
264
270
276
282
288
18 173
178
183
189
195
201
207
213
219
226
232
238
245
251
257
264
270
277
283
290
296
303
309
316
19 192
197
203
209
215
222
228
235
242
248
255
262
268
275
282
289
296
303
309
316
323
330
337
344
20 212
218
224
230
237
244
251
258
265
272
279
286
293
300
308
315
322
329
337
344
351
359
366
373
21 234
239
246
253
260
267
274
281
289
296
304
311
319
327
334
342
350
357
365
373
381
388
396
404
,
;
22 256
262
269
276
283
291
298
306
314
322
330
338
346
354
362
370
378
386
394
403
411
419
427
435
23 279 285 293 300 308 316 324 332 340 349 357 365 374 382 391 399 408 416 425 433 442 451 459 468 24 303 310 317 325 333 342 350 359 367 376 385 394 402 411 420 429 438 447 456 465 474 483 492 501 25 328 335 343 352 360 369 378 387 396 405 414 423 432 442 451 460 470 479 488 498 507 517 526 536 \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Quantile 1 1 1 1 1 1 1 ,
;
2 3 6 7 8 8 9 9 10 11 11 12 13 13 14 15 15 16 17 17 18 19 19 20 4 10 11 12 13 14 15 16 17 18 19 20 21 22 24 25 26 27 28 29 30 31 32 33 5 15 16 17 19 20 21 23 24 26 27 28 30 31 33 34 35 37 38 40 41 43 44 45 47 6 21
23
24
26
28
29
31
33
35
37
38
40
42
44
46
47
49
51
53
55
57
58
60
62
7 28
30
32
34
36
39
41
43
45
47
49
52
54
56
58
61
63
65
67
69
72
74
76
78
8 37
39
41
44
46
49
51
54
56
59
62
64
67
69
72
75
77
80
83
85
88
90
93
96
9 46
48
51
54
57
60
63
66
69
72
75
78
81
84
87
90
93
96
99
102
105
108
111
114
56
59
62
66
69
72
75
79
82
86
89
92
96
99
103
106
110
113
117
120
123
127
130
134
10 der Wilcoxon‐Rangsummen‐Teststatistik für 3
3
3
4
4
4
4
5
5
5
6
6
6
7
7
7
8
8
8
9
9
,
11 67
71
74
78
82
85
89
93
97
100
104
108
112
116
120
123
127
131
135
139
143
147
151
155
12 13 93 97 101 106 110 115 119 124 128 133 138 142 147 152 156 161 166 171 175 180 185 189 194 199 107
112
116
121
126
131
136
141
146
151
156
161
166
171
176
182
187
192
197
202
207
212
218
223
14 80
83
87
91
95
99
104
108
112
116
120
125
129
133
138
142
146
150
155
159
163
168
172
176
,
15 123
127
132
138
143
148
153
159
164
170
175
181
186
192
197
203
208
214
220
225
231
236
242
248
;
16 139
144
150
155
161
166
172
178
184
190
196
201
207
213
219
225
231
237
243
249
255
261
267
273
17 156
162
168
173
179
186
192
198
204
210
217
223
230
236
242
249
255
262
268
274
281
287
294
300
18 175
180
187
193
199
206
212
219
226
232
239
246
253
259
266
273
280
287
294
301
307
314
321
328
19 194
200
207
213
220
227
234
241
248
255
262
270
277
284
291
299
306
313
320
328
335
342
350
357
20 210
214
221
228
235
242
249
257
264
272
279
287
294
302
310
317
325
333
340
348
356
364
371
379
387
,
21 231
236
242
250
257
265
272
280
288
296
304
312
320
328
336
344
352
361
369
377
385
393
401
410
418
;
22 253
258
265
273
281
289
297
305
313
321
330
338
347
355
364
372
381
389
398
407
415
424
432
441
450
23 276 281 289 297 305 313 322 330 339 348 357 366 374 383 392 401 410 419 428 437 446 455 465 474 483 24 300 306 313 322 330 339 348 357 366 375 385 394 403 413 422 431 441 450 460 469 479 488 498 507 517 25 325 331 339 348 357 366 375 385 394 404 414 423 433 443 453 462 472 482 492 502 512 522 532 542 552 \ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Quantile 1 ,
;
2 3 6 6 7 7 7 8 8 8 9 9 10 10 10 11 11 11 12 12 13 4 10 11 11 12 13 13 14 15 15 16 17 17 18 19 19 20 21 21 22 23 23 5 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 6 22
23
24
25
27
28
29
30
32
33
34
36
37
39
40
41
43
44
45
47
48
50
7 28
29
31
32
34
35
37
39
40
42
44
45
47
49
51
52
54
56
58
59
61
63
64
8 36
38
40
42
43
45
47
49
51
53
56
58
60
62
64
66
68
70
72
74
76
78
81
9 46
48
50
52
54
56
59
61
63
66
68
71
73
76
78
81
83
85
88
90
93
95
98
56
58
61
63
66
68
71
74
77
79
82
85
88
91
93
96
99
102
105
108
110
113
116
10 der Wilcoxon‐Rangsummen‐Teststatistik für 3
3
3
3
3
3
4
4
4
4
4
4
4
12 80
83
86
89
92
95
99
102
106
109
113
116
120
124
127
131
134
138
142
145
149
153
156
13 91 93 96 100 103 107 111 114 118 122 126 130 134 138 142 146 150 154 158 162 166 170 174 178 14 105
107
111
115
118
122
127
131
135
139
143
148
152
156
161
165
170
174
178
183
187
192
196
200
, 11 67
70
73
75
78
81
84
88
91
94
97
100
103
107
110
113
116
119
123
126
129
132
136
15 120
123
127
131
135
139
144
148
153
157
162
167
171
176
181
186
190
195
200
205
210
214
219
224
,
;
16 136
139
143
148
152
157
162
167
172
177
182
187
192
197
202
207
212
218
223
228
233
238
244
249
17 153
157
161
166
171
176
181
186
191
197
202
208
213
219
224
230
235
241
246
252
258
263
269
275
18 171
175
180
185
190
195
201
207
212
218
224
230
236
241
247
253
259
265
271
277
283
289
295
301
19 191
194
199
205
210
216
222
228
234
240
246
253
259
265
272
278
284
291
297
303
310
316
323
329
20 211
215
220
226
232
238
244
250
257
263
270
277
283
290
297
303
310
317
324
331
337
344
351
358
21 232
236
242
248
254
261
267
274
281
288
295
302
309
316
323
330
337
344
352
359
366
373
381
388
,
;
22 254
258
264
271
277
284
291
298
306
313
320
328
335
343
350
358
365
373
380
388
396
403
411
419
23 277 282 288 295 302 309 316 324 331 339 347 355 363 370 378 386 394 402 410 418 426 434 443 451 24 301 306 313 320 327 335 342 350 358 366 375 383 391 399 408 416 424 433 441 450 458 467 475 484 25 326 332 338 346 354 361 370 378 386 395 403 412 420 429 438 447 455 464 473 482 491 500 509 517 Quantile ;
der Wilcoxon‐Vorzeichen‐Rangstatistik /
;
n\ 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,005 0 1 3 5 7 9 12 15 19 23 27 32 37 0,01 0 1 3 5 7 9 12 15 19 23 27 32 37 43 0,025 0 2 3 5 8 10 13 17 21 25 29 34 40 46 52 0,05 0 2 3 5 8 10 13 17 21 25 30 35 41 47 53 60 0,1 0 2 3 5 8 10 14 17 21 26 31 36 42 48 55 62 69 ;
Tabelle zur Verteilungsfunktion der Standardnormalverteilung
Die folgende Tabelle enthält Werte der Verteilungsfunktion
1
Φ(x) = √
2π
Zx
e−
z2
2
dz
−∞
der Standardnormalverteilung für Argumente x = 0.00, 0.01, . . . , 3.49. Werte von Φ für entsprechende
negative Argumente erhält man über die Beziehung Φ(−x) = 1 − Φ(x). Zum Beispiel gilt (näherungsweise) Φ(1.96) = 0.9750 und entsprechend Φ(−1.96) = 1 − 0.9750 = 0.0250.
Zur Bestimmung eines Quantils Φ−1 (p) suche man den gegebenen Wert p der Verteilungsfunktion
Φ (bzw. einen möglichst naheliegenden) im Tabellenkörper und bestimme das zugehörige Argument x.
Zum Beispiel ist das 99%-Quantil Φ−1 (0.99) ungefähr Φ−1 (0.9901) = 2.33.
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
Quantile zp der Standardnormalverteilung N (0, 1)
Hier gilt zp = −z1−p , so ist z.B. z0.05 = −z0.95 = −1.6449.
p
zp
p
zp
p
zp
p
zp
0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.0000
0.0251
0.0502
0.0753
0.1004
0.1257
0.1510
0.1764
0.2019
0.2275
0.780
0.785
0.790
0.795
0.800
0.805
0.810
0.815
0.820
0.825
0.7722
0.7892
0.8064
0.8239
0.8416
0.8596
0.8779
0.8965
0.9154
0.9346
0.9760
0.9765
0.9770
0.9775
0.9780
0.9785
0.9790
0.9795
0.9800
0.9805
1.9774
1.9863
1.9954
2.0047
2.0141
2.0237
2.0335
2.0435
2.0537
2.0642
0.9960
0.9961
0.9962
0.9963
0.9964
0.9965
0.9966
0.9967
0.9968
0.9969
2.6521
2.6606
2.6693
2.6783
2.6874
2.6968
2.7065
2.7164
2.7266
2.7370
0.60
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.2533
0.2793
0.3055
0.3319
0.3585
0.3853
0.4125
0.4399
0.4677
0.4959
0.830
0.835
0.840
0.845
0.850
0.855
0.860
0.865
0.870
0.875
0.9542
0.9741
0.9945
1.0152
1.0364
1.0581
1.0803
1.1031
1.1264
1.1503
0.9810
0.9815
0.9820
0.9825
0.9830
0.9835
0.9840
0.9845
0.9850
0.9855
2.0749
2.0858
2.0969
2.1084
2.1201
2.1321
2.1444
2.1571
2.1701
2.1835
0.9970
0.9971
0.9972
0.9973
0.9974
0.9975
0.9976
0.9977
0.9978
0.9979
2.7478
2.7589
2.7703
2.7822
2.7944
2.8070
2.8202
2.8338
2.8480
2.8627
0.70
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.5244
0.5534
0.5828
0.6128
0.6433
0.6745
0.7063
0.7388
0.880
0.885
0.890
0.895
0.900
0.905
0.910
0.915
0.920
0.925
1.1750
1.2004
1.2265
1.2536
1.2816
1.3106
1.3408
1.3722
1.4051
1.4395
0.9860
0.9865
0.9870
0.9875
0.9880
0.9885
0.9890
0.9895
0.9900
0.9905
2.1973
2.2115
2.2262
2.2414
2.2571
2.2734
2.2904
2.3080
2.3263
2.3455
0.9980
0.9981
0.9982
0.9983
0.9984
0.9985
0.9986
0.9987
0.9988
0.9989
2.8782
2.8943
2.9112
2.9290
2.9478
2.9677
2.9889
3.0115
3.0357
3.0618
0.930
0.935
0.940
0.945
0.950
0.955
0.960
0.965
0.970
0.975
1.4758
1.5141
1.5548
1.5982
1.6449
1.6954
1.7507
1.8119
1.8808
1.9600
0.9910
0.9915
0.9920
0.9925
0.9930
0.9935
0.9940
0.9945
0.9950
0.9955
2.3656
2.3867
2.4089
2.4324
2.4573
2.4838
2.5121
2.5427
2.5758
2.6121
0.9990
0.9991
0.9992
0.9993
0.9994
0.9995
0.9996
0.9997
0.9998
0.9999
3.0902
3.1214
3.1559
3.1947
3.2389
3.2905
3.3528
3.4316
3.5401
3.7190
Quantile tm,p der Studentschen t-Verteilung
Hier gilt tm,p = −tm,1−p , so ist z.B. t10,0.05 = −t10,0.95 = −1.81.
m
p = 0.90
0.95
0.975
0.990
0.995
0.999
0.9995
1
2
3
4
5
3.08
1.89
1.64
1.53
1.48
6.31
2.92
2.35
2.13
2.02
12.71
4.30
3.18
2.78
2.57
31.82
6.96
4.54
3.75
3.36
63.66
9.92
5.84
4.60
4.03
318.31
22.33
10.21
7.17
5.89
636.62
31.60
12.92
8.61
6.87
6
7
8
9
10
1.44
1.41
1.40
1.38
1.37
1.94
1.89
1.86
1.83
1.81
2.45
2.36
2.31
2.26
2.23
3.14
3.00
2.90
2.82
2.76
3.71
3.50
3.36
3.25
3.17
5.21
4.79
4.50
4.30
4.14
5.96
5.41
5.04
4.78
4.59
11
12
13
14
15
1.36
1.36
1.35
1.35
1.34
1.80
1.78
1.77
1.76
1.75
2.20
2.18
2.16
2.14
2.13
2.72
2.68
2.65
2.62
2.60
3.11
3.05
3.01
2.98
2.95
4.02
3.93
3.85
3.79
3.73
4.44
4.32
4.22
4.14
4.07
16
17
18
19
20
1.34
1.33
1.33
1.33
1.33
1.75
1.74
1.73
1.73
1.72
2.12
2.11
2.10
2.09
2.09
2.58
2.57
2.55
2.54
2.53
2.92
2.90
2.88
2.86
2.85
3.69
3.65
3.61
3.58
3.55
4.01
3.97
3.92
3.88
3.85
21
22
23
24
25
1.32
1.32
1.32
1.32
1.32
1.72
1.72
1.71
1.71
1.71
2.08
2.07
2.07
2.06
2.06
2.52
2.51
2.50
2.49
2.49
2.83
2.82
2.81
2.80
2.79
3.53
3.50
3.48
3.47
3.45
3.82
3.79
3.77
3.75
3.73
26
27
28
29
30
1.31
1.31
1.31
1.31
1.31
1.71
1.70
1.70
1.70
1.70
2.06
2.05
2.05
2.05
2.04
2.48
2.47
2.47
2.46
2.46
2.78
2.77
2.76
2.76
2.75
3.43
3.42
3.41
3.40
3.39
3.71
3.69
3.67
3.66
3.65
40
50
60
70
80
1.30
1.30
1.30
1.29
1.29
1.68
1.68
1.67
1.67
1.66
2.02
2.01
2.00
1.99
1.99
2.42
2.40
2.39
2.38
2.37
2.70
2.68
2.66
2.65
2.64
3.31
3.26
3.23
3.21
3.20
3.55
3.50
3.46
3.44
3.42
90
100
120
∞
1.29
1.29
1.29
1.28
1.66
1.66
1.66
1.64
1.99
1.98
1.98
1.96
2.37
2.36
2.36
2.33
2.63
2.63
2.62
2.58
3.18
3.17
3.16
3.09
3.40
3.39
3.37
3.29
Quantile χ2m,p der χ2 -Verteilung
m
p = 0.005
0.01
0.025
0.1
0.9
0.95
0.975
0.99
0.995
1
2
3
4
5
6
7
8
9
10
0.00004
0.0100
0.0717
0.207
0.412
0.676
0.989
1.34
1.73
2.16
0.0039 0.0158
0.103
0.21
0.352
0.58
0.711
1.06
1.15
1.61
1.64
2.20
2.17
2.83
2.73
3.49
3.33
4.17
3.94
4.87
2.71
4.61
6.25
7.78
9.24
10.64
12.02
13.36
14.68
15.99
3.84
5.99
7.81
9.49
11.07
12.59
14.07
15.51
16.92
18.31
5.02
7.38
9.35
11.14
12.83
14.45
16.01
17.53
19.02
20.48
6.63
9.21
11.34
13.28
15.09
16.81
18.48
20.09
21.67
23.21
7.88
10.60
12.84
14.86
16.75
18.55
20.28
21.95
23.59
25.19
11
12
13
14
15
16
17
18
19
20
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.12
10.85
5.58
6.30
7.04
7.79
8.55
9.31
10.09
10.86
11.65
12.44
17.28
18.55
19.81
21.06
22.31
23.54
24.77
25.99
27.20
28.41
19.68
21.03
22.36
23.68
25.00
26.30
27.59
28.87
30.14
31.41
21.92
23.34
24.74
26.12
27.49
28.85
30.19
31.53
32.85
34.17
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.81
36.19
37.57
26.76
28.30
29.82
31.32
32.80
34.27
35.72
37.16
38.58
40.00
21
22
23
24
25
26
27
28
29
30
8.03
8.64
9.26
9.89
10.52
11.16
11.81
12.46
13.12
13.79
8.90
9.54
10.20
10.86
11.52
12.20
12.88
13.56
14.26
14.95
10.28
10.98
11.69
12.40
13.12
13.84
14.57
15.31
16.05
16.79
11.59
12.34
13.09
13.85
14.61
15.38
16.15
16.93
17.71
18.49
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
29.62
30.81
32.01
33.20
34.38
35.56
36.74
37.92
39.09
40.26
32.67
33.92
35.17
36.42
37.65
38.89
40.11
41.34
42.56
43.77
35.48
36.78
38.08
39.36
40.65
41.92
43.19
44.46
45.72
46.98
38.93
40.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
41.40
42.80
44.18
45.56
46.93
48.29
49.64
50.99
52.34
53.67
40
50
60
70
80
90
100
20.71
27.99
35.53
43.28
51.17
59.20
67.33
22.16
29.71
37.48
45.44
53.54
61.75
70.06
24.43
32.36
40.48
48.76
57.15
65.65
74.22
26.51
34.76
43.19
51.74
60.39
69.13
77.93
29.05
37.69
46.46
55.33
64.28
73.29
82.36
51.81 55.76
63.17 67.50
74.40 79.08
85.53 90.53
96.58 101.88
107.57 113.15
118.50 124.34
59.34 63.69
71.42 76.15
83.30 88.38
95.02 100.43
106.63 112.33
118.14 124.12
129.56 135.81
66.77
79.49
91.95
104.21
116.32
128.30
140.17
150
200
250
300
400
109.14
152.24
196.16
240.66
330.90
112.67
156.43
200.94
245.97
337.16
117.98
162.73
208.10
253.91
346.48
122.69
168.28
214.39
260.88
354.64
128.28
174.84
221.81
269.07
364.21
172.58
226.02
279.05
331.79
436.65
185.80
241.06
295.69
349.87
457.31
198.36
255.26
311.35
366.84
476.61
0.00016 0.00098
0.020
0.051
0.115
0.216
0.297
0.484
0.554
0.831
0.872
1.24
1.24
1.69
1.65
2.18
2.09
2.70
2.56
3.25
0.05
179.58
233.99
287.88
341.40
447.63
193.21
249.45
304.94
359.91
468.72
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.95 (Teil 1)
Hier gilt Fm1 ,m2 ,p =
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,2,0.05 =
5
6
1
F2,10,0.95
7
=
1
= 0.244.
4.10
m1 = 1
2
3
4
8
m2 = 1
2
3
4
5
6
7
8
9
10
161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
11
12
13
14
15
16
17
18
19
20
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.90
2.80
2.71
2.65
2.59
2.54
2.49
2.46
2.42
2.39
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
21
22
23
24
25
26
27
28
29
30
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.21
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
40
50
60
70
80
90
100
200
1000
∞
4.08
4.03
4.00
3.98
3.96
3.95
3.94
3.89
3.85
3.84
3.23
3.18
3.15
3.13
3.11
3.10
3.09
3.04
3.00
3.00
2.84
2.79
2.76
2.74
2.72
2.71
2.70
2.65
2.61
2.60
2.61
2.56
2.53
2.50
2.49
2.47
2.46
2.42
2.38
2.37
2.45
2.40
2.37
2.35
2.33
2.32
2.31
2.26
2.22
2.21
2.34
2.29
2.25
2.23
2.21
2.20
2.19
2.14
2.11
2.10
2.25
2.20
2.17
2.14
2.13
2.11
2.10
2.06
2.02
2.01
2.18
2.13
2.10
2.07
2.06
2.04
2.03
1.98
1.95
1.94
2.12
2.07
2.04
2.02
2.00
1.99
1.97
1.93
1.89
1.88
2.08
2.03
1.99
1.97
1.95
1.94
1.93
1.88
1.84
1.83
230.2 234.0 236.8 238.9
19.30 19.33 19.35 19.37
9.01 8.94 8.89 8.85
6.26 6.16 6.09 6.04
5.05 4.95 4.88 4.82
4.39 4.28 4.21 4.15
3.97 3.87 3.79 3.73
3.69 3.58 3.50 3.44
3.48 3.37 3.29 3.23
3.33 3.22 3.14 3.07
9
10
240.5 241.9
19.38 19.40
8.81 8.79
6.00 5.96
4.77 4.74
4.10 4.06
3.68 3.64
3.39 3.35
3.18 3.14
3.02 2.98
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.95 (Teil 2)
Hier gilt Fm1 ,m2 ,p =
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,12,0.05 =
20
30
1
F12,10,0.95
1
= 0.34.
2.91
75
14
16
18
m2 = 1
2
3
4
5
6
7
8
9
10
244
19.41
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
245
19.42
8.71
5.87
4.64
3.96
3.53
3.24
3.03
2.86
246
19.43
8.69
5.84
4.60
3.92
3.49
3.20
2.99
2.83
247
19.44
8.67
5.82
4.58
3.90
3.47
3.17
2.96
2.80
11
12
13
14
15
16
17
18
19
20
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.74
2.64
2.55
2.48
2.42
2.37
2.33
2.29
2.26
2.22
2.70
2.60
2.51
2.44
2.38
2.33
2.29
2.25
2.21
2.18
2.67
2.57
2.48
2.41
2.35
2.30
2.26
2.22
2.18
2.15
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.51
2.40
2.31
2.24
2.18
2.12
2.08
2.04
2.00
1.97
2.47
2.37
2.28
2.21
2.14
2.09
2.04
2.00
1.96
1.93
2.46
2.35
2.26
2.19
2.12
2.07
2.02
1.98
1.94
1.91
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
21
22
23
24
25
26
27
28
29
30
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.20
2.17
2.15
2.13
2.11
2.09
2.08
2.06
2.05
2.04
2.16
2.13
2.11
2.09
2.07
2.05
2.04
2.02
2.01
1.99
2.12
2.10
2.08
2.05
2.04
2.02
2.00
1.99
1.97
1.96
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.94
1.91
1.88
1.86
1.84
1.82
1.81
1.79
1.77
1.76
1.90
1.87
1.84
1.82
1.80
1.78
1.76
1.75
1.73
1.72
1.88
1.85
1.82
1.80
1.78
1.76
1.74
1.73
1.71
1.70
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
40
50
60
70
80
90
100
200
1000
∞
2.00
1.95
1.92
1.89
1.88
1.86
1.85
1.80
1.76
1.75
1.95
1.89
1.86
1.84
1.82
1.80
1.79
1.74
1.70
1.69
1.90
1.85
1.82
1.79
1.77
1.76
1.75
1.69
1.65
1.64
1.87
1.81
1.78
1.75
1.73
1.72
1.71
1.66
1.61
1.60
1.84
1.78
1.75
1.72
1.70
1.69
1.68
1.62
1.58
1.57
1.74
1.69
1.65
1.62
1.60
1.59
1.57
1.52
1.47
1.46
1.66
1.60
1.56
1.53
1.51
1.49
1.48
1.41
1.36
1.35
1.61
1.55
1.51
1.48
1.45
1.44
1.42
1.35
1.30
1.28
1.59
1.52
1.48
1.45
1.43
1.41
1.39
1.32
1.26
1.24
1.51
1.44
1.39
1.35
1.32
1.30
1.28
1.19
1.08
1.00
252
253
19.48 19.48
8.58 8.56
5.70 5.68
4.44 4.42
3.75 3.73
3.32 3.29
3.02 2.99
2.80 2.77
2.64 2.60
100
∞
m1 = 12
248
250
19.45 19.46
8.66 8.62
5.80 5.75
4.56 4.50
3.87 3.81
3.44 3.38
3.15 3.08
2.94 2.86
2.77 2.70
50
=
253
254
19.49 19.50
8.55 8.53
5.66 5.63
4.41 4.36
3.71 3.67
3.27 3.23
2.97 2.93
2.76 2.71
2.59 2.54
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.975 (Teil 1)
Hier gilt Fm1 ,m2 ,p =
m1 = 1
m2 = 1
2
3
4
5
6
7
8
9
10
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,2,0.025 =
2
3
4
648
799
38.51 39.00
17.44 16.04
12.22 10.65
10.01 8.43
8.81 7.26
8.07 6.54
7.57 6.06
7.21 5.71
6.94 5.46
864
39.17
15.44
9.98
7.76
6.60
5.89
5.42
5.08
4.83
900
39.25
15.10
9.60
7.39
6.23
5.52
5.05
4.72
4.47
5
6
1
F2,10,0.975
7
=
1
= 0.183.
5.46
8
9
10
922
937
948
957
963
969
39.30 39.33 39.36 39.37 39.39 39.40
14.88 14.73 14.62 14.54 14.47 14.42
9.36 9.20 9.07 8.98 8.90 8.84
7.15 6.98 6.85 6.76 6.68 6.62
5.99 5.82 5.70 5.60 5.52 5.46
5.29 5.12 4.99 4.90 4.82 4.76
4.82 4.65 4.53 4.43 4.36 4.30
4.48 4.32 4.20 4.10 4.03 3.96
4.24 4.07 3.95 3.85 3.78 3.72
11
12
13
14
15
16
17
18
19
20
6.72
6.55
6.41
6.30
6.20
6.12
6.04
5.98
5.92
5.87
5.26
5.10
4.97
4.86
4.77
4.69
4.62
4.56
4.51
4.46
4.63
4.47
4.35
4.24
4.15
4.08
4.01
3.95
3.90
3.86
4.28
4.12
4.00
3.89
3.80
3.73
3.66
3.61
3.56
3.51
4.04
3.89
3.77
3.66
3.58
3.50
3.44
3.38
3.33
3.29
3.88
3.73
3.60
3.50
3.41
3.34
3.28
3.22
3.17
3.13
3.76
3.61
3.48
3.38
3.29
3.22
3.16
3.10
3.05
3.01
3.66
3.51
3.39
3.29
3.20
3.12
3.06
3.01
2.96
2.91
3.59
3.44
3.31
3.21
3.12
3.05
2.98
2.93
2.88
2.84
3.53
3.37
3.25
3.15
3.06
2.99
2.92
2.87
2.82
2.77
21
22
23
24
25
26
27
28
29
30
5.83
5.79
5.75
5.72
5.69
5.66
5.63
5.61
5.59
5.57
4.42
4.38
4.35
4.32
4.29
4.27
4.24
4.22
4.20
4.18
3.82
3.78
3.75
3.72
3.69
3.67
3.65
3.63
3.61
3.59
3.48
3.44
3.41
3.38
3.35
3.33
3.31
3.29
3.27
3.25
3.25
3.22
3.18
3.15
3.13
3.10
3.08
3.06
3.04
3.03
3.09
3.05
3.02
2.99
2.97
2.94
2.92
2.90
2.88
2.87
2.97
2.93
2.90
2.87
2.85
2.82
2.80
2.78
2.76
2.75
2.87
2.84
2.81
2.78
2.75
2.73
2.71
2.69
2.67
2.65
2.80
2.76
2.73
2.70
2.68
2.65
2.63
2.61
2.59
2.57
2.73
2.70
2.67
2.64
2.61
2.59
2.57
2.55
2.53
2.51
40
50
60
70
80
90
100
200
1000
∞
5.42
5.34
5.29
5.25
5.22
5.20
5.18
5.10
5.04
5.02
4.05
3.97
3.93
3.89
3.86
3.84
3.83
3.76
3.70
3.69
3.46
3.39
3.34
3.31
3.28
3.26
3.25
3.18
3.13
3.12
3.13
3.05
3.01
2.97
2.95
2.93
2.92
2.85
2.80
2.79
2.90
2.83
2.79
2.75
2.73
2.71
2.70
2.63
2.58
2.57
2.74
2.67
2.63
2.59
2.57
2.55
2.54
2.47
2.42
2.41
2.62
2.55
2.51
2.47
2.45
2.43
2.42
2.35
2.30
2.29
2.53
2.46
2.41
2.38
2.35
2.34
2.32
2.26
2.20
2.19
2.45
2.38
2.33
2.30
2.28
2.26
2.24
2.18
2.13
2.11
2.39
2.32
2.27
2.24
2.21
2.19
2.18
2.11
2.06
2.05
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.975 (Teil 2)
Hier gilt Fm1 ,m2 ,p =
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,12,0.025 =
20
30
1
F12,10,0.975
50
=
1
= 0.276.
3.62
75
100
∞
m1 = 12
14
16
18
m2 = 1
2
3
4
5
6
7
8
9
10
977
39.41
14.34
8.75
6.52
5.37
4.67
4.20
3.87
3.62
983
39.43
14.28
8.68
6.46
5.30
4.60
4.13
3.80
3.55
987
39.44
14.23
8.63
6.40
5.24
4.54
4.08
3.74
3.50
990
39.44
14.20
8.59
6.36
5.20
4.50
4.03
3.70
3.45
11
12
13
14
15
16
17
18
19
20
3.43
3.28
3.15
3.05
2.96
2.89
2.82
2.77
2.72
2.68
3.36
3.21
3.08
2.98
2.89
2.82
2.75
2.70
2.65
2.60
3.30
3.15
3.03
2.92
2.84
2.76
2.70
2.64
2.59
2.55
3.26
3.11
2.98
2.88
2.79
2.72
2.65
2.60
2.55
2.50
3.23
3.07
2.95
2.84
2.76
2.68
2.62
2.56
2.51
2.46
3.12
2.96
2.84
2.73
2.64
2.57
2.50
2.44
2.39
2.35
3.03
2.87
2.74
2.64
2.55
2.47
2.41
2.35
2.30
2.25
2.98
2.82
2.70
2.59
2.50
2.42
2.35
2.30
2.24
2.20
2.96
2.80
2.67
2.56
2.47
2.40
2.33
2.27
2.22
2.17
2.88
2.72
2.60
2.49
2.40
2.32
2.25
2.19
2.13
2.09
21
22
23
24
25
26
27
28
29
30
2.64
2.60
2.57
2.54
2.51
2.49
2.47
2.45
2.43
2.41
2.56
2.53
2.50
2.47
2.44
2.42
2.39
2.37
2.36
2.34
2.51
2.47
2.44
2.41
2.38
2.36
2.34
2.32
2.30
2.28
2.46
2.43
2.39
2.36
2.34
2.31
2.29
2.27
2.25
2.23
2.42
2.39
2.36
2.33
2.30
2.28
2.25
2.23
2.21
2.20
2.31
2.27
2.24
2.21
2.18
2.16
2.13
2.11
2.09
2.07
2.21
2.17
2.14
2.11
2.08
2.05
2.03
2.01
1.99
1.97
2.16
2.12
2.08
2.05
2.02
2.00
1.97
1.95
1.93
1.91
2.13
2.09
2.06
2.02
2.00
1.97
1.94
1.92
1.90
1.88
2.04
2.00
1.97
1.94
1.91
1.88
1.85
1.83
1.81
1.79
40
50
60
70
80
90
100
200
1000
∞
2.29
2.22
2.17
2.14
2.11
2.09
2.08
2.01
1.96
1.94
2.21
2.14
2.09
2.06
2.03
2.02
2.00
1.93
1.88
1.87
2.15
2.08
2.03
2.00
1.97
1.95
1.94
1.87
1.82
1.80
2.11
2.03
1.98
1.95
1.92
1.91
1.89
1.82
1.77
1.75
2.07
1.99
1.94
1.91
1.88
1.86
1.85
1.78
1.72
1.71
1.94
1.87
1.82
1.78
1.75
1.73
1.71
1.64
1.58
1.57
1.83
1.75
1.70
1.66
1.63
1.61
1.59
1.51
1.45
1.43
1.77
1.69
1.63
1.59
1.56
1.54
1.52
1.44
1.36
1.34
1.74
1.66
1.60
1.56
1.53
1.50
1.48
1.39
1.32
1.30
1.64
1.55
1.48
1.44
1.40
1.37
1.35
1.23
1.09
1.00
993 1001 1008 1011 1013 1018
39.45 39.46 39.48 39.48 39.49 39.50
14.17 14.08 14.01 13.97 13.96 13.90
8.56 8.46 8.38 8.34 8.32 8.26
6.33 6.23 6.14 6.10 6.08 6.02
5.17 5.07 4.98 4.94 4.92 4.85
4.47 4.36 4.28 4.23 4.21 4.14
4.00 3.89 3.81 3.76 3.74 3.67
3.67 3.56 3.47 3.43 3.40 3.33
3.42 3.31 3.22 3.18 3.15 3.08
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.99 (Teil 1)
Hier gilt Fm1 ,m2 ,p =
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,2,0.01 =
1
F2,10,0.99
=
1
= 0.132.
7.56
m1 = 1
2
3
4
5
6
7
8
9
10
m2 = 1
2
3
4
5
6
7
8
9
10
4052
98.50
34.12
21.20
16.26
13.75
12.25
11.26
10.56
10.04
4999
99.00
30.82
18.00
13.27
10.92
9.55
8.65
8.02
7.56
5403
99.17
29.46
16.69
12.06
9.78
8.45
7.59
6.99
6.55
5625
99.25
28.71
15.98
11.39
9.15
7.85
7.01
6.42
5.99
5764
99.30
28.24
15.52
10.97
8.75
7.46
6.63
6.06
5.64
5859
99.33
27.91
15.21
10.67
8.47
7.19
6.37
5.80
5.39
5928
99.36
27.67
14.98
10.46
8.26
6.99
6.18
5.61
5.20
5981
99.37
27.49
14.80
10.29
8.10
6.84
6.03
5.47
5.06
6022
99.39
27.35
14.66
10.16
7.98
6.72
5.91
5.35
4.94
6056
99.40
27.23
14.55
10.05
7.87
6.62
5.81
5.26
4.85
11
12
13
14
15
16
17
18
19
20
9.65
9.33
9.07
8.86
8.68
8.53
8.40
8.29
8.18
8.10
7.21
6.93
6.70
6.51
6.36
6.23
6.11
6.01
5.93
5.85
6.22
5.95
5.74
5.56
5.42
5.29
5.18
5.09
5.01
4.94
5.67
5.41
5.21
5.04
4.89
4.77
4.67
4.58
4.50
4.43
5.32
5.06
4.86
4.69
4.56
4.44
4.34
4.25
4.17
4.10
5.07
4.82
4.62
4.46
4.32
4.20
4.10
4.01
3.94
3.87
4.89
4.64
4.44
4.28
4.14
4.03
3.93
3.84
3.77
3.70
4.74
4.50
4.30
4.14
4.00
3.89
3.79
3.71
3.63
3.56
4.63
4.39
4.19
4.03
3.89
3.78
3.68
3.60
3.52
3.46
4.54
4.30
4.10
3.94
3.80
3.69
3.59
3.51
3.43
3.37
21
22
23
24
25
26
27
28
29
30
8.02
7.95
7.88
7.82
7.77
7.72
7.68
7.64
7.60
7.56
5.78
5.72
5.66
5.61
5.57
5.53
5.49
5.45
5.42
5.39
4.87
4.82
4.76
4.72
4.68
4.64
4.60
4.57
4.54
4.51
4.37
4.31
4.26
4.22
4.18
4.14
4.11
4.07
4.04
4.02
4.04
3.99
3.94
3.90
3.85
3.82
3.78
3.75
3.73
3.70
3.81
3.76
3.71
3.67
3.63
3.59
3.56
3.53
3.50
3.47
3.64
3.59
3.54
3.50
3.46
3.42
3.39
3.36
3.33
3.30
3.51
3.45
3.41
3.36
3.32
3.29
3.26
3.23
3.20
3.17
3.40
3.35
3.30
3.26
3.22
3.18
3.15
3.12
3.09
3.07
3.31
3.26
3.21
3.17
3.13
3.09
3.06
3.03
3.00
2.98
40
50
60
70
80
90
100
200
1000
∞
7.31
7.17
7.08
7.01
6.96
6.93
6.90
6.76
6.66
6.63
5.18
5.06
4.98
4.92
4.88
4.85
4.82
4.71
4.63
4.61
4.31
4.20
4.13
4.07
4.04
4.01
3.98
3.88
3.80
3.78
3.83
3.72
3.65
3.60
3.56
3.53
3.51
3.41
3.34
3.32
3.51
3.41
3.34
3.29
3.26
3.23
3.21
3.11
3.04
3.02
3.29
3.19
3.12
3.07
3.04
3.01
2.99
2.89
2.82
2.80
3.12
3.02
2.95
2.91
2.87
2.84
2.82
2.73
2.66
2.64
2.99
2.89
2.82
2.78
2.74
2.72
2.69
2.60
2.53
2.51
2.89
2.78
2.72
2.67
2.64
2.61
2.59
2.50
2.43
2.41
2.80
2.70
2.63
2.59
2.55
2.52
2.50
2.41
2.34
2.32
Quantile Fm1 ,m2 ,p der F -Verteilung mit p = 0.99 (Teil 2)
Hier gilt Fm1 ,m2 ,p =
1
Fm2 ,m1 ,1−p
, so ist z.B. F10,12,0.01 =
20
30
1
F12,10,0.99
1
= 0.212.
4.71
75
14
16
18
m2 = 1
2
3
4
5
6
7
8
9
10
6106
99.42
27.05
14.37
9.89
7.72
6.47
5.67
5.11
4.71
6143
99.43
26.92
14.25
9.77
7.60
6.36
5.56
5.01
4.60
6170
99.44
26.83
14.15
9.68
7.52
6.28
5.48
4.92
4.52
6192
99.44
26.75
14.08
9.61
7.45
6.21
5.41
4.86
4.46
11
12
13
14
15
16
17
18
19
20
4.40
4.16
3.96
3.80
3.67
3.55
3.46
3.37
3.30
3.23
4.29
4.05
3.86
3.70
3.56
3.45
3.35
3.27
3.19
3.13
4.21
3.97
3.78
3.62
3.49
3.37
3.27
3.19
3.12
3.05
4.15
3.91
3.72
3.56
3.42
3.31
3.21
3.13
3.05
2.99
4.10
3.86
3.66
3.51
3.37
3.26
3.16
3.08
3.00
2.94
3.94
3.70
3.51
3.35
3.21
3.10
3.00
2.92
2.84
2.78
3.81
3.57
3.38
3.22
3.08
2.97
2.87
2.78
2.71
2.64
3.74
3.50
3.31
3.15
3.01
2.90
2.80
2.71
2.64
2.57
3.71
3.47
3.27
3.11
2.98
2.86
2.76
2.68
2.60
2.54
3.60
3.36
3.17
3.00
2.87
2.75
2.65
2.57
2.49
2.42
21
22
23
24
25
26
27
28
29
30
3.17
3.12
3.07
3.03
2.99
2.96
2.93
2.90
2.87
2.84
3.07
3.02
2.97
2.93
2.89
2.86
2.82
2.79
2.77
2.74
2.99
2.94
2.89
2.85
2.81
2.78
2.75
2.72
2.69
2.66
2.93
2.88
2.83
2.79
2.75
2.72
2.68
2.65
2.63
2.60
2.88
2.83
2.78
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.72
2.67
2.62
2.58
2.54
2.50
2.47
2.44
2.41
2.39
2.58
2.53
2.48
2.44
2.40
2.36
2.33
2.30
2.27
2.25
2.51
2.46
2.41
2.37
2.33
2.29
2.26
2.23
2.20
2.17
2.48
2.42
2.37
2.33
2.29
2.25
2.22
2.19
2.16
2.13
2.36
2.31
2.26
2.21
2.17
2.13
2.10
2.06
2.03
2.01
40
50
60
70
80
90
100
200
1000
∞
2.66
2.56
2.50
2.45
2.42
2.39
2.37
2.27
2.20
2.18
2.56
2.46
2.39
2.35
2.31
2.29
2.27
2.17
2.10
2.08
2.48
2.38
2.31
2.27
2.23
2.21
2.19
2.09
2.02
2.00
2.42
2.32
2.25
2.20
2.17
2.14
2.12
2.03
1.95
1.93
2.37
2.27
2.20
2.15
2.12
2.09
2.07
1.97
1.90
1.88
2.20
2.10
2.03
1.98
1.94
1.92
1.89
1.79
1.72
1.70
2.06
1.95
1.88
1.83
1.79
1.76
1.74
1.63
1.54
1.52
1.98
1.87
1.79
1.74
1.70
1.67
1.65
1.53
1.44
1.42
1.94
1.82
1.75
1.70
1.65
1.62
1.60
1.48
1.38
1.36
1.80
1.68
1.60
1.54
1.49
1.46
1.43
1.28
1.11
1.00
6303 6324
99.48 99.49
26.35 26.28
13.69 13.61
9.24 9.17
7.09 7.02
5.86 5.79
5.07 5.00
4.52 4.45
4.12 4.05
100
∞
m1 = 12
6209 6261
99.45 99.47
26.69 26.50
14.02 13.84
9.55 9.38
7.40 7.23
6.16 5.99
5.36 5.20
4.81 4.65
4.41 4.25
50
=
6334 6366
99.49 99.50
26.24 26.13
13.58 13.46
9.13 9.02
6.99 6.88
5.75 5.65
4.96 4.86
4.41 4.31
4.01 3.91