1. Serie - EAH-Jena

Mathematik III f u
• r MT
WS 2015/2016
[email protected]
1. Übungsserie: Anpassung von Verteilungen
1. Bei 20 Streichholzschachteln wird jeweils die Anzahl der darin enthaltenen Streichhölzer ermittelt mit
folgendem Ergebnis
37 40 41 42 40 38 41 43 41 40 35 40 38 37 38 40 38 37 38 38 .
Berechnungen ohne Computer
a) Bestimmen Sie die absoluten und relativen Häu…gkeiten der Merkmalsausprägungen und zeichnen
Sie ein Balkendiagramm.
b) Berechnen und zeichnen Sie ein Histogramm mit 4 bzw. 5 Klassen (Unterschied zu Balkendiagramm?).
c) Bestimmen Sie die empirische Verteilungsfunktion und vergleichen Sie sie mit der MATLAB-Gra…k.
d) Berechnen Sie Mittelwert, Standardabweichung und den Variationskoe¢ zienten (TR oder Computer).
e) Berechnen Sie zu Fußden Median, die Quartile, den Quartilsabstand sowie das 10%- und 90%Quantil und zeichnen Sie ein Boxplot. Liegen ausreiß
erverdächtige Werte vor?
Anleitung MATLAB
Die unten angegebenen MATLAB-Kommandos sind nur ein Vorschlag. Schauen Sie sich zur Erklärung der Parameter in den Kommandos die Hilfe dazu an. Schreiben Sie (zumindest am Ende der
Bearbeitung der Aufgabe) alle Kommandos in ein M-File.
a) Daten als Spaltenvektor mit Bezeichnung a1_1 eingeben
Absolute und relative Häu…gkeiten, Balkendiagramm:
vals = unique(a1_1) erzeugt einen Vektor mit den verschiedenen Merkmalsausprägungen, Häu…gkeitsauszählung der Merkmalsausprägungen mit [anz, bins ]= hist(a1_1,vals)
Balkendiagramm mit bar(bins,anz)
b) Histogramm mit 4 bzw. 5 Klassen: hist(a1_1,4) oder hist(a1_1,5)
c) empirische VF: ecdf(a1_1)
d) m = mean(a1_1), s = std(a1_1), v=s/m
e) med = median(a1_1) bzw. p = prctile(a1_1,[10 25 75 90]) oder quantile(a1_1,[0.10 0.25 0.75
0.90])
Quartilsabstand d = p(3) - p(2) bzw. d = iqr(a1_1)
boxplot(a1_1)
2. Ein Spaltungsversuch soll als Resultat 3 Phänotypen im erwarteten Verhältnis 1:2:1 erzeugen. In einem
Vorversuch erhält man die 3 Phänotypen mit den Häu…gkeiten von 20, 65, 15. Spricht das bei Risiko
5% gegen das erwartete Ergebnis? Rechnen Sie ohne Computer einen Chi-Quadrat-Anpassungstest.
Anleitung MATLAB
Datenvektor: a1_2=[ones(1,20) 2*ones(1,65) 3*ones(1,15)]’
Test: [h,p]=chi2gof (a1_2,’Expected’,[25,50,25])
oder Testgröß
e programmieren
H0 : Verteilung E = [25; 50; 25] liegt vor
Vektor der beobachteten Häu…gkeiten: O = [20; 65; 15]
Summanden: chi_s = (O E):^2:=E
Testgröß
e: T = sum(chi_s)
Testentscheidung durch Vergleich der Testgröß
e mit Schwellwert crit = chi2inv(0:95; 2) da Verteilung
1
mit 3 Kategorien
oder Berechnung des p-Werts pval = 1
gleich mit 0:05
chi2cdf (T; 2) (Überschreitungswahrscheinlichkeit) und Ver-
3. In der Verkehrsdirektion von A-Stadt werden über ein Jahr die Verkehrsunfälle nach Wochentagen
erfasst, man erhält aufsummiert über alle beobachteten Wochen folgende Verteilung
Mo Di Mi Do Fr Sa So
77
46 46 50 62 58 31
Testen Sie mit MATLAB, ob es eine signi…kante Abhängigkeit der Anzahl der Unfälle vom Wochentag
gibt (d.h. nicht alle Wochentage mit gleicher Wahrscheinlichkeit auftreten), Risiko 0.05.
Anleitung MATLAB
analog Aufgabe 2
4. In folgender Stichprobe wird die Porengröß
e von 30 Labor…ltern erfasst
3.0 3.0 3.1 3.1 3.2 3.2 3.3 3.3 3.3 3.4 3.4 3.4 3.6
3.7 3.7 3.7 3.8 3.8 3.8 3.8 3.8 3.8 3.9 3.9 4.0 4.0
3.6
4.0
3.7
4.0
a) Stellen Sie die Daten in einem Histogramm mit überlagerter Normalverteilungsdichte dar.
b) Berechnen Sie mit MATLAB Mittelwert und Standardabweichung.
c) Testen Sie zu Fußund mit MATLAB mittels Chi-Quadrat-Anpassungstest, ob Normalverteilung
vorliegt, verwenden Sie 5 Klassen (Risiko 0.05).
d) Testen Sie mit dem KS-Test mit Korrektur nach Lilliefors (MATLAB), ob Normalverteilung vorliegt.
Hinweis zu c)
Berechnung der erwarteten Häu…gkeiten Ei unter Normalverteilung
Pn
1
1 Pn
2
2
durch s2 =
Parameterschätzung der Normalverteilung: durch x =
i=1 xi
i=1 xi ,
n
n 1
b
a
Berechnung der Klassenwahrscheinlichkeiten: P (a < X < b) =
ist dabei die Verteilungsfunktion der Standardnormalverteilung mit
= 0; = 1, (s. Verteilungstabelle in.Formelsammlung bzw. MATLAB-Funktion normcdf ), dabei ist ( 1) =
0; (1) = 1:
Ei = pi n; n Stichprobenumfang
Anleitung MATLAB
a) Histogramm mit NV-Dichte: hist…t(a1_4,anz_klassen)
anz_klassen=5
b) s. Aufgabe 1.d)
c) n=30, mu = mean(a1_4), sd = std(a1_4),
für Klasse ( 1; 3:2) : p1 = normcdf (3.2,mu,sd) - 0, E1 = n*p1
für Klasse [3:2; 3:4] : p2 = normcdf (3.4,mu,sd) - normcdf (3.2,mu,sd), E2 = n*p2,...
weiter analog Aufgabe 2
Achtung: die Verteilung hat 5 Klassen, es wurden 2 Parameter geschätzt, daher hat die Testverteilung noch 5 1 2 = 2 Freiheitsgrade
d) [h,p] = lillietest(a1_4, alpha)
h = 1 bedeutet Ablehnung, p ist der p-Wert (Ablehnung der Nullhypothese, falls p < alpha)
5. Bei 12 Probanden wurden zu Beginn eines Tests folgende Werte des systolischen Blutdrucks (in mmHg)
gemessen
130 138 131 143 128 115 127 140 151 144 139 125
a) Zeichnen Sie ein Q-Q-Plot zur gra…schen Beurteilung der Abweichung von einer Normalverteilung.
2
nx2
b) Testen Sie mit dem KS-Test mit Korrektur nach Lilliefors, ob Normalverteilung vorliegt.
Anleitung MATLAB
a) qqplot(a1_5)
b) analog Aufgabe 4
6. Die Bestimmung der Verteilung des Korndurchmessers eines metallogra…schen Schli¤s erfolgt anhand
der Fotogra…e mit einem Au‡ichtmikroskop. Bei Handauswertung vergleicht man die Körner mit Kreisen bestimmter Durchmesser einer Schablone. Man erhält aus einer Stichprobe von 250 Messungen
folgendes klassiertes Ergebnis
Durchmesser ( m) Anzahl
(0,20]
1
(20,40]
44
(40,60]
92
(60,80]
60
(80,100]
28
(100,150]
20
(150,200]
5
a) Stellen Sie die Daten mit MATLAB gra…sch dar, indem Sie die relativen Häu…gkeiten über den
Klassen abtragen.
b) Testen Sie mit einem 2 Test auf Normalverteilung, Risiko 0.05.
Hinweis zu a)
Bei klassierten Daten ersetzt man für die Parameterschätzungen alle Stichprobenwerte einer Klasse
durch ihre Klassenmitte.
Anleitung MATLAB
a) Datenvektor: a1_6=[10 30*ones(1,44) 50*ones(1,92) 70*ones(1,60) 90*ones(1,28) 125*ones(1,20)
175*ones(1,5)]’
qqplot(a1_6)
b) analog Aufgabe 4
7. 16 Versuchspersonen unterzogen sich einem Gedächtnistest, bei dem 30 Wörter dargeboten wurden,
von denen möglichst viele zu merken waren. Die Probanden erreichten folgende Ergebnisse, die auf
Normalverteilung zu prüfen sind.
Proband
1
2
3
4
5
6
7
8
Anzahl Wörter 17 15 18 21 12 14 17 20
Proband
9
10 11 12 13 14 15 16
Anzahl Wörter 13 10 16 12 17 18 14 19
a) Prüfen Sie mit MATLAB gra…sch auf NV durch ein Histogramm und mittels Q-Q-Plot.
b) Ist ein
2
-Test sinnvoll?
c) Rechnen Sie den Anpassungstest nach Kolmogorov-Smirnov bei Risiko 0.05.
Anleitung MATLAB
a) Datenvektor a1_7
hist…t(a1_4,anz_klassen) bzw. qqplot(a1_7)
c) [h,p] = lillietest(a1_7, alpha)
3
8. In einer Firma wurde über einen bestimmten Zeitraum der Krankenstand der Mitarbeiter registriert.
Es wird vermutet, dass die Anzahl X der Krankheitstage einer Poissonverteilung genügt.
Es wurden folgende Daten erhoben
Anzahl Tage X
0
1
2
3
4 5 >6
Anz. Mitarbeiter 27 29 18 10 5 1 0
a) Schätzen Sie unter Annahme einer Poissonverteilung den Parameter
.
b) Testen Sie mit dem Chi-Quadrat-Test, ob die Verteilungsannahme stimmt, Risiko 0.05.
Hinweis
Eine Zufallsgröß
e X mit Wertebereich f0; 1; 2; :::g ist Poissonverteilt mit Parameter > 0, wenn
k
die Werte k mit den Wahrscheinlichkeiten P (X = k) =
e
k!
Der Parameter ist dabei der Erwartungswert: Daher kann
schätzt werden.
Anleitung MATLAB
a) anz = [27 29 18 10 5 1]’, vals =[0 1 2 3 4 5]
lambda = vals anz:=sum(anz)
b) O = anz
pk =poisspdf (k; lambda); Ek = pk
weiter wie Aufgabe 2
sum(anz)
4
angenommen werden.
aus einer Stichprobe durch x ge-