Mathematik III f u • r MT WS 2015/2016 [email protected] 1. Übungsserie: Anpassung von Verteilungen 1. Bei 20 Streichholzschachteln wird jeweils die Anzahl der darin enthaltenen Streichhölzer ermittelt mit folgendem Ergebnis 37 40 41 42 40 38 41 43 41 40 35 40 38 37 38 40 38 37 38 38 . Berechnungen ohne Computer a) Bestimmen Sie die absoluten und relativen Häu…gkeiten der Merkmalsausprägungen und zeichnen Sie ein Balkendiagramm. b) Berechnen und zeichnen Sie ein Histogramm mit 4 bzw. 5 Klassen (Unterschied zu Balkendiagramm?). c) Bestimmen Sie die empirische Verteilungsfunktion und vergleichen Sie sie mit der MATLAB-Gra…k. d) Berechnen Sie Mittelwert, Standardabweichung und den Variationskoe¢ zienten (TR oder Computer). e) Berechnen Sie zu Fußden Median, die Quartile, den Quartilsabstand sowie das 10%- und 90%Quantil und zeichnen Sie ein Boxplot. Liegen ausreiß erverdächtige Werte vor? Anleitung MATLAB Die unten angegebenen MATLAB-Kommandos sind nur ein Vorschlag. Schauen Sie sich zur Erklärung der Parameter in den Kommandos die Hilfe dazu an. Schreiben Sie (zumindest am Ende der Bearbeitung der Aufgabe) alle Kommandos in ein M-File. a) Daten als Spaltenvektor mit Bezeichnung a1_1 eingeben Absolute und relative Häu…gkeiten, Balkendiagramm: vals = unique(a1_1) erzeugt einen Vektor mit den verschiedenen Merkmalsausprägungen, Häu…gkeitsauszählung der Merkmalsausprägungen mit [anz, bins ]= hist(a1_1,vals) Balkendiagramm mit bar(bins,anz) b) Histogramm mit 4 bzw. 5 Klassen: hist(a1_1,4) oder hist(a1_1,5) c) empirische VF: ecdf(a1_1) d) m = mean(a1_1), s = std(a1_1), v=s/m e) med = median(a1_1) bzw. p = prctile(a1_1,[10 25 75 90]) oder quantile(a1_1,[0.10 0.25 0.75 0.90]) Quartilsabstand d = p(3) - p(2) bzw. d = iqr(a1_1) boxplot(a1_1) 2. Ein Spaltungsversuch soll als Resultat 3 Phänotypen im erwarteten Verhältnis 1:2:1 erzeugen. In einem Vorversuch erhält man die 3 Phänotypen mit den Häu…gkeiten von 20, 65, 15. Spricht das bei Risiko 5% gegen das erwartete Ergebnis? Rechnen Sie ohne Computer einen Chi-Quadrat-Anpassungstest. Anleitung MATLAB Datenvektor: a1_2=[ones(1,20) 2*ones(1,65) 3*ones(1,15)]’ Test: [h,p]=chi2gof (a1_2,’Expected’,[25,50,25]) oder Testgröß e programmieren H0 : Verteilung E = [25; 50; 25] liegt vor Vektor der beobachteten Häu…gkeiten: O = [20; 65; 15] Summanden: chi_s = (O E):^2:=E Testgröß e: T = sum(chi_s) Testentscheidung durch Vergleich der Testgröß e mit Schwellwert crit = chi2inv(0:95; 2) da Verteilung 1 mit 3 Kategorien oder Berechnung des p-Werts pval = 1 gleich mit 0:05 chi2cdf (T; 2) (Überschreitungswahrscheinlichkeit) und Ver- 3. In der Verkehrsdirektion von A-Stadt werden über ein Jahr die Verkehrsunfälle nach Wochentagen erfasst, man erhält aufsummiert über alle beobachteten Wochen folgende Verteilung Mo Di Mi Do Fr Sa So 77 46 46 50 62 58 31 Testen Sie mit MATLAB, ob es eine signi…kante Abhängigkeit der Anzahl der Unfälle vom Wochentag gibt (d.h. nicht alle Wochentage mit gleicher Wahrscheinlichkeit auftreten), Risiko 0.05. Anleitung MATLAB analog Aufgabe 2 4. In folgender Stichprobe wird die Porengröß e von 30 Labor…ltern erfasst 3.0 3.0 3.1 3.1 3.2 3.2 3.3 3.3 3.3 3.4 3.4 3.4 3.6 3.7 3.7 3.7 3.8 3.8 3.8 3.8 3.8 3.8 3.9 3.9 4.0 4.0 3.6 4.0 3.7 4.0 a) Stellen Sie die Daten in einem Histogramm mit überlagerter Normalverteilungsdichte dar. b) Berechnen Sie mit MATLAB Mittelwert und Standardabweichung. c) Testen Sie zu Fußund mit MATLAB mittels Chi-Quadrat-Anpassungstest, ob Normalverteilung vorliegt, verwenden Sie 5 Klassen (Risiko 0.05). d) Testen Sie mit dem KS-Test mit Korrektur nach Lilliefors (MATLAB), ob Normalverteilung vorliegt. Hinweis zu c) Berechnung der erwarteten Häu…gkeiten Ei unter Normalverteilung Pn 1 1 Pn 2 2 durch s2 = Parameterschätzung der Normalverteilung: durch x = i=1 xi i=1 xi , n n 1 b a Berechnung der Klassenwahrscheinlichkeiten: P (a < X < b) = ist dabei die Verteilungsfunktion der Standardnormalverteilung mit = 0; = 1, (s. Verteilungstabelle in.Formelsammlung bzw. MATLAB-Funktion normcdf ), dabei ist ( 1) = 0; (1) = 1: Ei = pi n; n Stichprobenumfang Anleitung MATLAB a) Histogramm mit NV-Dichte: hist…t(a1_4,anz_klassen) anz_klassen=5 b) s. Aufgabe 1.d) c) n=30, mu = mean(a1_4), sd = std(a1_4), für Klasse ( 1; 3:2) : p1 = normcdf (3.2,mu,sd) - 0, E1 = n*p1 für Klasse [3:2; 3:4] : p2 = normcdf (3.4,mu,sd) - normcdf (3.2,mu,sd), E2 = n*p2,... weiter analog Aufgabe 2 Achtung: die Verteilung hat 5 Klassen, es wurden 2 Parameter geschätzt, daher hat die Testverteilung noch 5 1 2 = 2 Freiheitsgrade d) [h,p] = lillietest(a1_4, alpha) h = 1 bedeutet Ablehnung, p ist der p-Wert (Ablehnung der Nullhypothese, falls p < alpha) 5. Bei 12 Probanden wurden zu Beginn eines Tests folgende Werte des systolischen Blutdrucks (in mmHg) gemessen 130 138 131 143 128 115 127 140 151 144 139 125 a) Zeichnen Sie ein Q-Q-Plot zur gra…schen Beurteilung der Abweichung von einer Normalverteilung. 2 nx2 b) Testen Sie mit dem KS-Test mit Korrektur nach Lilliefors, ob Normalverteilung vorliegt. Anleitung MATLAB a) qqplot(a1_5) b) analog Aufgabe 4 6. Die Bestimmung der Verteilung des Korndurchmessers eines metallogra…schen Schli¤s erfolgt anhand der Fotogra…e mit einem Au‡ichtmikroskop. Bei Handauswertung vergleicht man die Körner mit Kreisen bestimmter Durchmesser einer Schablone. Man erhält aus einer Stichprobe von 250 Messungen folgendes klassiertes Ergebnis Durchmesser ( m) Anzahl (0,20] 1 (20,40] 44 (40,60] 92 (60,80] 60 (80,100] 28 (100,150] 20 (150,200] 5 a) Stellen Sie die Daten mit MATLAB gra…sch dar, indem Sie die relativen Häu…gkeiten über den Klassen abtragen. b) Testen Sie mit einem 2 Test auf Normalverteilung, Risiko 0.05. Hinweis zu a) Bei klassierten Daten ersetzt man für die Parameterschätzungen alle Stichprobenwerte einer Klasse durch ihre Klassenmitte. Anleitung MATLAB a) Datenvektor: a1_6=[10 30*ones(1,44) 50*ones(1,92) 70*ones(1,60) 90*ones(1,28) 125*ones(1,20) 175*ones(1,5)]’ qqplot(a1_6) b) analog Aufgabe 4 7. 16 Versuchspersonen unterzogen sich einem Gedächtnistest, bei dem 30 Wörter dargeboten wurden, von denen möglichst viele zu merken waren. Die Probanden erreichten folgende Ergebnisse, die auf Normalverteilung zu prüfen sind. Proband 1 2 3 4 5 6 7 8 Anzahl Wörter 17 15 18 21 12 14 17 20 Proband 9 10 11 12 13 14 15 16 Anzahl Wörter 13 10 16 12 17 18 14 19 a) Prüfen Sie mit MATLAB gra…sch auf NV durch ein Histogramm und mittels Q-Q-Plot. b) Ist ein 2 -Test sinnvoll? c) Rechnen Sie den Anpassungstest nach Kolmogorov-Smirnov bei Risiko 0.05. Anleitung MATLAB a) Datenvektor a1_7 hist…t(a1_4,anz_klassen) bzw. qqplot(a1_7) c) [h,p] = lillietest(a1_7, alpha) 3 8. In einer Firma wurde über einen bestimmten Zeitraum der Krankenstand der Mitarbeiter registriert. Es wird vermutet, dass die Anzahl X der Krankheitstage einer Poissonverteilung genügt. Es wurden folgende Daten erhoben Anzahl Tage X 0 1 2 3 4 5 >6 Anz. Mitarbeiter 27 29 18 10 5 1 0 a) Schätzen Sie unter Annahme einer Poissonverteilung den Parameter . b) Testen Sie mit dem Chi-Quadrat-Test, ob die Verteilungsannahme stimmt, Risiko 0.05. Hinweis Eine Zufallsgröß e X mit Wertebereich f0; 1; 2; :::g ist Poissonverteilt mit Parameter > 0, wenn k die Werte k mit den Wahrscheinlichkeiten P (X = k) = e k! Der Parameter ist dabei der Erwartungswert: Daher kann schätzt werden. Anleitung MATLAB a) anz = [27 29 18 10 5 1]’, vals =[0 1 2 3 4 5] lambda = vals anz:=sum(anz) b) O = anz pk =poisspdf (k; lambda); Ek = pk weiter wie Aufgabe 2 sum(anz) 4 angenommen werden. aus einer Stichprobe durch x ge-
© Copyright 2024 ExpyDoc