Ishikawa-Diagramm der Baugruppenqualität (Auszug) Komponenten Leiterplatten Ebenheit Lotpaste elektrische Qualität Oberfläche Alter Zusammensetzung geom. Form Fremdschichten Genauigkeit Genauigkeit Lagerung Alter Alter Lötausrüstung Maschineneigenschaften Funktion Zuverlässigkeit gemessen an: Luftreinheit Lotpastendrucker Bestückautomat Baugruppenqualität Temperatur Umgebungsbedingungen Erkennen von Fehlern Maschinenprogr. Benetzung Voids Grabsteine Lotperlen ….. Bediener Wie können wir alle diese Beziehungen abbilden und für eine Optimierung der Zielgrößen nutzen? Statistische Verfahren Teil 1 Folie 1 Komplexität der Zusammenhänge - Grabsteineffekt Gelb - „potentieller“ Grabstein Rot – Grabstein aufgetreten ! Bestück- und Druckversätze sind potentielle Verursacher von Grabsteinen! Weitere Quellen: Temperaturprofil Konstruktion (thermische Senken) Lotpasten, Oberflächen, … ?? weitere zahlreiche Wechselwirkungen ?? Statistische Verfahren Teil 1 Folie 2 SPC/Anwendung für den Bestückprozess MFU/PFU/statistische Analysen Reale Komponenten werden durch hochgenaue Glaskomponenten ersetzt und werden vermessen durch eine optische Inspektion Nutzung dieses Prinzips und dessen erfolgreiche weltweite Anwendung seit 20 Jahren ! Diese Idee wird auch in der IPC 9850 genutzt ! Statistische Verfahren Teil 1 Folie 3 Anwendung von QualitätsregelkartenUmsetzung in einem Lötprozess Gute Fähigkeitswerte ! Tageswechsel Überwachung von Konvektionslötanlagen durch Konstruktion eines angepassten Regelkartensystems mit gleichzeitiger laufender Aktualisierung der Fähigkeitswerte ! Diese Lösung war ein Wechselspiel zwischen den mathematischen Möglichkeiten und Voraussetzungen, den speziellen Prozessbedingungen und den verfügbaren Ressourcen ! Statistische Verfahren Teil 1 Folie 4 Nachweis des Nutzens - Erfahrungen mit Fehlerraten SMD-Reflow BS 60 50 49 42 dpm 40 Posit. ungenau 29 30 Grabsteineffekt 20 8 10 0 1.6.-1.9. vor der Evaluierung und Zeitraum 4.9.-2.11. danach Statistische Verfahren Teil 1 Folie 5 Alle Einzelprozesse in Ordnung!? Trotzdem Fehler ! Ist nicht ausgeschlossen !! Im Problemfall weiß man aber, wo man nicht suchen muss !! Statistische Verfahren Teil 1 Folie 6 Grenzen dieser Lösungen Komponenten Leiterplatten Lotpaste elektrische Qualität Ebenheit Oberfläche Alter Zusammensetzung geom. Form Fremdschichten Genauigkeit Genauigkeit Alter Lagerung Alter Lötausrüstung Luftreinheit Temperatur Maschineneigenschaften Funktion Zuverlässigkeit gemessen an: Lotpastendrucker Bestückautomat Baugruppenqualität Umgebungsbedingungen Erkennen von Fehlern Maschinenprogr. Benetzung Voids Grabsteine Lotperlen ….. Bediener Es wird nur ein bestimmter Teil der Einflüsse überwacht und optimiert ! Notwendig, aber nicht hinreichend ! Statistische Verfahren Teil 1 Folie 7 Einsatz der statistischen Versuchsplanung Design of Experiments (DoE) 1. Auswahl einer begrenzten Menge von Einflussgrößen 2. Durchführung eines Versuchs mit verschiedenen Kombination der Einflussgrößen 3. Analyse der Zusammenhänge zu bestimmten Zielgrößen (Voids, Benetzung, Grabsteine, Lotperlen, ….) bei verschiedenen Komponenten (BGA‘s, QFN, Chips…). Beispiel: 2 2 2 3 3 3 Oberflächen Pastenhersteller Korngrößen Vorheizzeiten Peaktemperaturen Restsauerstofflevel A B C D E F Statistische Verfahren Teil 1 Folie 8 chemSn, NiAu gleiche Legierung 3 und 5 72..144 s 225, 235, 245 °C 100, 550, 1000 ppm Erweiterte Möglichkeiten durch DoE Leiterplatten Komponenten Lotpaste elektrische Qualität Ebenheit Oberfläche Alter Fremdschichten Genauigkeit Genauigkeit Baugruppenqualität Flussmittel geom. Form Funktion Zuverlässigkeit Korngröße Alter Alter gemessen an: Lötausrüstung Luftreinheit Lotpastendrucker Bestückautomat Maschineneigenschaften Temperatur Umgebungsbedingungen Erkennen von Fehlern Temperaturprofil Benetzung Voids Grabsteine Lotperlen ….. Bediener Ermittlung der signifikanten Zusammenhänge zu den Zielgrößen Ermittlung der signifikanten Wechselwirkungen zu den Zielgrößen Statistische Verfahren Teil 1 Folie 9 Ergebnisgröße (z.B. Fehlerquote) Beispiele für Probleme (1) 5.0% 4.5% 4.0% 3.5% 3.0% 2.5% 2.0% 1.5% 1.0% 0.5% 0.0 0.0% 5.0 35.0 10.0 15.0 20.0 25.0 30.0 Verfahrensgröße (z.B. Temperatur) Gibt es einen Zusammenhang zwischen Verfahrensgröße und Ergebnisgröße? Ist dieser Zusammenhang linear oder ist eine andere Beschreibung besser? Wie sicher (signifikant) ist dieser Zusammenhang? Statistische Verfahren Teil 1 Folie 10 Ein Beispielprozess Die-Bonden mit Kleber Wirebond Globtop Metallization Solder Ball SiSi-- Chip Chip Adhesive PCB (THT) Bondpad AlCu0,5 Prozessablauf: Kleber drucken (bzw. Dispensen) Die-Bonden Kleber aushärten (Curing) Statistische Verfahren Teil 1 Folie 11 Ziele beim Die-Bonden (1) Kleberaustritt: muss vorhanden sein, darf aber die Bondinseln nicht zudecken ! 6300.0 Chipverwölbung (Warpage) muss minimal sein [µm] 6070.0 [µm] 0.000 Statistische Verfahren Teil 1 Folie 12 Ziele beim Die-Bonden (2) Blasen zwischen Substrat und Chip Anzahl minimal !! Größe minimal !! Statistische Verfahren Teil 1 Folie 13 Fragen zum Beispielprozess Die-Bonden Hauptziel der Analyse Betrachtete Einflussgrößen im Prozess z.B. gedr. Klebervolumen Bondkraft Bondzeit Aushärtegradient usw. Zielgrößen Existiert ein Zusammenhang ?? Optimierung von: Wenn ja Welcher ? Minimierung des Einflusses von Störgrößen ! Verbesserung der Produktqualität Verbesserung der Fähigkeit, Stabilität, Robustheit und Beherrschbarkeit Statistische Verfahren Teil 1 Folie 14 Kleberaustritt in einem bestimmten Bereich Minimierung der Verbiegung des Dies Minimierung der Blasen zwischen Substrat und Chip usw. Präzisierung der Ziele (1) Optimierung: Ermittlung eines Minimal- ; eines Maximalwert oder einer gezielten Einstellung für eine oder mehrere Zielgrößen (Als alleiniges Ziel, Anwendung der SVP nicht unbedingt nötig) Fähigkeit: Erreichung von Mindestwerten für die Maschinen- und Prozessfähigkeitswerten Cmk bzw Cpk (minimal >1,33) Stabilität: Unabhängigkeit von der Zeit Robustheit: weitgehende Unabhängigkeit von Störungen (Taguchi-Methoden) Beherrschtheit: bewusstes und gezieltes Ändern der Zielgrößen möglich ! Statistische Verfahren Teil 1 Folie 15 Präzisierung der Ziele (2) Prozessbeherschung und -beurteilung durch u.a. statistische Methoden: wie z.B.: SPC Statistical Process Control Regression- und Korrelation DoE Design of Experiments (Statistische Versuchsplanung) Fehlervermeidung, nicht Fehlerbehebung Statistische Verfahren Teil 1 Folie 16 Präzisierung der Ziele (3) Jeder Prozess unterliegt zufälligen Einflüssen! Zufällige Einflüsse sind zu erkennen und deren Auswirkungen sind zu minimieren ! Systematische Einflüsse sind zu finden und bewusst auszunutzen! U nbeherrschter Zustand Streuung M ittelw ert zu groß verschoben Zielzustand To Tu Statistische Verfahren Teil 1 Folie 17 Wiederholung Stetige Qualitätskenngrößen Die Qualitätskenngröße kann (theoretisch) unendlich viele verschiedene Werte annehmen ! Die Qualitätskenngröße ist (prinzipiell) messbar ! Beispiele in der Elektronikfertigung: Versätze (beim Drucken, Bestücken, Dispensen Temperaturen (beim Löten) Widerstände, Kapazitäten von Bauelementen Schaltzeiten von Baugruppen Schichtdicken, Rauheiten …… Statistische Verfahren Teil 1 Folie 18 Verteilungsdichte f(x) f(x) P(xab) a x b Verteilungsdichte f(x) f (x) 0 f (x) für beliebige x P ( x X x dx ) dx f ( x )dx 1 b P xab P a x b f x dx a Statistische Verfahren Teil 1 Folie 19 Verteilungsfunktion F(x) Somit gilt auch : x F x P X x f d F(x) 1 P( X x ) 1 F ( x ) F(xi) xi x Pxab P a x b F b F a Statistische Verfahren Teil 1 Folie 20 Parameter Prinzipiell analog zu den diskreten Größen !! E X Erwartungswert xf ( x )dx D X ( x )2 f ( x )dx 2 Streuung 2 z.B. 2=400 µm2 Standardabweichung 2 D 2 X z.B. =20 µm Das ist anschaulicher !! Statistische Verfahren Teil 1 Folie 21 Die Normalverteilung Maximalwert 1 f (x) e 2 f(x) ( x )2 2 2 Wendepunkt E X D 2 X 2 F ( x ) P( X x ) Statistische Verfahren Teil 1 Folie 22 x 1 2 x e ( )2 2 2 d Normalverteilung 99.73% 95.4% 68.3% -3s -2s -1s 0 1s 2s 3s Statistische Verfahren Teil 1 Folie 23 Normalverteilung- „Handling“ 1. Normalverteilung X mit Erwartungswert und Streuung 2 N(,2) 2. transformierte Normalverteilung 1 X‘=X- N(0,2) = „zentrieren“ 3. transformierte Normalverteilung 2 X‘=X/ N( ,1) = „normieren“ 4. transformierte Normalverteilung 3 X Z N(0 ,1) = „standardisieren“ Die standardisierte Normalverteilung ist tabelliert ! Statistische Verfahren Teil 1 Folie 24 g(x) bzw. g(u) Grafische Veranschaulichung der Standardisierung -4 -4 -3 -2 -3 -2 -1 -1 0 +1 1 +2 +3 2 3 +4 x-Achse u-Achse 4 Die Normalverteilung wird verschoben und gestreckt bzw. gestaucht ! Statistische Verfahren Teil 1 Folie 25 Beispiel systematischer Versatz in x-Richtung x = 10 m Standardabweichung x =20 m Gesucht: Anteil mit einem Versatz von größer als +/-50 m f(x) x =20 µm Tu =-50 µm Statistische Verfahren Teil 1 Folie 26 x =10 µm To=50 µm x Lösung: Versatz ist Zufallsgröße X p P X Tu X To Standardisierung Z X x P X Tu P X To N(0, 1)-Verteilung x X X To Tu x x x x P pP x x x x To Tu x x P Z P Z x x T T 50 10 50 10 p u 1 o 1 20 20 3 1 2 1 0,99865 1 0,97725 0,0241 2,41% Statistische Verfahren Teil 1 Folie 27 Statistische Verfahren Teil 1 Folie 28 Normalverteilung – Nutzung von Quantilen Widerstände- Laserabgleich Geg: =50 pa < 1 % (Ausschussquote) obere Toleranzgrenze =1100 Gesucht: maximaler Arbeitspunkt ?? T X To pa P X To 1 P 1 P Z o T 1 o u0,99 2,3263 1100 0,01 1 50 1100 50 983,685 Arbeitspunkt muss kleiner als 983,685 Ω sein, damit die Ausschussquote pa 1 % nicht übersteigt. Statistische Verfahren Teil 1 Folie 29 Berechnung statistischer Maßzahlen Rechenvors chrift ( x1, x 2 ,...., x n ) statistische Maßzahl Arithmetischer Mittelwert . Median (Zentralwert) x~ 1 n x xi n i 1 Urwerte: 9,35; 9,90; 9,65; 10,25; 9,45; 9,85 10,05 10,40; 9,55. geordnet 9,35; 9,45; 9,55; 9,65; 9,85; 9,90; 10,05;10,25; 10,40. Statistische Verfahren Teil 1 Folie 30 Berechnung statistischer Maßzahlen Empirische Streuung 1 n 2 1 n 2 2 s x x x n x ( ) i i n 1 i 1 n 1 i 1 2 1 n 1 n 2 2 s ( xi ) xi n 2 n i 1 n i 1 2 (1) (2) f n 1 Anzahl Freiheitsgrade Formel 2 (µ geg.) Formel 1 n=1 n=2 x x1 s2 nicht berechenbar ! x1 s2 berechenbar ! x ( x1 x2 ) / 2 s2 bei beiden berechenbar; in der Regel keine gleichen Ergebnisse Durch die Nutzung des Mittelwerts aus der Stichprobe wird ein Freiheitsgrad verbraucht Durch die Vorgabe des Mittelwerts wird kein Freiheitsgrad verbraucht ! Statistische Verfahren Teil 1 Folie 31 Punktschätzungen von Qualitätskenngrößen Stichprobenwerte x1, x2, ... xn Rechenvorschrift ̂ ( x1, x2 ,...., xn ) ̂ ist eine Punktschätzung ! Zeichen "^" ist Kennzeichnung dafür, dass es eine Schätzung ist !! Gewünschte Eigenschaften einer Schätzung: 1. Erwartungstreue (Unverzerrtheit) 2. passend (konsistent) 3. hinreichend (erschöpfend) 4. Wirksamkeit (Vergleich zu anderen Schätzungen) Statistische Verfahren Teil 1 Folie 32 Schätzungen für den Mittelwert µ: Durch den arithmetischen Mittelwert: ̂ x Schätzwert ist erwartungstreu, konsistent, erschöpfend und am wirksamsten! Durch den Median: ˆ x~ Schätzung ist nur asymptotisch erwartungstreu, aber nicht erschöpfend. Statistische Verfahren Teil 1 Folie 33 Statistische Verfahren Teil 1 Folie 34 Statistische Überprüfungen-Problemstellung Beispiel: Überprüfung eines Bestückers Stichprobe n=10 Versatz in x-Richtung wurde vermessen (Sollwert =0) Ergebnis: Frage: oder x 5,2 μm Bestücker systematisch „verstellt“ Abweichung vom Sollwert zufällig ! Mögliche Schlussfolgerung: Bei einer Systematik kann (nicht muss !!) eine Korrektur der Maschine erfolgen ! Bei zufälligen Abweichungen machen Korrekturen keinen Sinn !!! Statistische Verfahren Teil 1 Folie 35 Überprüfung von stetigen Qualitätskenngrößen Grundprinzipien Ausgangspunkt : Prozess ist gut !! (Bestücker arbeitet o.k.!!) Vergleich Gericht: Am Beginn des Prozesses ist der Angeklagte unschuldig ! Hypothese: Ho µ=µo Aufgabe der Überprüfung : Fehler im Prozess nachweisen, d.h Hypothese rückweisen !! Schuld des Angeklagten ist nachzuweisen !! Herangehensweise: Stichprobe entnehmen und auswerten ! Indizien und Beweise sammeln ! Gelingt es nicht, die Hypothese zurückzuweisen: Am Prozess wird nichts geändert ! Der Angeklagte wird freigesprochen ! Unterschied zum Gericht: Der statistische Nachweis ist ein „Indizienbeweis“ !! Statistische Verfahren Teil 1 Folie 36 Überprüfung von stetigen Qualitätskenngrößen Grundgesamtheit Stichprobe x o Stichprobenentnahme Berechnung der Mittelwerte n Verteilung der Mittelwerte Stichprobenfunktionen 2 X N , n G u G o o x Statistische Verfahren Teil 1 Folie 37 Berechnung der Grenzen 1 0 o Gu,o 0 u1 / 2 n u 1- n Hypothese Ho (µ=µ0) wird abgelehnt, wenn der gemessene Mittelwert sich nicht in Gu,o befindet !! Sprechweise: ermittelter Mittelwert ist signifikant unterschiedlich zum Sollwert ! Statistische Verfahren Teil 1 Folie 38 Berechnung der Grenzen und Auswertung Gu,o 0 u1 / 2 n Zusätzlich geg: = 7 µm x 5,2 μm (n=10) Gu Go α=0,27% -6,641 6,641 α=1,00% -5,702 5,702 α=5,00% -4,339 4,339 n (α=1 %) Gu Go 5 -8,064 8,064 10 -5,702 5,702 50 -2,550 2,550 xxx zufällige Abweichung xxx systematische Abweichung Aussageergebnis hängt u.a. vom vorgegebenen Irrtum erster Art ab ! Das ist kein Fälschen der Statistik ! Statistische Verfahren Teil 1 Folie 39 Einseitige Überprüfungen von Arbeitspunkten Sind angebracht, wenn die Abweichung des Qualitätsmerkmals nur nach einer Seite kritisch ist! Verlagerung des Irrtums 1. Art auf die kritische Seite! Gu 0 u1 Go 0 u1 n n Go für μ μo Gu für μ μo Beispiel: Widerstandsfertigung mit anschließendem Laserabgleich zu große Widerstandswerte sind kritisch zu kleine Widerstandswerte (in gewissen Grenzen) sind unkritisch Hypothese Ho µ<µo verwenden ! Regel: Wenn eine einseitige Überprüfung möglich und sinnvoll ist, ist sie der zweiseitigen Überprüfung vorzuziehen!! Statistische Verfahren Teil 1 Folie 40 Berechnung der Grenzen Standardabweichung unbekannt Standardabweichung wird aus der Stichprobe geschätzt ! s Gu,o 0 t n 1;1 / 2 T Stichprobenfunktion X n S n Vergleich der Ergebnisse zur Normalverteilung (s=7 µm) (n=10) α=0,27% α=1,00% α=5,00% Go Normalverteilung 6,641 5,702 4,339 Go t-Verteilung 9,55 7,58 5,28 n (α=1 %) Go Normalverteilung Go t-Verteilung 5 8,064 14,41 10 5,702 7,19 50 2,550 2,65 Einseitige Schätzung analog ! Quantile der t-Verteilung (tn,1-), siehe Tabelle 3 Statistische Verfahren Teil 1 Folie 41 Prüfung der Streuung Vorgabe einer Sollstreuung Zufallsgröße S2 S2 Z 2 n 1 2 o2 o2 Hypothese Ho : Z ist 2-verteilt 2 n-1; 0 Gu 2n 1; / 2 n 1 o2 Go n2 1;1 / 2 n 1 2 n-1 o2 Befindet sich die ermittelte Streuung s2 nicht in diesem Intervall, dann liegt ein signifikanter Unterschied vor!! Quantile der 2- Verteilung siehe Tabelle 4 Statistische Verfahren Teil 1 Folie 42 Prüfung der Streuung Die zweiseitige Überprüfung der Streuung ist in der Praxis die Ausnahme ! Zu kleine Streuungen sind unschädlich ! Sie machen aber eventuell auf Messfehler und falsche Vorgaben aufmerksam! Verwendung einer einseitigen Überprüfung mit der Hypothese: 2 o2 Überprüfung auf eine vorgegebene Maximalstreuung Go 2n 1;1 n 1 o2 o2 Statistische Verfahren Teil 1 Folie 43 Vergleich von Mittelwerten Aufgabe : Vergleich von zwei Messgeräten Zeigen beide Geräte für ein gleiches Objekt im Mittel die gleichen Messwerte an? zwei Maschinen (fertigen z.B. die gleichen Produkte) Gibt es Unterschiede bei der Betrachtung eines bestimmten Qualitätsmerkmals? Benötigte Daten: zwei Stichproben mit n1 Messwerten (erste Maschine) x11 x1n1 x1 s1 n2 Messwerten (zweite Maschine). x21 x1n2 x2 s2 Stichprobenumfänge sind nicht notwendig gleich, dies ist aber empfehlenswert. Statistische Verfahren Teil 1 Folie 44 Vergleich von Mittelwerten Ein signifikanter Mittelwertunterschied ist vorhanden, wenn: x1 x2 n1 1s12 n2 1s22 n1 n2 2 n1 n2 n1 n2 tn1n2 2;1 Bei Gleichheit der Stichprobenumfänge: x1 x 2 s12 t 2( n 1);1 s22 n Statistische Verfahren Teil 1 Folie 45 Vergleich von Mittelwerten Berechnung des notwendigen Stichprobenumfangs 1 2 n n 2 1 u1 d u2 1 und 2 beider Versuche sind bekannt und gleich () d zu erkennender Mittelwertunterschied α µ1=µ2 Risiko, dass die Gleichheit nicht erkannt wird β µ1<>µ2 Risiko, dass die Ungleichheit nicht erkannt wird Gesucht : n für eine Stichprobe Statistische Verfahren Teil 1 Folie 46 Berechnung des notwendigen Stichprobenumfangs 2 u1 1 u1 2 u2 2 u1 n n Überlappen sich u1 und u2 kein signifikanter Unterschied !! u1 u2 einfacher Stichprobenumfang u1 u1 n d 2 2 140 120 100 n ist der einfache Stichprobenumfang !!! n 80 60 40 Diagramm gilt für: α=10 % β= 1% 20 0 0,5 1 1,5 2 2,5 3 sigma/d Statistische Verfahren Teil 1 Folie 47 Vergleich von Streuungen 12 und Prozess 2 mit 22 H o : 12 22 Prozess 1 mit Prozess 1 Stichprobe n1 Ergebnis: s12 2 Prozess 2 Stichprobe n2 (nicht notwendig gleich n1) Ergebnis: s 2 Prüfgröße f : f s12 s22 f ist F-verteilt (siehe Stichprobenfunktionen) ; ist die Hypothese richtig, weicht f nur zufällig von eins ab !! s12 s22 Fn1 1;n2 1; / 2 s12 s22 Fn1 1;n2 1;1 / 2 Beide Ungleichungen müssen erfüllt sein ! Statistische Verfahren Teil 1 Folie 48 Vergleich von Streuungen Typischer sind einseitige Überprüfungen! 12 22 Ho Ablehnung bei: s12 s22 1 Fn 1;n 1; 1 2 Fn2 1;n1 1;1 Fn1 1;n2 1; 12 22 Ho Ablehnung bei: s12 s22 Fn1 1;n2 1;1 Statistische Verfahren Teil 1 Folie 49 Überprüfung von Verteilungen Was heißt es : Normalverteilung ist nicht abgelehnt oder Normalverteilung ist abgelehnt Schritt 1: Gemessene Daten Beispiel: n=10 -3,3 1 5,5 3,1 0,2 -6,5 8,5 -1,1 -0,1 1,5 Schritt 2: Berechnung von Mittelwert und Standardabweichung x 0,88 s 4,24 Schritt 3: Sortierung der Daten -6,5 -3,3 Statistische Verfahren Teil 1 Folie 50 -1,1 -0,1 0,2 1 1,5 3,1 5,5 8,5 Zeichnen der theoretischen Verteilung = Gerade im Wahrscheinlichkeitsplot 99,9 99,8 99,9 99,8 99,5 99 98 99,5 99 98 95 95 90 90 80 80 70 60 50 40 30 70 60 50 40 30 20 20 10 10 5 5 2 1 0,5 2 1 0,5 0,2 0,1 0,2 0,1 -10 -8 -6 -4 -2 0 x 2s 7 ,605 2 4 6 8 10 x 0,88 Statistische Verfahren Teil 1 Folie 51 Zeichnen der geschätzten Verteilung = Treppenfunktion im Wahrscheinlichkeitsplot 99,9 99,8 99,9 99,8 99,5 99 98 99,5 99 98 95 95 90 90 80 80 70 60 50 40 30 20 70 60 50 40 30 1/n*100% 10 % 20 10 10 5 5 2 1 0,5 2 1 0,5 0,2 0,1 0,2 0,1 -10 -8 -6 x1 -4 -2 x2 0 2 4 8 x3 Exakterer Funktionswert der „Stufen (nicht die Höhe !) für n<30: Statistische Verfahren Teil 1 Folie 52 6 F (i ) 3i 1 3n 1 10 Überprüfung mit dem Kolmogorov-Smirnov-Test – Suchen nach der maximalen Differenz 99,9 99,8 99,9 99,8 99,5 99 98 99,5 99 98 95 95 90 90 80 D1o 80 D1u 70 60 50 40 30 20 70 60 50 40 30 20 D7o=14 % 10 5 10 5 2 1 0,5 2 1 0,5 0,2 0,1 0,2 0,1 -10 -8 -6 -4 -2 0 2 4 6 8 10 Keine Ablehnung Tabelle 9 n=10 ε=95 % Dmax=25,8 % Bemerkung: Kolmogorov-Test (Tabelle 8) arbeitet mit bekannten Mittelwert und bekannter Streuung ! Statistische Verfahren Teil 1 Folie 53 Bereichs- bzw. Konfidenzschätzungen für Arbeitspunkte ̂ 9,98 k Geg: Mittelwert 0,03 k Standardabweichung Bereich (Intervall) [gu, go] für den Arbeitspunkt in der er sich mit einer Wahrscheinlichkeit (oder 1-) befindet Ho : o keine Ablehnung wenn: Ges. x o n u1 / 2 Umstellung der Ungleichung nach µo x u1 / 2 n x u1 / 2 g u x u1 / 2 n n g o x u1 / 2 n Liegt der Sollwert nicht im Intervall, dann liegt eine signifikante systematische Abweichung vor! (Gleiches Ergebnis wie bei den Hypothesen). Zusätzlich sind aus der Größe des Intervalls noch Schlussfolgerungen für die Unsicherheit der Aussage möglich ! Statistische Verfahren Teil 1 Folie 54 Bereichs- bzw. Konfidenzschätzungen für Arbeitspunkte einseitige Konfidenzintervalle: g u x u1 go n bzw. gu 0 g o x u1 n Standardabweichung unbekannt Verwendung der t-Verteilung: s n g u x t n 1;1 / 2 g o x t n 1;1 / 2 s n Beispiel: (für n=10 und =1 %): Normalverteilung 9,955 k 10,004 k gu go t-Verteilung 9,949 k 10,011 k Statistische Verfahren Teil 1 Folie 55 Bereichsschätzungen von Streuungen/Standardabweichungen zweiseitige Bereichsschätzung für die Standardabweichung: gu n 1 2 n 1,1 / 2 go s n 1 n21, / 2 s einseitige Schätzungen: gu 0 go n 1 n21, s go wie groß ist die Standardabweichung im ungünstigsten Fall! pessimistische Abschätzung der Standardabweichung. gu n 1 n21,1 s go gu wie klein ist die Standardabweichung im günstigsten Fall! optimistische Abschätzung der Standardabweichung. Statistische Verfahren Teil 1 Folie 56 Einige Begriffe Störgrößen S Umgebung usw. Einflussgrößen X Prozess ? Prozessparameter Materialparameter Zielgrößen Y z.B. Qualität Y f X g S zentrale Aufgaben: f Abhängigkeit der Zielgrößen von den Einflussgrößen ermitteln !! f wird im Folgenden als ein Modell bezeichnet ! g Abhängigkeit der Zielgrößen von Störgrößen minimieren !! Lösung mittels statistische Methoden !! Statistische Verfahren Teil 1 Folie 57 Regressionsanalysen Einfache (simple) lineare Regression Demonstrationsbeispiel Dispenser Für einen Lotpastendispenser soll eine Steuerung programmiert werden. Zielgröße ist das ausgebrachte Volumen. Zur Ermittlung der Abhängigkeiten zwischen den am Dispenser einstellbaren Größen und der Zielgröße wird u.a. die Dauer des Druckluftimpulses d für eine bestimmte Lotpaste mit d = 0,8 (0,1) 2,7 (in s) variiert. Das Volumen V wird gemessen. Es wird davon ausgegangen, dass beim Messen des Volumens und der Zeitdauer des Druckluftimpulses keine Messfehler vorhanden sind. 58 Demonstrationsbeispiel Dispenser Diskussion der Einflussgrößen Auf das ausgebrachte Volumen haben einen Einfluss: • Druck des Druckluftimpulses • Länge des Druckluftimpulses • Durchmesser der Dispensernadel • Länge der Dispensernadel • Füllstand der Kartusche • Eigenschaften der Lotpaste (insb.Viskosität) • Umgebungsbedingungen (insb. Temperatur) Die Länge des Druckluftimpulses ist hier die Einflussgröße (bzw. unabhängige Größe), das Volumen die Zielgröße (bzw. abhängige Größe) Alle anderen Größen sind Störgrößen, die möglichst konstant zu halten sind ! Vor dem Versuch ist zu klären, ob dies möglich ist, bzw. welche Auswirkungen mögliche Schwankungen haben. Schwankungen sind aufzuzeichnen ! Zu erwartende Ergebnisse: Linearer Zusammenhang zwischen Zeit und Volumen vermutet ! Es existiert eine Mindestzeit, ab der Lotpaste ausgebracht wird ! Statistische Verfahren Teil 1 Folie 59 V [mm ) 0,026 0,104 0,070 0,065 0,114 0,099 0,264 0,185 0,304 0,382 0,302 0,346 0,460 0,484 0,442 0,476 0,495 0,634 0,603 0,619 Versuchsergebnisse 3 0,7 0,6 0,5 Volumen t [s] 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 0,4 0,3 0,2 0,1 0 0,5 1 1,5 2 2,5 3 Zeit Frage: Gibt es einen linearen Zusammenhang zwischen Dispenszeit und Volumen ??? Statistische Verfahren Teil 1 Folie 60 Frage: Gibt es einen linearen Zusammenhang zwischen Dispenszeit und Volumen ??? V Vo b t bzw. allg. y a bx Diese Gleichung ist ein Modell !! Die Zeit t (allg. x) ist hier die unabhängige Variable. Das Volumen V (allg. y) ist hier die abhängige Variable. Diese Zuordnung ist nicht immer möglich und hängt vom Problem ab! Ein lineares Modell ist das einfachste denkbare Modell !! Prinzipiell sind alle mathematischen Zusammenhänge denkbar !! Statistische Verfahren Teil 1 Folie 61 Methode der kleinsten Quadrate Gleichung der Gerade y=a+bx y-Achse Yi a ri (Xi , Yi) Residuum 0 Xi x-Achse Die Methode der kleinsten Quadrate schätzt a und b so, dass ri1 2 + ri2 2 … + rin 2 so klein wie möglich ist Statistische Verfahren Teil 1 Folie 62 Orthogonale Regression Gleichung der Gerade y=a+bx y-Achse Yi (Xi , Yi) a Xi x-Achse 0 Die orthogonale Regression minimiert die rechtwinkligen quadrierten Abstände zur Gerade ! Die Ergebnisse unterscheiden sich von der “normalen” Regression ! Statistische Verfahren Teil 1 Folie 63 Mathematische Umsetzung yˆ i a b xi yˆ i n y i 1 Schätzung der Zielgröße bei bekannten a und b und geg. xi i n yˆ i y i a b x i Minimum 2 2 i 1 n Q XY x i x y i y i 1 n Q XX x i x 2 i 1 QYY, QXX – Summe der quadratischen Abweichungen s Q bˆ XY xy2 Q XX sx aˆ y bˆ x s XY 1 n xi x y i y n 1 i 1 Statistische Verfahren Teil 1 Folie 64 1 n x i y i n x y n 1 i 1 Kovarianz n y Weiterhin gelten: i 1 i n 2 i 1 2 i 1 Qgesamt QRegression Variation ohne Modell QGesamt y n y yˆ i y y i yˆ i 2 QRest Modell Variation des Modells QRegression y Variation mit Modell Qrest x x Das Modell (Regressionsgerade) muss durch den Punkt [ x , y ] gehen ! Statistische Verfahren Teil 1 Folie 65 Beispielergebnisse a=-0,253 b= 0,329 0,700 0,600 Volumen 0,500 0,400 0,300 0,200 0,100 0,000 0,5 1 1,5 2 2,5 3 Dispenszeit Modell nur innerhalb des Wertebereichs des Experiments gültig ! Extrapolationen sind unzulässig !! a= -0,253 ist kein negatives Volumen bei t=0 !! Statistische Verfahren Teil 1 Folie 66 Bestimmtheitsmaß Bxy und Korrelationskoeffizient rxy n rxy s xy sx sy x i 1 n i x y i y n 2 x x y y i i 2 i 1 Q XY 0,9732 Q XX QYY i 1 1 rxy 1 Bxy rxy2 0,9471 94,71% 94,71 % der Änderungen des Volumens wird durch das Modell beschrieben ! Bxy adj 1 QRe st /(n p ) 94,42 % Qyy /(n 1) „Adjustiertes“ Bestimmtheitsmaß; wird benutzt für Vergleiche p – Anzahl der geschätzten Parameter (hier p=2) Statistische Verfahren Teil 1 Folie 67 Verschiedene Plots für B=R2 0.50 Das Bestimmheitsmaß liefert nur eine Teilaussage über den Grad des Zusammenhangs ! Statistische Verfahren Teil 1 Folie 68 Interpretation von Regressionsdaten Strenge positive Korrelation r1 Strenge negative Korrelation r-1 Moderate positive Korrelation r0,5 Moderate negative Korrelation r-0,5 Keine Korrelation r0 Anderes Bild Keine lineare Korrelation Statistische Verfahren Teil 1 Folie 69 Überprüfung des Korrelationskoeffizient rxy auf Unabhängigkeit Ein Korrelationskoeffizient von rxy=0 wird sich nie exakt ergeben ! Frage: Wann unterscheidet sich der Koeffizient nur zufällig von Null ! oder Test auf Unabhängigkeit der Merkmale ! Hypothese: xy 0 ρxy ist der wahre aber unbekannte Koeffizient ! Bei Bestätigung : Der beobachtete Korrelationskoeffizient unterscheidet sich nur zufällig von Null ! Testgröße: Tˆ r xy n 2 1 r xy2 t n 2;1 Bei Gültigkeit: Nichtablehnung der Hypothese ! Beispiel: rxy=0,54 n=15 α=1% Tˆ 2,32 t13;0,99 2,65 Lösung: Keine Ablehnung: d.h. der untersuchte Zusammenhang kann trotz des relativ hohen Koeffizienten nicht existent sein ! Weitere Lösungsmethode: Nutzung der Tabelle 9 (Zufallshöchstwerte für den Korrelationskoeffizienten) Statistische Verfahren Teil 1 Folie 70 Überprüfung des linearen Zusammenhangs zwischen zwei Merkmalen Hypothese: xy 0 ρ0 - vorgegebener Grad des Zusammenhangs U Transformation: d.h. W W W W 1 1 R xy ln 2 1 R xy mit W ln ρ0 =0,8 z.B.: 1 2 ist asymptotisch normalverteilt 0 1 0 1 0 2(n 1) rxy=0,6 W=1,12 w= 0,693 N (0,1) n=20 W2 1 n 3 α=5 % W=0,2425 Testgröße u = -1,7586 Vergleichsgröße u1-α/2= 1,96 u u1 / 2 zweiseitige Überprüfung ! keine Ablehnung Statistische Verfahren Teil 1 Folie 71 Vergleich zweier Korrelationskoeffizienten Gegeben: Prozess 1 Prozess 2 r1=0,8 r2=0,6 n1=40 n2=50 Frage: Unterscheiden sich die Korrelationskoeffizienten signifikant?? ρ1= ρ2 Hypothese: U W1 W2 W2 1 W2 2 N (0,1) (näherungsweise) w1=1,0986 w2=0,6931 Testgröße u = 1,8449 Vergleichsgröße u1-α/2= 1,96 u u1 / 2 Statistische Verfahren Teil 1 Folie 72 zweiseitige Überprüfung (α=5%)! keine Ablehnung Residuen (Differenz zwischen Modell und Beobachtung) y i yˆ i Berechnung: x-Achse=Modell Residuen (Dispenserbeispiel) 0,1 0,08 0,06 Die Residuendarstellungen dürfen keinerlei systematische Auffälligkeiten aufweisen ! Die Residuen müssen rein zufällig streuen und normalverteilt sein !! Die Definition (Skalierung / Reihenfolge) der x-Achse kann verschieden sein ! 0,04 0,02 0 -0,02 0 5 10 15 20 -0,04 -0,06 -0,08 -0,1 Statistische Verfahren Teil 1 Folie 73 Residuen Residuen Auffällige Residuenverläufe Einflussgröße x Nichtlinearer Zusammenhang Abhilfe: Nichtlineare Regression ! Statistische Verfahren Teil 1 Folie 74 0 5 10 15 20 Versuchsreihenfolge Zusätzlicher Effekt durch die Versuchsreihenfolge 25 30 Auffällige Residuenverläufe Residuen Die Schätzwerte ŷ i werden auf der x-Achse aufgetragen ! Ein solches Bild deutet auf eine Abhängigkeit der Standardabweichung von der Größe der Zielgröße hin. Alle Regressionsrechnungen gehen von einer Konstanz dieser Standardabweichung aus. Abhilfe: Kleinerer Versuchsbereich Box-Cox-Transformation Transf. zur Streuungsstabilisierung Zielgröße (Modell) yt y Statistische Verfahren Teil 1 Folie 75 80 80 40 40 40 0 -40 Residuum 80 Residuum Residuum Praxisbeispiel 0 -40 -40 -80 -80 -80 150 200 250 300 350 400 450 0 vorhergesagt 200 400 600 2 800 80 40 40 40 0 -40 Residuum 80 0 -40 -80 80 120 160 200 Bondzeit 3,2 3,5 3,8 8 10 0 -80 0 2 4 6 Bondkraft 8 10 0 2 4 6 Curegradient Verschiedene Residuendarstellungen in einer Versuchsplanung; Markiert sind die jeweils gleichen Einzelergebnisse Nicht in jeder Darstellung fallen diese Punkte auf ! Statistische Verfahren Teil 1 Folie 76 2,9 -40 -80 40 2,6 Volumen 80 0 2,3 Reihenfolgenummer Residuum Residuum 0 Analyse des Geradenanstiegs b Berechnung der Reststreuung sR2 (=Streuung der Residuen) sR2 bu,o 1 Bxy QYY sR 0,0472943 n2 s t s t bˆ R n 2;1 / 2 bˆ R n 2;1 / 2 (n 1) s x Q XX 0,2908/0,3 679 Intervall enthält nicht den Wert Null, also ist der Anstieg der Gerade signifikant (mit max. α % Wahrscheinlichkeit) Zusammenhang signifikant !! Weitere Analyse von b: α bu 5,0% 0,2908 1,0% 0,2766 0,1% 0,2574 0,01% 0,2383 bo 0,3679 0,3822 0,4013 0,4204 Evaluation * ** *** **** indifferent signifikant hoch signifikant höchst signifikant Die Bewertung wird vergeben, wenn das Intervall den Wert Null nicht enthält !! Wenn alle Intervalle den Wert Null enthalten Bewertung „–“ kein Zusammenhang bei diesem Stichprobenumfang nachweisbar ! Statistische Verfahren Teil 1 Folie 77 Analyse des Geradenabschnitts a au,o aˆ sR 1 x2 1 x2 t n 2;1 / 2 aˆ sR t n 2;1 / 2 n Q XX n (n 1)s x2 Konfidenzintervall der Regressionsgerade (Hyperbeln) 1 x x g u,o ( x ) aˆ bˆx sR t n 2;1 / 2 n (n 1)s x2 2 Statistische Verfahren Teil 1 Folie 78 -0,3238 / - 0,1818 Verschiedene Signifikanzen **** - Abhängigkeit - Abhängigkeit Plot of Fitted Model ZG = -0,2530105 + 0,3295489*EG Plot of Fitted Model ZG2 = -0,264888 + 0,3318797*EG2 0,51 0,8 0,48 0,6 ZG ZG2 0,45 0,42 0,4 0,39 0,2 0,36 0,33 0 0,8 1,2 1,6 2 2,4 2 2,8 2,04 2,08 2,12 2,16 2,2 EG2 EG Die grünen Geraden zeigen den Schwankungsbereich der Regressionsgerade! Statistische Verfahren Teil 1 Folie 79 Volumen 0,434 0,383 0,458 0,385 0,368 0,468 0,356 0,336 0,425 0,461 0,497 0,37 0,507 0,503 0,405 0,446 0,466 0,416 0,427 0,497 „Präzisere Analyse“ Einschränkung des Versuchsbereichs und feineres Abtasten! Bessere Ergebnisse?? 0,55 0,5 Volumen Zeit 2 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,1 2,11 2,12 2,13 2,14 2,15 2,16 2,17 2,18 2,19 Statistische Verfahren Teil 1 Folie 80 0,45 0,4 0,35 0,3 2 2,05 2,1 Dispenszeit 2,15 2,2 Vergleich der Ergebnisse Mittelwert Zeit Standardabweichung Zeit "Präzise" Analyse 2,095 0,0592 Die scheinbar präzisere Analyse erste führt zu einem enttäuschenden Analyse Ergebnis (besonders das 1,75 0,5916 Bestimmtheitsmaß) Mittelwert Volumen Standardabweichung Volumen 0,4304 0,0522 Kovarianz 0,0012 Schlussfolgerung hier 0,3236 Kein Zusammenhang 0,2002 obwohl die Geradenparameter fast identisch und die Rest0,1153 streuung sogar kleiner ist ! 0,3759 14,13% 0,9732 Schlussfolgerung: 94,71% Zu enger Versuchsbereich führt Korrelationskoeffizient Bestimmtheitsmaß Gerade a b Reststreuung Reststandardabweichung oft zu unzureichenden Ergebnissen bei viel Aufwand ! -0,2649 0,3319 0,001924 0,04386 -0,2528 0,3294 Umkehrschluss ist aber nur teil- weise zulässig, da Bereiche von 0,002237 Nichtlinearitäten bzw. „nicht in0,04729 teressierende“ Bereiche er- reicht werden können ! Statistische Verfahren Teil 1 Folie 81
© Copyright 2025 ExpyDoc