null

Ishikawa-Diagramm der Baugruppenqualität (Auszug)
Komponenten
Leiterplatten
Ebenheit
Lotpaste
elektrische
Qualität
Oberfläche
Alter
Zusammensetzung
geom. Form
Fremdschichten
Genauigkeit
Genauigkeit
Lagerung
Alter
Alter
Lötausrüstung
Maschineneigenschaften
 Funktion
 Zuverlässigkeit
gemessen an:
Luftreinheit
Lotpastendrucker
Bestückautomat
Baugruppenqualität
Temperatur
Umgebungsbedingungen
Erkennen von
Fehlern
Maschinenprogr.





Benetzung
Voids
Grabsteine
Lotperlen
…..
Bediener
Wie können wir alle diese Beziehungen abbilden und für eine
Optimierung der Zielgrößen nutzen?
Statistische Verfahren Teil 1 Folie 1
Komplexität der Zusammenhänge - Grabsteineffekt
Gelb
- „potentieller“ Grabstein Rot
– Grabstein aufgetreten !
Bestück- und Druckversätze sind potentielle Verursacher von Grabsteinen!
Weitere Quellen:
Temperaturprofil
Konstruktion (thermische Senken)
Lotpasten, Oberflächen, … ??
weitere zahlreiche Wechselwirkungen ??
Statistische Verfahren Teil 1 Folie 2
SPC/Anwendung für den Bestückprozess
MFU/PFU/statistische Analysen
Reale Komponenten werden
durch hochgenaue
Glaskomponenten ersetzt
und werden vermessen durch
eine optische Inspektion
Nutzung dieses Prinzips und dessen erfolgreiche weltweite
Anwendung seit 20 Jahren !
Diese Idee wird auch in der IPC 9850 genutzt !
Statistische Verfahren Teil 1 Folie 3
Anwendung von QualitätsregelkartenUmsetzung in einem Lötprozess
Gute Fähigkeitswerte !
Tageswechsel
Überwachung von
Konvektionslötanlagen
durch Konstruktion eines
angepassten Regelkartensystems mit gleichzeitiger
laufender Aktualisierung
der Fähigkeitswerte !
Diese Lösung war ein Wechselspiel zwischen den mathematischen
Möglichkeiten und Voraussetzungen, den speziellen
Prozessbedingungen und den verfügbaren Ressourcen !
Statistische Verfahren Teil 1 Folie 4
Nachweis des Nutzens - Erfahrungen mit Fehlerraten
SMD-Reflow BS
60
50
49
42
dpm
40
Posit. ungenau
29
30
Grabsteineffekt
20
8
10
0
1.6.-1.9.
vor der Evaluierung und
Zeitraum
4.9.-2.11.
danach
Statistische Verfahren Teil 1 Folie 5
Alle Einzelprozesse in Ordnung!?
Trotzdem Fehler !
Ist nicht ausgeschlossen !!
Im Problemfall weiß man aber, wo
man nicht suchen muss !!
Statistische Verfahren Teil 1 Folie 6
Grenzen dieser Lösungen
Komponenten
Leiterplatten
Lotpaste
elektrische
Qualität
Ebenheit
Oberfläche
Alter
Zusammensetzung
geom. Form
Fremdschichten
Genauigkeit
Genauigkeit
Alter
Lagerung
Alter
Lötausrüstung
Luftreinheit
Temperatur
Maschineneigenschaften
 Funktion
 Zuverlässigkeit
gemessen an:
Lotpastendrucker
Bestückautomat
Baugruppenqualität
Umgebungsbedingungen
Erkennen von
Fehlern
Maschinenprogr.





Benetzung
Voids
Grabsteine
Lotperlen
…..
Bediener
Es wird nur ein bestimmter Teil der Einflüsse überwacht und optimiert !
Notwendig, aber nicht hinreichend !
Statistische Verfahren Teil 1 Folie 7
Einsatz der statistischen Versuchsplanung
Design of Experiments (DoE)
1.
Auswahl einer begrenzten Menge von Einflussgrößen
2.
Durchführung eines Versuchs mit verschiedenen Kombination der Einflussgrößen
3.
Analyse der Zusammenhänge zu bestimmten Zielgrößen (Voids, Benetzung,
Grabsteine, Lotperlen, ….) bei verschiedenen Komponenten (BGA‘s, QFN, Chips…).
Beispiel:
2
2
2
3
3
3
Oberflächen
Pastenhersteller
Korngrößen
Vorheizzeiten
Peaktemperaturen
Restsauerstofflevel
A
B
C
D
E
F
Statistische Verfahren Teil 1 Folie 8
chemSn, NiAu
gleiche Legierung
3 und 5
72..144 s
225, 235, 245 °C
100, 550, 1000 ppm
Erweiterte Möglichkeiten durch DoE
Leiterplatten
Komponenten
Lotpaste
elektrische
Qualität
Ebenheit
Oberfläche
Alter
Fremdschichten
Genauigkeit
Genauigkeit
Baugruppenqualität
Flussmittel
geom. Form
 Funktion
 Zuverlässigkeit
Korngröße
Alter
Alter
gemessen an:
Lötausrüstung
Luftreinheit
Lotpastendrucker
Bestückautomat
Maschineneigenschaften
Temperatur
Umgebungsbedingungen





Erkennen von
Fehlern
Temperaturprofil
Benetzung
Voids
Grabsteine
Lotperlen
…..
Bediener
Ermittlung der signifikanten Zusammenhänge zu den Zielgrößen
Ermittlung der signifikanten Wechselwirkungen zu den Zielgrößen
Statistische Verfahren Teil 1 Folie 9
Ergebnisgröße (z.B. Fehlerquote)
Beispiele für Probleme (1)
5.0%
4.5%
4.0%
3.5%
3.0%
2.5%
2.0%
1.5%
1.0%
0.5% 0.0
0.0%
5.0
35.0
10.0
15.0
20.0
25.0
30.0
Verfahrensgröße (z.B. Temperatur)
Gibt es einen Zusammenhang zwischen Verfahrensgröße und Ergebnisgröße?
Ist dieser Zusammenhang linear oder ist eine andere Beschreibung besser?
Wie sicher (signifikant) ist dieser Zusammenhang?
Statistische Verfahren Teil 1 Folie 10
Ein Beispielprozess
Die-Bonden mit Kleber
Wirebond
Globtop
Metallization
Solder Ball
SiSi-- Chip
Chip
Adhesive
PCB
(THT)
Bondpad
AlCu0,5
Prozessablauf: Kleber drucken (bzw. Dispensen)
Die-Bonden
Kleber aushärten (Curing)
Statistische Verfahren Teil 1 Folie 11
Ziele beim Die-Bonden (1)
Kleberaustritt:
muss vorhanden sein, darf aber die
Bondinseln nicht zudecken !
6300.0
Chipverwölbung (Warpage)
muss minimal sein
[µm]
6070.0
[µm]
0.000
Statistische Verfahren Teil 1 Folie 12
Ziele beim Die-Bonden (2)
Blasen zwischen
Substrat und Chip
Anzahl minimal !!
Größe minimal !!
Statistische Verfahren Teil 1 Folie 13
Fragen zum Beispielprozess Die-Bonden
Hauptziel der
Analyse
Betrachtete
Einflussgrößen im
Prozess
z.B.
gedr. Klebervolumen
Bondkraft

Bondzeit
Aushärtegradient
usw.

Zielgrößen
Existiert ein
Zusammenhang
??
Optimierung von:

Wenn ja
Welcher ?
Minimierung des
Einflusses von
Störgrößen !

Verbesserung der
Produktqualität
Verbesserung der
Fähigkeit,
Stabilität,
Robustheit und
Beherrschbarkeit
Statistische Verfahren Teil 1 Folie 14
Kleberaustritt in einem
bestimmten Bereich
Minimierung der
Verbiegung des Dies
Minimierung der
Blasen zwischen
Substrat und Chip
usw.
Präzisierung der Ziele (1)
Optimierung:
Ermittlung eines Minimal- ; eines Maximalwert oder
einer gezielten Einstellung für eine oder mehrere Zielgrößen
(Als alleiniges Ziel, Anwendung der SVP nicht unbedingt nötig)
Fähigkeit:
Erreichung von Mindestwerten für die Maschinen- und
Prozessfähigkeitswerten Cmk bzw Cpk (minimal >1,33)
Stabilität:
Unabhängigkeit von der Zeit
Robustheit:
weitgehende Unabhängigkeit von Störungen
(Taguchi-Methoden)
Beherrschtheit: bewusstes und gezieltes Ändern der Zielgrößen möglich !
Statistische Verfahren Teil 1 Folie 15
Präzisierung der Ziele (2)
Prozessbeherschung und -beurteilung durch u.a. statistische Methoden:
wie z.B.: SPC
Statistical Process Control
Regression- und Korrelation
DoE
Design of Experiments
(Statistische Versuchsplanung)
Fehlervermeidung, nicht Fehlerbehebung
Statistische Verfahren Teil 1 Folie 16
Präzisierung der Ziele (3)
Jeder Prozess unterliegt zufälligen Einflüssen! Zufällige Einflüsse sind
zu erkennen und deren Auswirkungen sind zu minimieren !
Systematische Einflüsse sind zu finden und bewusst auszunutzen!
U nbeherrschter
Zustand
Streuung M ittelw ert
zu groß verschoben
Zielzustand
To
Tu
Statistische Verfahren Teil 1 Folie 17
Wiederholung
Stetige Qualitätskenngrößen
Die Qualitätskenngröße kann (theoretisch) unendlich
viele verschiedene Werte annehmen !
Die Qualitätskenngröße ist (prinzipiell) messbar !
Beispiele in der Elektronikfertigung:
Versätze (beim Drucken, Bestücken, Dispensen
Temperaturen (beim Löten)
Widerstände, Kapazitäten von Bauelementen
Schaltzeiten von Baugruppen
Schichtdicken, Rauheiten
……
Statistische Verfahren Teil 1 Folie 18
Verteilungsdichte f(x)
f(x)
P(xab)
a
x
b
Verteilungsdichte f(x)

f (x)  0
f (x) 
für beliebige
x
P ( x  X  x  dx )
dx
 f ( x )dx 1
b
P xab   P a  x  b    f x  dx

a
Statistische Verfahren Teil 1 Folie 19
Verteilungsfunktion F(x)
Somit gilt auch :
x
F x   P  X  x    f  d

F(x)
1
P( X  x )  1 F ( x )
F(xi)
xi
x
Pxab  P a  x  b   F b   F a 
Statistische Verfahren Teil 1 Folie 20
Parameter
Prinzipiell analog zu den diskreten Größen !!

  E X  
Erwartungswert
 xf ( x )dx


  D X    ( x   )2 f ( x )dx
2
Streuung
2

z.B. 2=400 µm2
Standardabweichung
   2  D 2 X 
z.B. =20 µm Das ist anschaulicher !!
Statistische Verfahren Teil 1 Folie 21
Die Normalverteilung
Maximalwert

1
f (x) 
e
2 
f(x)
( x   )2
2 2
Wendepunkt


E X   
D 2 X    2



F ( x )  P( X  x ) 
Statistische Verfahren Teil 1 Folie 22
x
1
2 
x
 e


(    )2
2 2
d
Normalverteilung
99.73%
95.4%
68.3%
-3s
-2s
-1s
0
1s
2s
3s
Statistische Verfahren Teil 1 Folie 23
Normalverteilung- „Handling“
1. Normalverteilung X mit Erwartungswert  und
Streuung
2  N(,2)
2. transformierte Normalverteilung 1
X‘=X-   N(0,2) = „zentrieren“
3. transformierte Normalverteilung 2
X‘=X/   N( ,1) = „normieren“
4. transformierte Normalverteilung 3
X 
Z
 N(0 ,1) = „standardisieren“

Die standardisierte Normalverteilung ist tabelliert !
Statistische Verfahren Teil 1 Folie 24
g(x) bzw. g(u)
Grafische Veranschaulichung der Standardisierung

-4
-4
-3
-2
-3
-2
-1

-1
0
+1
1
+2
+3
2
3
+4
x-Achse
u-Achse
4
Die Normalverteilung wird verschoben und gestreckt bzw. gestaucht !
Statistische Verfahren Teil 1 Folie 25
Beispiel
systematischer Versatz in x-Richtung x = 10 m
Standardabweichung
x =20 m
Gesucht:
Anteil mit einem Versatz von größer als
+/-50 m
f(x)
x =20 µm
Tu =-50 µm
Statistische Verfahren Teil 1 Folie 26
x =10 µm
To=50 µm
x
Lösung: Versatz ist Zufallsgröße X

 
p  P  X  Tu  X  To
Standardisierung
Z
X  

x
  P X  Tu   P X  To 

N(0, 1)-Verteilung
x
 X  
 X  
To  
Tu   
x
x
x
x




P

pP
 
  




x
x
x 
x


To   
Tu   
x
x



P Z
P Z 

 





x 
x 




T   
T   
  50  10 
 50  10 
p   u
  1   o
  
  1  

20
20










  3   1  2  1  0,99865  1  0,97725  0,0241  2,41%
Statistische Verfahren Teil 1 Folie 27
Statistische Verfahren Teil 1 Folie 28
Normalverteilung – Nutzung von Quantilen
Widerstände- Laserabgleich
Geg:
=50
pa < 1 % (Ausschussquote)
obere Toleranzgrenze =1100
Gesucht:
maximaler Arbeitspunkt ??
T 
 X   To   

pa  P  X  To   1  P 

  1  P  Z  o








T   
 1   o

  
u0,99  2,3263 
 1100   

0,01  1  
50



1100   
50 
  983,685 
Arbeitspunkt muss kleiner als 983,685 Ω sein, damit die
Ausschussquote pa 1 % nicht übersteigt.
Statistische Verfahren Teil 1 Folie 29
Berechnung statistischer Maßzahlen
Rechenvors chrift
( x1, x 2 ,...., x n ) 
   statistische Maßzahl
Arithmetischer Mittelwert
.
Median (Zentralwert)
x~
1 n
x   xi
n i 1
Urwerte:
9,35; 9,90; 9,65; 10,25; 9,45; 9,85 10,05 10,40; 9,55.
geordnet
9,35; 9,45; 9,55; 9,65; 9,85; 9,90; 10,05;10,25; 10,40.
Statistische Verfahren Teil 1 Folie 30
Berechnung statistischer Maßzahlen
Empirische Streuung
1  n 2
1 n
2
2


s 
x
x
x
n
x
(
)





i
i


n  1 i 1
n  1  i 1

2

1 n
1 n 2
2
s   ( xi   )    xi  n 2 
n i 1
n  i 1

2
(1)
(2)
f  n  1 Anzahl Freiheitsgrade
Formel 2 (µ geg.)
Formel 1
n=1
n=2
x  x1
s2 nicht
berechenbar !
  x1
s2 berechenbar !
x  ( x1  x2 ) / 2
s2 bei beiden berechenbar; in der Regel keine gleichen Ergebnisse
Durch die Nutzung des Mittelwerts aus der
Stichprobe wird ein Freiheitsgrad verbraucht
Durch die Vorgabe des Mittelwerts wird
kein Freiheitsgrad verbraucht !
Statistische Verfahren Teil 1 Folie 31
Punktschätzungen von Qualitätskenngrößen
Stichprobenwerte x1, x2, ... xn
Rechenvorschrift
  ̂
( x1, x2 ,...., xn ) 
̂
ist eine Punktschätzung !
Zeichen "^" ist Kennzeichnung dafür, dass es eine Schätzung ist !!
Gewünschte Eigenschaften einer Schätzung:
1. Erwartungstreue (Unverzerrtheit)
2. passend (konsistent)
3. hinreichend (erschöpfend)
4. Wirksamkeit (Vergleich zu anderen Schätzungen)
Statistische Verfahren Teil 1 Folie 32
Schätzungen für den Mittelwert µ:
Durch den arithmetischen Mittelwert:
̂  x
Schätzwert ist erwartungstreu, konsistent, erschöpfend und
am wirksamsten!
Durch den Median:
ˆ  x~
Schätzung ist nur asymptotisch erwartungstreu, aber nicht
erschöpfend.
Statistische Verfahren Teil 1 Folie 33
Statistische Verfahren Teil 1 Folie 34
Statistische Überprüfungen-Problemstellung
Beispiel: Überprüfung eines Bestückers
Stichprobe n=10
Versatz in x-Richtung wurde vermessen (Sollwert =0)
Ergebnis:
Frage:
oder
x  5,2 μm
Bestücker systematisch „verstellt“
Abweichung vom Sollwert zufällig !
Mögliche Schlussfolgerung:
Bei einer Systematik kann (nicht muss !!) eine Korrektur der
Maschine erfolgen !
Bei zufälligen Abweichungen machen Korrekturen keinen
Sinn !!!
Statistische Verfahren Teil 1 Folie 35
Überprüfung von stetigen Qualitätskenngrößen
Grundprinzipien
Ausgangspunkt : Prozess ist gut !! (Bestücker arbeitet o.k.!!)
Vergleich Gericht:
Am Beginn des Prozesses ist der Angeklagte unschuldig !
Hypothese:
Ho
µ=µo
Aufgabe der Überprüfung :
Fehler im Prozess nachweisen, d.h Hypothese rückweisen !!
Schuld des Angeklagten ist nachzuweisen !!
Herangehensweise:
Stichprobe entnehmen und auswerten !
Indizien und Beweise sammeln !
Gelingt es nicht, die Hypothese zurückzuweisen:
Am Prozess wird nichts geändert !
Der Angeklagte wird freigesprochen !
Unterschied zum Gericht: Der statistische Nachweis ist ein „Indizienbeweis“ !!
Statistische Verfahren Teil 1 Folie 36
Überprüfung von stetigen Qualitätskenngrößen
Grundgesamtheit


Stichprobe
x

o
Stichprobenentnahme
Berechnung der Mittelwerte

n
Verteilung der Mittelwerte
Stichprobenfunktionen

 2 

X  N ,


n



G
u
G
o
o
x
Statistische Verfahren Teil 1 Folie 37
Berechnung der Grenzen
1


0

 o
Gu,o  0  u1 / 2

n
u 1-

n
Hypothese Ho (µ=µ0) wird abgelehnt, wenn der gemessene Mittelwert
sich nicht in Gu,o befindet !!
Sprechweise: ermittelter Mittelwert ist signifikant unterschiedlich zum
Sollwert !
Statistische Verfahren Teil 1 Folie 38
Berechnung der Grenzen und Auswertung
Gu,o   0  u1 / 2

n
Zusätzlich geg:  = 7 µm
x  5,2 μm 
(n=10)
Gu
Go
α=0,27%
-6,641
6,641
α=1,00%
-5,702
5,702
α=5,00%
-4,339
4,339
n (α=1 %)
Gu
Go
5
-8,064
8,064
10
-5,702
5,702
50
-2,550
2,550
xxx zufällige Abweichung
xxx systematische Abweichung
Aussageergebnis hängt u.a. vom vorgegebenen Irrtum erster Art ab !
Das ist kein Fälschen der Statistik !
Statistische Verfahren Teil 1 Folie 39
Einseitige Überprüfungen von Arbeitspunkten
Sind angebracht, wenn die Abweichung des Qualitätsmerkmals nur nach
einer Seite kritisch ist! Verlagerung des Irrtums 1. Art auf die kritische
Seite!
Gu  0  u1
Go  0  u1

n

n
Go  
für μ  μo
Gu  
für
μ  μo
Beispiel:
Widerstandsfertigung mit anschließendem Laserabgleich
zu große Widerstandswerte sind kritisch
zu kleine Widerstandswerte (in gewissen Grenzen) sind unkritisch
 Hypothese Ho µ<µo verwenden !
Regel: Wenn eine einseitige Überprüfung möglich und sinnvoll
ist, ist sie der zweiseitigen Überprüfung vorzuziehen!!
Statistische Verfahren Teil 1 Folie 40
Berechnung der Grenzen
Standardabweichung unbekannt
Standardabweichung wird aus der Stichprobe geschätzt !
s
Gu,o   0  t n 1;1 / 2
T 
Stichprobenfunktion
X 
n
S
n
Vergleich der Ergebnisse zur Normalverteilung (s=7 µm)
(n=10)
α=0,27%
α=1,00%
α=5,00%
Go Normalverteilung
6,641
5,702
4,339
Go t-Verteilung
9,55
7,58
5,28
n (α=1 %)
Go Normalverteilung
Go t-Verteilung
5
8,064
14,41
10
5,702
7,19
50
2,550
2,65
Einseitige Schätzung analog !
Quantile der t-Verteilung (tn,1-), siehe Tabelle 3
Statistische Verfahren Teil 1 Folie 41
Prüfung der Streuung
Vorgabe einer Sollstreuung
Zufallsgröße S2
S2 
Z
2
n 1
 2   o2
 o2  Hypothese Ho :
Z ist 2-verteilt


2
n-1; 
0
Gu 
 2n 1; / 2
n 1
 o2
Go 
 n2 1;1 / 2
n 1
2
n-1
 o2
Befindet sich die ermittelte Streuung s2 nicht in diesem Intervall, dann
liegt ein signifikanter Unterschied vor!!
Quantile der 2- Verteilung siehe Tabelle 4
Statistische Verfahren Teil 1 Folie 42
Prüfung der Streuung
Die zweiseitige Überprüfung der Streuung ist in der Praxis die
Ausnahme !
Zu kleine Streuungen sind unschädlich !
Sie machen aber eventuell auf Messfehler und falsche
Vorgaben aufmerksam!
Verwendung einer einseitigen Überprüfung mit der Hypothese:
 2   o2
Überprüfung auf eine vorgegebene Maximalstreuung
Go 
 2n 1;1
n 1
 o2
 o2
Statistische Verfahren Teil 1 Folie 43
Vergleich von Mittelwerten
Aufgabe :
Vergleich von zwei Messgeräten
Zeigen beide Geräte für ein gleiches Objekt im Mittel die
gleichen Messwerte an?
zwei Maschinen (fertigen z.B. die gleichen Produkte)
Gibt es Unterschiede bei der Betrachtung eines
bestimmten Qualitätsmerkmals?
Benötigte Daten: zwei Stichproben mit
n1 Messwerten (erste Maschine)
x11  x1n1
x1
s1
n2 Messwerten (zweite Maschine).
x21  x1n2
x2
s2
Stichprobenumfänge sind nicht notwendig gleich, dies ist aber
empfehlenswert.
Statistische Verfahren Teil 1 Folie 44
Vergleich von Mittelwerten
Ein signifikanter Mittelwertunterschied ist vorhanden,
wenn:
x1  x2
n1  1s12  n2  1s22
n1  n2  2
n1  n2
n1 n2
 tn1n2 2;1
Bei Gleichheit der Stichprobenumfänge:
x1  x 2
s12
 t 2( n 1);1
 s22
n
Statistische Verfahren Teil 1 Folie 45
Vergleich von Mittelwerten
Berechnung des notwendigen Stichprobenumfangs
1
2
n
n
2
1

u1


d
u2

1 und 2 beider Versuche sind bekannt und gleich ()
d
zu erkennender Mittelwertunterschied
α
µ1=µ2 Risiko, dass die Gleichheit nicht erkannt wird
β
µ1<>µ2 Risiko, dass die Ungleichheit nicht erkannt wird
Gesucht : n für eine Stichprobe
Statistische Verfahren Teil 1 Folie 46
Berechnung des notwendigen Stichprobenumfangs
2
u1  1  u1
2
u2  2  u1 
n
n
Überlappen sich u1 und u2 kein signifikanter Unterschied !!
u1  u2
einfacher Stichprobenumfang
 u1  u1 
n 
d

2
 2
 

140
120
100
n ist der einfache
Stichprobenumfang !!!
n
80
60
40
Diagramm gilt für:
α=10 %
β= 1%
20
0
0,5
1
1,5
2
2,5
3
sigma/d
Statistische Verfahren Teil 1 Folie 47
Vergleich von Streuungen
 12
und Prozess 2 mit  22
H o :  12   22
Prozess 1 mit
Prozess 1 Stichprobe n1
Ergebnis:
s12
2
Prozess 2 Stichprobe n2 (nicht notwendig gleich n1) Ergebnis: s 2
Prüfgröße f :
f 
s12
s22
f ist F-verteilt (siehe Stichprobenfunktionen) ; ist die Hypothese
richtig, weicht f nur zufällig von eins ab !!
s12
s22
 Fn1 1;n2 1; / 2
s12
s22
 Fn1 1;n2 1;1 / 2
Beide Ungleichungen müssen erfüllt sein !
Statistische Verfahren Teil 1 Folie 48
Vergleich von Streuungen
Typischer sind einseitige Überprüfungen!
 12   22
Ho
Ablehnung bei:
s12
s22

1
 Fn 1;n 1; 
 1 2
Fn2 1;n1 1;1

 Fn1 1;n2 1;




 12   22
Ho
Ablehnung bei:
s12
s22
 Fn1 1;n2 1;1
Statistische Verfahren Teil 1 Folie 49
Überprüfung von Verteilungen
Was heißt es :
Normalverteilung ist nicht abgelehnt
oder Normalverteilung ist abgelehnt
Schritt 1: Gemessene Daten
Beispiel: n=10
-3,3
1
5,5
3,1
0,2
-6,5
8,5
-1,1
-0,1
1,5
Schritt 2: Berechnung von Mittelwert und Standardabweichung
x  0,88
s  4,24
Schritt 3: Sortierung der Daten
-6,5
-3,3
Statistische Verfahren Teil 1 Folie 50
-1,1
-0,1
0,2
1
1,5
3,1
5,5
8,5
Zeichnen der theoretischen Verteilung
= Gerade im Wahrscheinlichkeitsplot
99,9
99,8
99,9
99,8
99,5
99
98
99,5
99
98

95
95
90
90

80
80
70
60
50
40
30
70
60
50
40
30
20
20

10
10
5
5
2 
1
0,5
2
1
0,5
0,2
0,1 
0,2
0,1
-10
-8
-6
-4
-2
0
x  2s  7 ,605
2
4
6
8
10
x  0,88
Statistische Verfahren Teil 1 Folie 51
Zeichnen der geschätzten Verteilung
= Treppenfunktion im Wahrscheinlichkeitsplot
99,9
99,8
99,9
99,8
99,5
99
98
99,5
99
98

95
95
90
90
80

80
70
60
50
40
30
20
70
60
50
40
30
 1/n*100%  10 %
20

10
10
5
5
2
1
0,5

2
1
0,5
0,2
0,1
0,2
0,1 
-10
-8
-6
x1
-4
-2
x2
0
2
4
8
x3
Exakterer Funktionswert der „Stufen (nicht die Höhe !) für n<30:
Statistische Verfahren Teil 1 Folie 52
6
F (i ) 
3i  1
3n  1
10
Überprüfung mit dem Kolmogorov-Smirnov-Test
– Suchen nach der maximalen Differenz
99,9
99,8
99,9
99,8
99,5
99
98
99,5
99
98

95
95
90
90
80

D1o
80
D1u
70
60
50
40
30
20
70
60
50
40
30
20

D7o=14 %
10
5
10
5
2 
1
0,5
2
1
0,5
0,2
0,1 
0,2
0,1
-10
-8
-6
-4
-2
0
2
4
6
8
10
 Keine Ablehnung
Tabelle 9 n=10 ε=95 % Dmax=25,8 %
Bemerkung: Kolmogorov-Test (Tabelle 8) arbeitet mit bekannten Mittelwert und bekannter Streuung !
Statistische Verfahren Teil 1 Folie 53
Bereichs- bzw. Konfidenzschätzungen für Arbeitspunkte
̂  9,98 k
Geg: Mittelwert
  0,03 k
Standardabweichung
Bereich (Intervall) [gu, go] für den Arbeitspunkt  in der er sich mit
einer Wahrscheinlichkeit  (oder 1-) befindet
Ho :   o keine Ablehnung wenn:
Ges.
x  o

n  u1 / 2
Umstellung der Ungleichung nach µo
x  u1 / 2

n
   x  u1 / 2
g u  x  u1 / 2

n

n
g o  x  u1 / 2

n
Liegt der Sollwert nicht im Intervall, dann liegt eine signifikante systematische
Abweichung vor! (Gleiches Ergebnis wie bei den Hypothesen). Zusätzlich sind
aus der Größe des Intervalls noch Schlussfolgerungen für die Unsicherheit der
Aussage möglich !
Statistische Verfahren Teil 1 Folie 54
Bereichs- bzw. Konfidenzschätzungen für Arbeitspunkte
einseitige Konfidenzintervalle:

g u  x  u1
go  
n
bzw.   
gu  0
g o  x  u1

n
Standardabweichung unbekannt  Verwendung der t-Verteilung:
s
n
g u  x  t n 1;1 / 2
g o  x  t n 1;1 / 2
s
n
Beispiel: (für n=10 und =1 %):
Normalverteilung
9,955 k
10,004 k
gu
go
t-Verteilung
9,949 k
10,011 k
Statistische Verfahren Teil 1 Folie 55
Bereichsschätzungen von Streuungen/Standardabweichungen
zweiseitige Bereichsschätzung für die Standardabweichung:
gu 
n 1

2
n 1,1 / 2
go 
s
n 1
 n21, / 2
s
einseitige Schätzungen:
gu  0
go 
n 1
 n21,
s
go  wie groß ist die Standardabweichung im ungünstigsten Fall!
 pessimistische Abschätzung der Standardabweichung.
gu 
n 1
 n21,1
s
go  
gu  wie klein ist die Standardabweichung im günstigsten Fall!
 optimistische Abschätzung der Standardabweichung.
Statistische Verfahren Teil 1 Folie 56
Einige Begriffe
Störgrößen
S
Umgebung usw.
Einflussgrößen
X 
Prozess
?
Prozessparameter
Materialparameter
Zielgrößen
Y 
z.B. Qualität
Y  f  X   g S 
zentrale Aufgaben:
f Abhängigkeit der Zielgrößen von den Einflussgrößen ermitteln !!
f wird im Folgenden als ein Modell bezeichnet !
g Abhängigkeit der Zielgrößen von Störgrößen minimieren !!
Lösung mittels statistische Methoden !!
Statistische Verfahren Teil 1 Folie 57
Regressionsanalysen
Einfache (simple) lineare Regression
Demonstrationsbeispiel Dispenser
Für einen Lotpastendispenser soll
eine Steuerung programmiert
werden. Zielgröße ist das
ausgebrachte Volumen. Zur
Ermittlung der Abhängigkeiten
zwischen den am Dispenser
einstellbaren Größen und der
Zielgröße wird u.a. die Dauer des
Druckluftimpulses d für eine
bestimmte Lotpaste mit
d = 0,8 (0,1) 2,7 (in s) variiert. Das
Volumen V wird gemessen. Es wird
davon ausgegangen, dass beim
Messen des Volumens und der
Zeitdauer des Druckluftimpulses
keine Messfehler vorhanden sind.
58
Demonstrationsbeispiel Dispenser
Diskussion der Einflussgrößen
Auf das ausgebrachte Volumen haben einen
Einfluss:
• Druck des Druckluftimpulses
• Länge des Druckluftimpulses
• Durchmesser der Dispensernadel
• Länge der Dispensernadel
• Füllstand der Kartusche
• Eigenschaften der Lotpaste (insb.Viskosität)
• Umgebungsbedingungen (insb. Temperatur)
Die Länge des Druckluftimpulses ist hier die Einflussgröße (bzw. unabhängige
Größe), das Volumen die Zielgröße (bzw. abhängige Größe)
Alle anderen Größen sind Störgrößen, die möglichst konstant zu halten sind !
Vor dem Versuch ist zu klären, ob dies möglich ist, bzw. welche Auswirkungen
mögliche Schwankungen haben. Schwankungen sind aufzuzeichnen !
Zu erwartende Ergebnisse:
Linearer Zusammenhang zwischen Zeit und Volumen vermutet !
Es existiert eine Mindestzeit, ab der Lotpaste ausgebracht wird !
Statistische Verfahren Teil 1 Folie 59
V
[mm )
0,026
0,104
0,070
0,065
0,114
0,099
0,264
0,185
0,304
0,382
0,302
0,346
0,460
0,484
0,442
0,476
0,495
0,634
0,603
0,619
Versuchsergebnisse
3
0,7
0,6
0,5
Volumen
t
[s]
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
0,4
0,3
0,2
0,1
0
0,5
1
1,5
2
2,5
3
Zeit
Frage:
Gibt es einen linearen Zusammenhang zwischen Dispenszeit
und Volumen ???
Statistische Verfahren Teil 1 Folie 60
Frage:
Gibt es einen linearen Zusammenhang zwischen
Dispenszeit und Volumen ???
V  Vo  b t
bzw.
allg.
y  a  bx
Diese Gleichung ist ein Modell !!
Die Zeit t (allg. x) ist hier die unabhängige Variable. Das
Volumen V (allg. y) ist hier die abhängige Variable. Diese
Zuordnung ist nicht immer möglich und hängt vom Problem
ab!
Ein lineares Modell ist das einfachste denkbare Modell !!
Prinzipiell sind alle mathematischen Zusammenhänge
denkbar !!
Statistische Verfahren Teil 1 Folie 61
Methode der kleinsten Quadrate
Gleichung der
Gerade
y=a+bx
y-Achse
Yi
a
ri

(Xi , Yi)
Residuum

0
Xi
x-Achse
Die Methode der kleinsten Quadrate schätzt a und b so, dass
ri1 2 + ri2 2 … + rin 2 so klein wie möglich ist
Statistische Verfahren Teil 1 Folie 62
Orthogonale Regression
Gleichung der
Gerade
y=a+bx
y-Achse
Yi
(Xi , Yi)
a

Xi
x-Achse
0
Die orthogonale Regression minimiert die rechtwinkligen quadrierten
Abstände zur Gerade !
Die Ergebnisse unterscheiden sich von der “normalen” Regression !
Statistische Verfahren Teil 1 Folie 63
Mathematische Umsetzung
yˆ i  a  b xi
yˆ i
n
 y
i 1
Schätzung der Zielgröße bei bekannten a und b und geg. xi
i
n
 yˆ i    y i  a  b x i   Minimum
2
2
i 1
n
Q XY   x i  x y i  y 
i 1
n
Q XX   x i  x 
2
i 1
QYY, QXX – Summe der quadratischen Abweichungen
s
Q
bˆ  XY  xy2
Q XX
sx
aˆ  y  bˆ x
s XY
1 n

 xi  x y i  y  
n  1 i 1
Statistische Verfahren Teil 1 Folie 64

1  n
  x i y i  n x y 
n  1  i 1

Kovarianz
n
 y
Weiterhin gelten:
i 1
i
n
2
i 1
2
i 1
Qgesamt  QRegression
Variation ohne
Modell
QGesamt
y
n
 y    yˆ i  y    y i  yˆ i 
2
 QRest
Modell
Variation des
Modells
QRegression
y
Variation mit
Modell
Qrest
x
x
Das Modell (Regressionsgerade) muss durch den Punkt [ x , y ] gehen !
Statistische Verfahren Teil 1 Folie 65
Beispielergebnisse
a=-0,253
b= 0,329
0,700
0,600
Volumen
0,500
0,400
0,300
0,200
0,100
0,000
0,5
1
1,5
2
2,5
3
Dispenszeit
Modell nur innerhalb des Wertebereichs des Experiments gültig !
Extrapolationen sind unzulässig !!
a= -0,253 ist kein negatives Volumen bei t=0 !!
Statistische Verfahren Teil 1 Folie 66
Bestimmtheitsmaß Bxy und
Korrelationskoeffizient rxy
n
rxy 
s xy
sx sy

 x
i 1
n
i
 x y i  y 
n
2




x
x
y
y


 i
 i
2
i 1

Q XY
 0,9732
Q XX QYY
i 1
 1  rxy  1
Bxy  rxy2  0,9471  94,71%
94,71 % der Änderungen des Volumens wird durch das Modell beschrieben !
Bxy adj  1 
QRe st /(n  p )
 94,42 %
Qyy /(n  1)
„Adjustiertes“ Bestimmtheitsmaß; wird benutzt für Vergleiche
p – Anzahl der geschätzten Parameter (hier p=2)
Statistische Verfahren Teil 1 Folie 67
Verschiedene Plots für B=R2  0.50
Das Bestimmheitsmaß liefert nur eine Teilaussage über den Grad des
Zusammenhangs !
Statistische Verfahren Teil 1 Folie 68
Interpretation von Regressionsdaten
Strenge positive
Korrelation r1
Strenge negative
Korrelation r-1
Moderate positive
Korrelation r0,5
Moderate negative
Korrelation r-0,5
Keine Korrelation
r0
Anderes Bild
Keine lineare
Korrelation
Statistische Verfahren Teil 1 Folie 69
Überprüfung des Korrelationskoeffizient rxy auf
Unabhängigkeit
Ein Korrelationskoeffizient von rxy=0 wird sich nie exakt ergeben !
Frage: Wann unterscheidet sich der Koeffizient nur zufällig von Null !
oder Test auf Unabhängigkeit der Merkmale !
Hypothese:
 xy  0
ρxy ist der wahre aber unbekannte Koeffizient !
Bei Bestätigung : Der beobachtete Korrelationskoeffizient unterscheidet sich nur zufällig von
Null !
Testgröße:
Tˆ 
r xy n  2
1  r xy2
 t n 2;1
Bei Gültigkeit: Nichtablehnung der Hypothese !
Beispiel:
rxy=0,54 n=15 α=1%
Tˆ  2,32 t13;0,99  2,65
Lösung:
 Keine Ablehnung:
d.h. der untersuchte Zusammenhang kann trotz des relativ hohen Koeffizienten nicht existent
sein !
Weitere Lösungsmethode: Nutzung der Tabelle 9 (Zufallshöchstwerte für den
Korrelationskoeffizienten)
Statistische Verfahren Teil 1 Folie 70
Überprüfung des linearen Zusammenhangs zwischen
zwei Merkmalen
Hypothese:
 xy   0
ρ0 - vorgegebener Grad des Zusammenhangs
U
Transformation:
d.h.
W  W
W
W 
1 1  R xy
ln
2 1  R xy
mit
W  ln
ρ0 =0,8
z.B.:
1
2
ist asymptotisch normalverteilt
0
1 0

1   0 2(n  1)
rxy=0,6
W=1,12
w= 0,693
 N (0,1)
n=20
 W2 
1
n 3
α=5 %
W=0,2425
Testgröße
u
= -1,7586
Vergleichsgröße u1-α/2= 1,96
u  u1 / 2
zweiseitige Überprüfung !
keine Ablehnung
Statistische Verfahren Teil 1 Folie 71
Vergleich zweier Korrelationskoeffizienten
Gegeben:
Prozess 1
Prozess 2
r1=0,8
r2=0,6
n1=40
n2=50
Frage: Unterscheiden sich die Korrelationskoeffizienten signifikant??
ρ1= ρ2
Hypothese:
U
W1  W2
 W2 1   W2 2
 N (0,1)
(näherungsweise)
w1=1,0986
w2=0,6931
Testgröße
u
= 1,8449
Vergleichsgröße u1-α/2= 1,96
u  u1 / 2
Statistische Verfahren Teil 1 Folie 72
zweiseitige Überprüfung (α=5%)!
keine Ablehnung
Residuen
(Differenz zwischen Modell und Beobachtung)
y i  yˆ i 
Berechnung:
x-Achse=Modell
Residuen (Dispenserbeispiel)
0,1
0,08
0,06
Die Residuendarstellungen dürfen keinerlei
systematische Auffälligkeiten aufweisen ! Die
Residuen müssen rein
zufällig streuen und normalverteilt sein !!
Die Definition (Skalierung / Reihenfolge)
der x-Achse kann
verschieden sein !
0,04
0,02
0
-0,02
0
5
10
15
20
-0,04
-0,06
-0,08
-0,1
Statistische Verfahren Teil 1 Folie 73
Residuen
Residuen
Auffällige Residuenverläufe
Einflussgröße x
Nichtlinearer Zusammenhang
Abhilfe:
Nichtlineare Regression !
Statistische Verfahren Teil 1 Folie 74
0
5
10
15
20
Versuchsreihenfolge
Zusätzlicher Effekt durch die
Versuchsreihenfolge
25
30
Auffällige Residuenverläufe
Residuen
Die Schätzwerte ŷ i werden auf der x-Achse
aufgetragen !
Ein solches Bild deutet auf eine Abhängigkeit der Standardabweichung von der
Größe der Zielgröße hin.
Alle Regressionsrechnungen gehen von
einer Konstanz dieser Standardabweichung aus.
Abhilfe:
Kleinerer Versuchsbereich
Box-Cox-Transformation
Transf. zur Streuungsstabilisierung
Zielgröße (Modell)
yt  y 
Statistische Verfahren Teil 1 Folie 75
80
80
40
40
40
0
-40
Residuum
80
Residuum
Residuum
Praxisbeispiel
0
-40
-40
-80
-80
-80
150
200
250
300
350
400
450
0
vorhergesagt
200
400
600
2
800
80
40
40
40
0
-40
Residuum
80
0
-40
-80
80
120
160
200
Bondzeit
3,2
3,5
3,8
8
10
0
-80
0
2
4
6
Bondkraft
8
10
0
2
4
6
Curegradient
Verschiedene Residuendarstellungen in einer Versuchsplanung;
Markiert sind die jeweils gleichen Einzelergebnisse
Nicht in jeder Darstellung fallen diese Punkte auf !
Statistische Verfahren Teil 1 Folie 76
2,9
-40
-80
40
2,6
Volumen
80
0
2,3
Reihenfolgenummer
Residuum
Residuum
0
Analyse des Geradenanstiegs b
Berechnung der Reststreuung sR2 (=Streuung der Residuen)
sR2 
bu,o
1  Bxy
QYY
sR  0,0472943
n2
s t
s t
 bˆ  R n 2;1 / 2  bˆ  R n 2;1 / 2
(n  1) s x
Q XX
 0,2908/0,3 679
Intervall enthält nicht den Wert Null, also ist der Anstieg der Gerade signifikant
(mit max. α % Wahrscheinlichkeit) Zusammenhang signifikant !!
Weitere Analyse von b:
α
bu
5,0%
0,2908
1,0%
0,2766
0,1%
0,2574
0,01%
0,2383
bo
0,3679
0,3822
0,4013
0,4204
Evaluation
*
**
***
****
indifferent
signifikant
hoch signifikant
höchst signifikant
Die Bewertung wird vergeben, wenn das Intervall den Wert Null nicht enthält !!
Wenn alle Intervalle den Wert Null enthalten  Bewertung „–“
 kein Zusammenhang bei diesem Stichprobenumfang nachweisbar !
Statistische Verfahren Teil 1 Folie 77
Analyse des Geradenabschnitts a
au,o  aˆ  sR
1 x2
1
x2

t n 2;1 / 2  aˆ  sR

t n 2;1 / 2
n Q XX
n (n  1)s x2
Konfidenzintervall der Regressionsgerade (Hyperbeln)
1 x  x 

g u,o ( x )  aˆ  bˆx  sR
t n 2;1 / 2
n (n  1)s x2
2
Statistische Verfahren Teil 1 Folie 78
 -0,3238 / - 0,1818
Verschiedene Signifikanzen
**** - Abhängigkeit
- Abhängigkeit
Plot of Fitted Model
ZG = -0,2530105 + 0,3295489*EG
Plot of Fitted Model
ZG2 = -0,264888 + 0,3318797*EG2
0,51
0,8
0,48
0,6
ZG
ZG2
0,45
0,42
0,4
0,39
0,2
0,36
0,33
0
0,8
1,2
1,6
2
2,4
2
2,8
2,04
2,08
2,12
2,16
2,2
EG2
EG
Die grünen Geraden zeigen den Schwankungsbereich der Regressionsgerade!
Statistische Verfahren Teil 1 Folie 79
Volumen
0,434
0,383
0,458
0,385
0,368
0,468
0,356
0,336
0,425
0,461
0,497
0,37
0,507
0,503
0,405
0,446
0,466
0,416
0,427
0,497
„Präzisere Analyse“
Einschränkung des Versuchsbereichs und feineres
Abtasten!
 Bessere Ergebnisse??
0,55
0,5
Volumen
Zeit
2
2,01
2,02
2,03
2,04
2,05
2,06
2,07
2,08
2,09
2,1
2,11
2,12
2,13
2,14
2,15
2,16
2,17
2,18
2,19
Statistische Verfahren Teil 1 Folie 80
0,45
0,4
0,35
0,3
2
2,05
2,1
Dispenszeit
2,15
2,2
Vergleich der Ergebnisse
Mittelwert Zeit
Standardabweichung Zeit
"Präzise"
Analyse
2,095
0,0592
Die scheinbar präzisere Analyse
erste
führt zu einem enttäuschenden
Analyse
Ergebnis (besonders das
1,75
0,5916 Bestimmtheitsmaß)
Mittelwert Volumen
Standardabweichung Volumen
0,4304
0,0522
Kovarianz
0,0012
 Schlussfolgerung hier
0,3236  Kein Zusammenhang
0,2002 obwohl die Geradenparameter
fast identisch und die Rest0,1153 streuung sogar kleiner ist !
0,3759
14,13%
0,9732 Schlussfolgerung:
94,71% Zu enger Versuchsbereich führt
Korrelationskoeffizient
Bestimmtheitsmaß
Gerade
a
b
Reststreuung
Reststandardabweichung
oft zu unzureichenden Ergebnissen bei viel Aufwand !
-0,2649
0,3319
0,001924
0,04386
-0,2528
0,3294 Umkehrschluss ist aber nur teil-
weise zulässig, da Bereiche von
0,002237 Nichtlinearitäten bzw. „nicht in0,04729 teressierende“ Bereiche er-
reicht werden können !
Statistische Verfahren Teil 1 Folie 81