Multidimensional Scaling

Ludwig-Maximilians-Universität München
Institut für Statistik
Multidimensional Scaling
(MDS)
Myriam Hatz
”Statistische Methoden in der Psychometrie”
Lehrveranstaltung im Wintersemester 2015/16
Dozent: Dr. Steffen Unkel
München, 26. Februar 2016
Myriam Hatz
Multidimensional Scaling
26.02.16
1 / 39
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
2 / 39
Einleitendes Beispiel
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
2 / 39
Einleitendes Beispiel
Anwendungsbeispiel
Ziel der MDS
Ähnlichkeiten (bzw. Unähnlichkeiten) zwischen Objekten
mithilfe von Distanzen zwischen Punkten
in einem niedrig dimensionierten Raum darstellen.
Ursprünge im Bereich der Psychologie
”Welche Einflussfaktoren spielen für den Menschen im Hinblick auf die
Wahrnehmung von Ähnlichkeiten eine Rolle?”
Myriam Hatz
Multidimensional Scaling
26.02.16
3 / 39
Einleitendes Beispiel
Studie von Myron Wish aus dem Jahr 1971
”Welche Merkmale veranlassen Personen zwei Länder als ähnlich zu
bezeichnen?”
Probanden: 18 Studenten
Vergleich von 12 Ländern
Ähnlichkeit auf einer Skala von 1 ”sehr unähnlich” bis 9 ”sehr ähnlich”
Ähnlichkeitsscore = Mittelwert über alle Probanden
Myriam Hatz
Multidimensional Scaling
26.02.16
4 / 39
Einleitendes Beispiel
Ähnlichkeitsscore-Matrix
Country
Brazil
Congo
Cuba
Egypt
France
India
...
Myriam Hatz
Brazil
4.83
5.28
3.44
4.72
4.50
Congo
Cuba
Egypt
France
India
4.56
5.00
4.00
4.83
5.17
4.11
4.00
4.78
5.83
–
3.44
–
Multidimensional Scaling
...
26.02.16
5 / 39
Einleitendes Beispiel
MDS-Darstellung
Myriam Hatz
Multidimensional Scaling
26.02.16
6 / 39
Einleitendes Beispiel
MDS-Darstellung mit Dimensionsachsen
pr
W o
es
t
rde
ed
un lop
ve
de
Congo
France
Jugoslavia
Myriam Hatz
Multidimensional Scaling
d
pe
lo
ve
de
C
om pro
m
un
is
t
China
26.02.16
7 / 39
Einleitendes Beispiel
Einsatzgebiete von MDS
Explorative Methode
Testen von strukturellen Hypothesen
Untersuchung von psychologischen Strukturen
Urteilsbildung von Ähnlichkeiten
Myriam Hatz
Multidimensional Scaling
26.02.16
8 / 39
Grundlagen
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
8 / 39
Grundlagen
Proximitäten
Proximitäten
Proximitäten entsprechen Abstand, Nähe, Ähnlichkeit oder Unähnlichkeit
von Objekten.
Direkte Proximitäten
Ableitung aus anderen Maßen möglich
– Korrelationen
– Distanzmaße
– ”Co-occurence”-Indizes
→ MDS legt Proximitätentransformation und Distanzfunktion für die
Darstellung der Punkte im MDS-Raum fest.
Myriam Hatz
Multidimensional Scaling
26.02.16
9 / 39
Grundlagen
Distanzfunktionen
Distanzfunktionen
Distanzfunktionen bestimmen die Distanz zwischen zwei Objekten
Xi und Xj .
Lp -Distanz:
δij =
r
X
!1
p
|Xik − Xjk |p
, p≥1
(1)
k=1
mit r = Anzahl an Variablen
und Proximitäten-Matrix ∆ = (δij ).
Distanzfunktionen bestimmen aber auch die Abstände der einzelnen
Objekte in einer Konfiguration.
Myriam Hatz
Multidimensional Scaling
26.02.16
10 / 39
Grundlagen
Stressfunktion
Shepard-Diagramm
Distanzen
Das Shepard-Diagramm visualisiert die Güte einer MDS-Lösung, indem die
Proximitäten gegen ihre entsprechenden Distanzmaße abgetragen werden.
Proximitäten
Myriam Hatz
Multidimensional Scaling
26.02.16
11 / 39
Grundlagen
Stressfunktion
Informationsverlust
Eine Verlustfunktion drückt die Streuung der Punkte um die
Regressionslinie aus.
Der Informationsverlust entspricht der Summe der Residuen für alle
Punkte i und j:
X
i<j
eij2 =
X
[f (pij ) − dij (X)]2
(2)
i<j
mit f (pij ) = d̂ij (X) =
ˆ optimal transformierte Proximitäten
und dij =
ˆ Abstände der Punkte in der Konfiguration X.
Myriam Hatz
Multidimensional Scaling
26.02.16
12 / 39
Grundlagen
Stressfunktion
Stressfunktion
Durch normieren der Verlustfunktion erhält man den Güteindex Stress.
Dieser stellt ein interpretierbares Maß für die Güte einer MDS-Lösung dar.
v
uP
u i<j [d̂ij (X) − dij (X)]2
P
Stress = t
2
i<j
(3)
dij (X)
Bei einer perfekten Anpassung der Konfigurationsdistanzen an die Daten
nimmt der Stress einen Wert von Null an.
Myriam Hatz
Multidimensional Scaling
26.02.16
13 / 39
Grundlagen
Stressfunktion
Einflussfaktoren der Stressfunktion
n, die Anzahl an Beobachtungen
m, die Dimensionalität des MDS-Raums
MDS-Modell
Fehleranteil in den Daten
”Ties” bei der ordinalen MDS
→ Sollten bei der Interpretation des Stress beachtet werden
Myriam Hatz
Multidimensional Scaling
26.02.16
14 / 39
MDS-Verfahren
Klassische Skalierung
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
14 / 39
MDS-Verfahren
Klassische Skalierung
Klassische Skalierung
Analytische Lösung der MDS ohne Iterationen.
Idee
Angenommen Unähnlichkeiten entsprechen Distanzen:
Welche Koordinaten erklären diese am besten?
⇒ Objekte als Punkte in einer möglichst niedrig dimensionierten
Konfiguration darstellen, sodass dij ≈ δij .
Dimensionen verschiedener k-dimensionaler klassischer Skalierungen sind
dabei genestet.
Myriam Hatz
Multidimensional Scaling
26.02.16
15 / 39
MDS-Verfahren
Klassische Skalierung
Koordinatenbestimmung mit klassischer Skalierung (1)
Als Input wird die (quadrierte) euklidische Distanzmatrix D = (dij )
benötigt mit:
dij2 = (xi − xj )0 (xi − xj ).
1. Konstruiere aus D die Matrix A = (aij ) = (− 12 dij2 ).
2. Erhalte die Skalarproduktmatrix B = HAH
dabei ist H = I − n1 110 Zentrierungsmatrix.
B hat dann die Elemente bij = aij − ai· − a·j + a··
Myriam Hatz
Multidimensional Scaling
26.02.16
16 / 39
MDS-Verfahren
Klassische Skalierung
Koordinatenbestimmung mit klassischer Skalierung (2)
3. Eigenwertzerlegung: B = PΛP0
mit Λ = diag(λ1 , . . . , λn ), λ1 ≥ · · · ≥ λn und
P, die Matrix der normierten Eigenvektoren
4. Sei Λ+ eine Matrix mit den k größten positiven Eigenwerten von B
auf der Diagonalen und P+ die entsprechenden k Spalten
p von P.
Dann ist die Koordinatenmatrix gegeben durch X = P+ Λ+ .
5. Die Zeilen von X entsprechen dann den Koordinaten der Objekte.
Myriam Hatz
Multidimensional Scaling
26.02.16
17 / 39
MDS-Verfahren
Klassische Skalierung
Anmerkungen
Es wird dabei folgende Verlustfunktion minimiert:
L(X ) = H D(2) − Λ2 (X) || · || bezeichnet die Frobenius-Norm ||Z|| =
q
tr ZZ0
Außerdem gilt
xj =
N
1X
xij = 0 ∀j = 1, . . . , k
n i=1
→ Der Schwerpunkt der Konfiguration liegt also im
Koordinatenursprung.
Myriam Hatz
Multidimensional Scaling
26.02.16
18 / 39
MDS-Verfahren
Klassische Skalierung
Übersicht
Wähle die Konfiguration in Rk , deren Koordinaten durch die k größten
Eigenvektoren von B bestimmt werden.
Wenn D eine euklidische Distanzmatrix ist, nur positive Eigenwerte
möglich.
Gute Approximation, wenn die k größten Eigenwerte von B große
positive Werte und die restlichen nahe 0
Bei leicht negativen Eigenwerten trotzdem sinnvolle Darstellung
möglich
Myriam Hatz
Multidimensional Scaling
26.02.16
19 / 39
MDS-Verfahren
Anwendungsbeipiel - klassiche Skalierung
Beispiel - Lund (1974)
Forschungsinteresse
Ähnlichkeitsbeziehungen zwischen sieben norwegischen Parteien
untersuchen.
Kommunistische Partei
Sozialistische Partei
Arbeiterpartei
Liberale
Zentrumspartei
Christliche Volkspartei
Konservative
14 Versuchspersonen sollten Distanz zwischen zwei Parteien angeben
(insgesamt 42 Paarvergleiche je Proband).
Der Referenzwert lag bei 10 und stellte die Distanz zwischen
Arbeiterpartei und Liberale dar.
Myriam Hatz
Multidimensional Scaling
26.02.16
20 / 39
MDS-Verfahren
Anwendungsbeipiel - klassiche Skalierung
Distanzmatrix
Anordnung der Parteien spielte eine Rolle
→ arithmetisches Mittel der jeweiligen Distanzwerte
→ symmetrische Distanzmatrix:
KP
SP
AP
L
Z
CV
K
KP
0

 8.7

 25.3

 33.7

 37.9


 49.3
50.2

Myriam Hatz
SP
8.7
0
14.8
19.0
33.2
50.5
40.0
AP
25.3
14.8
0
10.0
17.8
21.3
24.3
L
33.7
19.0
10
0
10.5
18.9
12.9
Z
CV
K

37.9 49.3 50.2

33.2 50.5 40.0 

17.8 21.3 24.3 

10.5 18.9 12.9 
=D
0
7.6
8.1 


7.6
0
7.3 
8.1
7.3
0
Multidimensional Scaling
26.02.16
21 / 39
MDS-Verfahren
Anwendungsbeipiel - klassiche Skalierung
Ko
Somm
zi un
al is
is tis
tis c
ch he
e P
Pa ar
rte tei
i
Ar
be
ite
rp
Li
ar
be
te
ra
i
le
Ze
nt
ru
m
sp
Ko
ar
n
te
C se
i
hr rv
is a
tli tiv
ch e
e
Vo
lk
sp
ar
te
i
MDS-Auswertung
●
−40
●
●
−20
sozialistisch
Myriam Hatz
●
●
0
⇔
●
●
20
40
nicht sozialistisch
Multidimensional Scaling
26.02.16
22 / 39
MDS-Verfahren
Anwendungsbeipiel - klassiche Skalierung
⇒ Umsetzung in R
Myriam Hatz
Multidimensional Scaling
26.02.16
22 / 39
MDS-Verfahren
SMACOF-Algorithmus
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
22 / 39
MDS-Verfahren
SMACOF-Algorithmus
SMACOF-Algorithmus
Iterative Lösung der MDS
Idee
Minimiere den Stress einer MDS Lösung durch eine iterative Majorisierung.
SMACOF =
ˆ ”Stress Majorization of a Complicated Function”.
Myriam Hatz
Multidimensional Scaling
26.02.16
23 / 39
MDS-Verfahren
SMACOF-Algorithmus
Raw-Stress
Der zu minimierende Raw-Stress ist hierbei allgemein folgendermaßen
definiert:
σr (X) =
X
wij (δij − dij (X))2 ,
(4)
i<j
dabei sind wij Gewichte mit den Eigenschaften wij > 0 und
P
2
i<j wij δij = n(n − 1)/2.
Je nach MDS-Anwendung können verschiedene Gewichte eingesetzt
werden.
Das smacof -Package in R spezifiziert diese Gewichte automatisch.
Außerdem benötigt es δij , welche Unähnlichkeiten messen.
Myriam Hatz
Multidimensional Scaling
26.02.16
24 / 39
MDS-Verfahren
SMACOF-Algorithmus
Prinzip der iterative Majorisierung
Sei f (x ) eine beliebige komplizierte Funktion.
Bestimme das Minimum von f (x ) durch iteratives Ersetzen mit einer
Hilfsfunktion g(x , z), mit festem Wert z.
Anforderungen an g(x , z) als Majorisierungsfunktion:
– g(x , z) sollte einfacher zu minimieren sein als f (x ).
– f (x ) ≤ g(x , z).
– Die Hilfsfunktion sollte die Stützstelle z berühren, das heißt
f (z) = g(z, z).
Das Minimum x ∗ von g(x , z) liegt folglich zwischen f (x ∗ ) und f (z):
f (x ∗ ) ≤ g(x ∗ , z) ≤ g(z, z) = f (z).
Myriam Hatz
Multidimensional Scaling
(5)
26.02.16
25 / 39
MDS-Verfahren
SMACOF-Algorithmus
Illustration zweier Iterationen
[Quelle: Borg und Groenen (2010), Figure 8.4]
Myriam Hatz
Multidimensional Scaling
26.02.16
26 / 39
MDS-Verfahren
SMACOF-Algorithmus
Majorisierungsalgorithmus
1. Setze Startwert z = z0 .
2. Finde Update x (u) für das gilt g(x (u) , z) ≤ g(z, z).
3. Stoppe, falls f (z) − f (x (u) ) < .
4. Setze z = x (u) und gehe zu Schritt 2.
Myriam Hatz
Multidimensional Scaling
26.02.16
27 / 39
MDS-Verfahren
SMACOF-Algorithmus
Majorisierung der Stress-Funktion
Wird die Majorisierungs-Ungleichung in (5) eingehalten, kann auch die
Stress-Funktion mit mehr als einer Variable minimiert werden.
Die Stress-Funktion kann geschrieben werden als
σr (X) =
X
wij δij2 +
i<j
=
X
wij dij2 (X) − 2
i<j
η2
δ
|{z}
+
konstant in X
X
wij δij dij (X)
i<j
η 2 (X)
| {z }
gewichtete Summe der
quadrierten Distanzen
−
2ρ(X)
| {z }
gewichtete Summe
der Distanzen
⇒ Weitere Umformung der von X abhängigen Terme möglich
Myriam Hatz
Multidimensional Scaling
26.02.16
28 / 39
MDS-Verfahren
η 2 (X) =
P
i<j
SMACOF-Algorithmus
wij dij2 (X)
Es gilt
η 2 (X ) = tr X0 VX
(6)
mit vij = −wij , falls i 6= j
vii =
n
X
wij .
j=1,j6=i
rang(V) = n − 1 → Matrix besitzt keinen vollen Rang
Myriam Hatz
Multidimensional Scaling
26.02.16
29 / 39
MDS-Verfahren
−ρ(X) = −
P
i<j
SMACOF-Algorithmus
wij δij dij (X)
Weiterhin gilt
−ρ(X) = −tr X0 B(X) X ≤ −tr X0 B(Z)Z,
(7)
wobei die Matrix B(Z) folgende Elemente besitzt
bij =


− wij δij
dij (Z)


0
bii = −
n
X
falls i 6= j ∧ dij (Z) 6= 0
falls i 6= j ∧ dij (Z) = 0
bij .
j=1,j6=i
Myriam Hatz
Multidimensional Scaling
26.02.16
30 / 39
MDS-Verfahren
SMACOF-Algorithmus
Majorisierungsungleichung für Stress-Funktion
σr (X) = ηδ2 + tr X0 VX − 2tr X0 B(X)X
≤ ηδ2 + tr X0 VX − 2tr X0 B(Z)Z = τ (X, Z).
(8)
Minimum von τ (X, Z) erhält man analytisch durch Nullsetzen der
Ableitung und lösen der Gleichung für X:
!
∇τ (X, Z) = 2VX − 2B(Z)Z = 0
⇔ X = V−1 B(Z)Z
Hierfür wird die Inverse von V benötigt
Abhilfe durch Guttman Transformation, mittels der Moore-Penrose
Inversen V+ = (V + 110 )−1 − n−2 110 :
X[u] = V+ B(Z)Z
Myriam Hatz
Multidimensional Scaling
26.02.16
31 / 39
MDS-Verfahren
SMACOF-Algorithmus
Übersicht SMACOF-Algorithmus
Start: k := 0, setze beliebigen
Startwert Z = X[0] und
berechne σr[0] = σr(X[0])
k := k + 1
Update X[k] mit Hilfe
der Guttman Transformation
Berechne σr[k] = σr(X[k])
und setzte Z = X[k]
nein
σr[k-1] – σr[k] < ε oder
k=max. Iteration?
ja
Ende
Myriam Hatz
Multidimensional Scaling
26.02.16
32 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Beispiel - Rosenberg und Kim (1975)
Forschungsinteresse
Ähnlichkeitsbeziehung zwischen 15 Terminologien zur Beschreibung von
Verwandtschaftsverhältnissen.
Grandfather
Grandmother
Granddaughter
Grandson
Aunt
Niece
Cousin
Nephew
Sister
Daughter
Brother
Son
Father
Mother
Uncle
Studenten sollten benennen, welche Begriffe sie aufgrund ihrer
Ähnlichkeit in eine gemeinsame Gruppe einsortieren.
Für jeden Studenten wurde eine Unähnlichkeitsmatrix erstellt.
Paare werden mit 1 codiert, wenn Begriffe in unterschiedlichen
Gruppen und 0, wenn Begriffe in der gleichen Gruppe.
Myriam Hatz
Multidimensional Scaling
26.02.16
33 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Distanzmatrix
δij =
ˆ Prozentsätze, wie oft Begriffspaare nicht einer gemeinsamen Gruppe
zugeordnet wurden.
Aunt
Aunt
0

Brother
 79
 53
Cousin


 59
Daughter

 73
Father

Granddaughter 
 57
..
..
.
.

Myriam Hatz
Brother
79
0
67
62
38
75
..
.
Cousin
53
67
0
74
77
74
..
.
Multidimensional Scaling
Daughter
59
62
74
0
57
46
..
.
Father
73
38
77
57
0
79
..
.
...
...
...
...
...
...
...
..
.
26.02.16












34 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Distanzmatrix
δij =
ˆ Prozentsätze, wie oft Begriffspaare nicht einer gemeinsamen Gruppe
zugeordnet wurden.
Aunt
Aunt
0

Brother
 79
 53
Cousin


 59
Daughter

 73
Father

Granddaughter 
 57
..
..
.
.

Myriam Hatz
Brother
79
0
67
62
38
75
..
.
Cousin
53
67
0
74
77
74
..
.
Multidimensional Scaling
Daughter
59
62
74
0
57
46
..
.
Father
73
38
77
57
0
79
..
.
...
...
...
...
...
...
...
..
.
26.02.16












34 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Umsetzung in R - Package smacof
Daten (kinshipdelta) dort zu finden.
Benötigt immer Unähnlichkeitsdaten.
Falls nur Ähnlichkeiten gegeben können diese mit sim2diss()
transformiert werden.
Symmetrische Unähnlichkeitsmatrizen: smacofSym()
Wichtige Argumente:
– delta: Übergabe einer symmetrischen Distanzmatrix.
– ndim: Anzahl der Dimensionen
– type: legt die Transformation der Proximitäten fest.
Myriam Hatz
Multidimensional Scaling
26.02.16
35 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Mögliche Transformationen der Proximitäten
dˆij
b · δij mit b > 0
a + b · δij mit a, b ≥ 0
Polynomfunktion von δij
Rangordnung der δij bleibt erhalten
Ratio
Intervall
Spline
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
● ●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
● ●
●
●
●
●
● ●
● ●
● ●
●
●
●
●
● ● ● ● ● ●
● ● ●
●
●
●
●
● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
● ● ● ● ● ● ●
●
● ● ● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
● ● ●
● ● ●
●
● ●
●
●
●
●
●
●
●
●
●
●
● ● ●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ● ● ●
●
● ●
● ●
● ●
●
●
●
●
●
●
●
● ●
●
●
● ●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
● ●
● ● ●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
● ●
● ●
●
●
● ● ●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
● ●
0.5
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
● ● ●
●
●
●
d_ij
1.0
●
●
●
●
● ●
●
●
●
●
●
●
●
●
0.5
●
●
●
● ●
● ●
●
●
●
● ●
●
●
● ●
●
● ●
●
●
●
● ●
●
●
●
● ●
●
● ●
●
●
● ●
0.2
d_ij
●
●
●
●
● ● ●
● ●
d_ij
●
●
●
0.5
●
●
●
1.0
●
●
●
1.4
●
● ●
●
●
●
● ●
●
d_ij
●
●
●
●
● ●
●
●
0.6
●
1.5
●
●
●
1.0
●
●
●
●
●
●
●
●
●
1.5
1.5
●
Ordinal
●
●
1.0
Transformation
Ratio
Intervall
Spline
Ordinal
●
● ●
●
●
●
●
●
● ●
●
●
●
●
30
40
50
60
Proximitäten
Myriam Hatz
70
80
30
40
50
60
70
80
30
Proximitäten
Multidimensional Scaling
40
50
60
Proximitäten
70
80
30
40
50
60
70
80
Proximitäten
26.02.16
36 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Ratio MDS mit SMACOF
Dimensionsvergleich ergibt folgende Stresswerte:
Eine Dimension
0.49
Zwei Dimensionen
0.26
Drei Dimensionen
0.16
→ wie erwartet!
Myriam Hatz
Multidimensional Scaling
26.02.16
37 / 39
MDS-Verfahren
Anwendungsbeispiel - SMACOF
Zwei-Dimensionale MDS-Lösung
Cousin
●
0.5
Aunt
Niece●
Uncle
Nephew
●
●
Grandmother
Granddaughter
●
0.0
Dimension 2
●
●
Grandson
Grandfather
●
●
Sister
Daughter ●
●
−0.5
Brother Son
●
Mother
●
Father
●
●
−1.0
−0.5
0.0
0.5
1.0
Dimension 1
Myriam Hatz
Multidimensional Scaling
26.02.16
38 / 39
Fazit
Gliederung
1
Einleitendes Beispiel
2
Grundlagen
Proximitäten
Distanzfunktionen
Stressfunktion
3
MDS-Verfahren
Klassische Skalierung
SMACOF-Algorithmus
4
Fazit
Myriam Hatz
Multidimensional Scaling
26.02.16
38 / 39
Fazit
Fazit
Vorrangig als explorative Analysemethode genutzt
→ Strukturen in Daten aufzeigen.
Einschränkung auf Ähnlichkeitsstrukturen
Viele verschiedene MDS-Verfahren verfügbar
– metrische Verfahren ↔ nicht-metrische Verfahren
– aggregierende Verfahren ↔ nichtaggregierende Verfahren
– Flexibilität auch durch Transformationen der Proximitäten und
verschiedenen Gewichtungen
Konfigurationen lassen sich meist intuitiv interpretieren.
Liegt allerdings im Auge des Betrachters.
Myriam Hatz
Multidimensional Scaling
26.02.16
39 / 39
Vielen Dank für Ihre Aufmerksamkeit!
Myriam Hatz
Multidimensional Scaling
26.02.16
39 / 39
Bartholomew, D.J., Steele, F., Moustaki, I. und Galbraith, J. I. (2008). Analysis of
Multivariate Social Science Data, Chapman and Hall/CRC, Boca Raton.
Borg, I. und Groenen, P. J. F. (2010), Modern multidimensional scaling, Springer,
Berlin London.
Borg, I., Groenen, P. J. F. und Mair, P. (2013), Applied multidimensional scaling,
Springer, Berlin London.
Hamerle, A. und Pape, H. (1996), Grundlagen der mehrdimensionalen Skalierung,
in L. Fahrmeir, A. Hamerle und G. Tutz (eds), Multivariate statistische Verfahren,
Walter de Gruyer, Berlin.
Mair, P., De Leeuw, J. und Groenen, P. J. F. (2015). Multidimensional scaling in R:
SMACOF.
URL: https://cran.r-project.org/web/packages/smacof/vignettes/smacof.pdf
Mardia, K. V., Kent, J. T. und Bibby, J. M. (1980). Multivariate Analysis,
Academic Press.
Myriam Hatz
Multidimensional Scaling
26.02.16
39 / 39