PLS-PM : validation du modèle

PLS-PM : validation du modèle
Cours de Statistique Multivariée Approfondie
[email protected]
Indice de Communauté
La communauté d’une variable manifeste xpq variable est une
correlation au carré
com pq = cor 2 ( x pq , ξ q )
Pour chaque bloc l'indice de communalité est la moyenne des
corrélations au carré entre chaque variable manifeste du bloc et sa
propre variable latente:
comq =
1
pq
pq
x1q
∑cor (xpq , ξq )
2
p =1
Giorgio Russolillo – PLS-PM : validation du modèle
x2q
ξq
x3q
2 Variance extraite en moyenne
L’ajustement du modèle de mesure (la fiabilité des variables latentes)
est évaluée par la partie de la variance des indicateurs expliquée par la
LV correspondente.
Average Variance Extracted
∑
( )
⎡ λ 2 var ξ ⎤
q ⎦
p ⎣ pq
AVEq =
∑ p ⎡⎣ λ pq2 var ξq ⎤⎦ + ∑ q 1− λ pq2
( )
(
)
•  AVE > 0.5 Giorgio Russolillo – PLS-PM : validation du modèle
3 Indice de Redondance
La redondance mesure la proportion de variabilité d’une variable
manifeste endogène liée à une variable latente endogène expliquée par
les variables latentes prédicteurs de sa variable latente
(
)
Redundance q* = R 2 ξ q* ,ξ q: ξq → ξq * × Comm pq*
x1
x2
x6
ξ1
x7
x3
x8
ξ3
x4
x9
x10
ξ2
x5
(
)
Redundance du bloc q* = R 2 ξ q* ,ξ q: ξq → ξq * × Comm q*
Giorgio Russolillo – PLS-PM : validation du modèle
4 Validation de Commounauté et Redundance
Des procédures de validation croisée est utilisé pour valider ces indices
(cv-communauté, cv-redondance, Q² de Stone-Geisser)
Commounauté
H q2 = 1−
∑∑ (x
q
i
ˆ ξˆ )2
-x
λ
pqi
pq
pq (-i) q (-i)
∑∑ (x pqi -x pq )2
q
i
Giorgio Russolillo – PLS-PM : validation du modèle
Redundance
Fq2 = 1−
∑∑ ( x
q
i
ˆ
ˆ ))2
-x
λ
Pred(
ξ
pqi
pq
q(-i)
pq (-i)
∑∑ (x
q
2
-x
)
pqi
pq
i
5 Indice de adéquation (Goodness of Fit index)
GoF =
Pq
1
∑
∑ ∑ Cor (x
2
Pq
ξq ) ×
pq,
q:Pq >1 p=1
1
Q*
Q*
∑ R (ξ
2
q*
, ξ j explaining ξ q* )
q*=1
q:Pq >1
Validation of
the inner model
Validation of
the outer model
L’adéquation du modèle externe
est obtenu comme moyenne des
corrélations au carré entre chaque
variables manifestes et la variable
latente correspondant, c'est à dire
la communauté moyenne
Giorgio Russolillo – PLS-PM : validation du modèle
L’adequation du modèle
interne est obtenu comme
moyenne des R2 de
l'ensemble des relations
structurelles.
6 Le GoF relativisé
Pq
∑ cor (x
2
De l’ACP on sait que
pq
, ξ q ) ≤ λqPCA
p=1
la plus grande valeur
propre de Xq’ Xq
Q*
∑ R (ξ
2
…et de l’ACC on sait que
q*
2
, ξ j explaining ξ q* ) ≤ ρ q*
q*=1
Le carré de la première
corrélation canonique
On relativise chaque term du GoF au maximum correspondant:
Pq
∑ Cor (x
2
GoF =
1
∑
∑
Pq
q:Pq >1
ξq )
pq,
p=1
λqPCA
2
1 J R (ξ q* , ξ j explaining ξ q* )
×
∑
2
Q * q*=1
ρ q*
q:Pq >1
Giorgio Russolillo – PLS-PM : validation du modèle
7 Reliability
La fiabilité (reliability rel(xi)) d’une mesure xi d’un vrai score,
modelée comme xi = λiξ + δi , est définie comme: ( )
rel xi =
λi2 var (ξ )
( )
var xi
= cor 2 xi , ξ
(
)
La rel(xi) peut être interprétée comme la variance de xi qui est expliquée par ξ
Giorgio Russolillo – PLS-PM : validation du modèle
8 Mesurer la fiabilité
Comment mesurer la précision de la mesure?
En d'autres termes, comment mesurer le niveau d'un d’homogénéité d’un
bloc Xj de variables corrélées positivement? Alpha de Cronbach
αC
Rho de Dillon Goldstein.
2
∑ cov ( x , x )
=
( P −1) P + ∑ cov ( x , x )
Pq
q
p≠ p'
q
p≠ p'
pq
p'q
pq
L’Alpha de Cronbach assume
lambda-équivalence
(parallélisme) et est une
estimation de la limite
inférieure de la fiabilité
ρq
p'q
∑ λ ) × var (ξ )
(
=
(∑ λ ) × var (ξ ) + ∑ var (x )
p
pq
q
2
p
pq
q
p
pq
•  xpq est la variable manifeste p du bloc q
•  Pq est le nombre des VM du bloc
•  Λpq est le loading de xpq
•  var(εpq) = 1- λpq2 est la variance de l’erreur
de mesure
•  Les VM sont standardisées
Le bloc d’indicateurs est à considérer fiable si ces indices sont > 0.7
Giorgio Russolillo – PLS-PM : validation du modèle
9 Unidimensionalité
Question :
Est un bloc Xq de variables essentiellement unidimensionnel?
Answers :
a) La première valeur propre d'une analyse en composantes
principales du bloc est supérieur à 1, les autres sont inférieurs à 1
b) Chaque variable est plus corrélée à la première composante
principale que au autres composantes
c) Chaque variable a une corrélation supérieure à 0,5, en valeur
absolue, avec la première composante principale.
Giorgio Russolillo – PLS-PM : validation du modèle
10 Validation du Modèle
Les hypothèses nulles suivantes devraient être rejetées:
•  λpq = 0 : chaque MV est censé être corrélée à son LV correspondant;
•  wpq = 0 : chaque LV est censé être affecté par toutes les VM de son bloc;
•  βqq’ = 0 : chaque predicteur latente est supposé expliquer par rapport sa réponse latente;
•  R2q* = 0 : chaque LV endogène est supposé être expliquée par ses prédicteurs latents;
•  cor (ξq; ξq’) = 0, si deux VL sont connectées c’est parce qu’ele sont supposées être reliés
par une corrélation statistiquement significative. Rejeter cette hypothèse signifie évaluer
la validité nomologique du modèle;
•  cor (ξq; ξq’ ) = 1 : VL differentes sont supposés mesurer concepts différents. En rejetant
cette hypothèse on évalue la validité discriminante du modèle;
•  AVEq et AVEq’ < cor2(ξq; ξq’) : une LV devrait être plus fortement liée à son bloc
d'indicateurs que a un autre LV représentant un bloc différent d'indicateurs.
Giorgio Russolillo – PLS-PM : validation du modèle
11 Un exemple: Un questionnaire de satisfaction
Image
Attentes
clients
Valeur
perçue
Qualité
perçue
Giorgio Russolillo – PLS-PM : validation du modèle
Satisfaction
clients
Fidélité
clients
Plaintes
clients
12 Le questionnaire
On demande de
donner une valeur de
de 1 à 10. 1 exprime un point
très négatif de vue sur
le produit, 10 une
opinion très positive.
Giorgio Russolillo – PLS-PM : validation du modèle
13 Références
• 
Esposito Vinzi V., Chin W. W., Henseler J., Wang H. (Eds.), 2010.
Handbook of Partial Least Squares – Concepts, Methods and Applications,
Springer • 
Tenenhaus M., 1998, La Régression PLS, Editions Technip, Paris.
• 
Tenenhaus M., 1999, « L’approche PLS », Revue de Statistique Appliquée,
47 (2), 5-40.
• 
Tenenhaus M., Esposito Vinzi V., Chatelin Y.-M., and Lauro C. (2005).
“PLS Path Modeling”, Computational Statistics & Data Analysis,
48:159-205. • 
Wold H. (1982), “Soft Modelling: The basic design and some extensions”
in Jöreskog K. and Wold H. (Eds.), System under indirect observation, vol.
2, North-Holland, Amsterdam, 1-54.
Giorgio Russolillo – PLS-PM : validation du modèle
14 This presentation is made available through a Creative Commons AttributionNoncommercial license. Details of the license and permitted uses are available at
http://creativecommons.org/licenses/by-nc/3.0/
© 2015 G. Russolillo – PLS-PM : validation du modèle
Title: PLS-PM : validation du modèle – UE STA201
Attribution: G. Russolillo, CNAM
Giorgio Russolillo – PLS-PM : validation du modèle
15