Examen : Durée 2h Mme Malot

Année Universitaire 2014/2015
Analyse de données
Université de Nice Sophia-Antipolis
M2 IMEA
Examen d’Analyse de données
Examen : Durée 2h
Mme Malot
Remarque 1
A l’issue des 2h, vous me rendrez votre copie avec votre nom.
Prenez soin de toujours bien définir les objets que vous utilisez et d’écrire toutes les formules employées.
Tous les documents sont autorisés sauf la calculatrice et les téléphones portables.
• Question de cours :
On considère un jeu de données {x1 , . . . , xn } tel que pour tout i ∈ {1, . . . , n}, on a :


x1i


xi =  ... 
xpi
– Ecrire la matrice X contenant toutes ces données et servant de base à l’ACP. Vous donnerez
aussi le nom complet de ACP.
– Quelle est la différence entre une ACP normée et une ACP non normée?
– Quelles sont les transformations, de la base de données X, pour effectuer une ACP normée?
On appelle Z cette nouvelle base de données.
– Comment se calcule les matrices de covariance et de corrélation de X et Z? Que peut-on
dire entre la matrice de corrélation et la matrice de covariance de Z?
• Exercice 1 :
On considère le jeu de données résumé de la façon suivante :
classes
[1, 1.5[
[1.5, 2.5[
[2.5, 3[
[3, 3.5[
[3.5, 4[
effectifs
1651
3398
1633
1700
1618
1. Faire une représentation graphique de cette variable.
2. Quelle modélisation est envisageable en proposant une estimation du ou des paramètres
de la loi.
3. Superposez à une bonne représentation la fonction de densité associée à cette loi.
1
• Exercice 2 :
x
-3
-3.5
-2.5
3
On considère le jeu de données suivant :
2
3
3
4
3
y
0
-0.5
0
0.5
1
2
3.5
4
4.5
1. Combien y a t’il d’individus et de variables dans ce jeu de données?
2. Faire une représentation graphique de ce jeu de données.
3. Peut-on à vue d’oeil envisager de faire des groupes et si oui combien?
4. Quelle technique doit on appliquer pour connaître le nombre de groupes?
5. On considère la distance euclidienne entre deux individus et la distance de Ward ensuite.
On numérote les individus selon leur ordre d’apparition dans le jeu de données. Compléter
les documents suivants (notamment la composition des différents Ci) et expliquer vos
réponses.
6. Faire la représentation graphique associée et déterminer le nombre de groupes.
7. Pouvez-vous caractériser les classes?
8. Peut-on réellement se fier à ces classes et pourquoi?
9. Quelle technique peut-on utiliser pour déterminer la composition des groupes, le nombre
de groupes étant fixés?
10. Décrire cette méthode.
2