Chapitre 2 - Représentations graphiques

Chapitre 2
Introduction à la statistique avec R
Représentations Graphiques
Pr. Bruno Falissard
Plan
Introduction à la statistique avec R > Représentations Graphiques
• Variables qualitatives
• Variables quantitatives
• Diagramme en bâtons, camemberts,
histogrammes, boîtes à moustaches,
diagrammes cartésiens, diagrammes en fagot
Pr. Bruno Falissard
Le fichier smp.c
Introduction à la statistique avec R > Représentations Graphiques
• L’étude santé mentale en prison (smp)
–
–
–
–
799 détenus tirés au sort
Âge
Profession
Dépression, schizophrénie (diagnostic issu du
consensus de deux cliniciens)
– Gravité de la pathologie éventuelle
– Nombre d’enfants
Pr. Bruno Falissard
Le fichier smp.c
Introduction à la statistique avec R > Représentations Graphiques
• L’étude santé mentale en prison (smp), variables
évaluant la personnalité des détenus
– Recherche de sensation (rs) : curiosité, attrait pour
le risque et la nouveauté
– Évitement du danger (ed) : timidité, précautionneux
– Dépendance à la récompense (dr) : sensibilité aux
relations sociales, influençable
Pr. Bruno Falissard
Le fichier smp.c
Introduction à la statistique avec R > Représentations Graphiques
> smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
> str(smp.c)
'data.frame':
799 obs. of 9 variables:
$ age
: int 31 49 50 47 23 34 24 52 42 45 ...
$ prof
: Factor w/ 8 levels "agriculteur",..: 3 NA 7 6...
$ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ...
$ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ...
$ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ...
$ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ...
$ rs
: int 2 2 2 2 2 1 3 2 3 2 ...
$ ed
: int 1 2 3 2 2 2 3 2 3 2 ...
$ dr
: int 1 1 2 2 2 1 2 2 1 2 ...
Pr. Bruno Falissard
Le fichier smp.c
Introduction à la statistique avec R > Représentations Graphiques
> smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
> str(smp.c)
'data.frame':
799 obs. of 9 variables:
$ age
: int 31 49 50 47 23 34 24 52 42 45 ...
$ prof
: Factor w/ 8 levels "agriculteur",..: 3 NA 7 6...
$ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ...
$ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ...
$ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ...
$ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ...
$ rs
: int 2 2 2 2 2 1 3 2 3 2 ...
$ ed
: int 1 2 3 2 2 2 3 2 3 2 ...
$ dr
: int 1 1 2 2 2 1 2 2 1 2 ...
Pr. Bruno Falissard
Le fichier smp.c
Introduction à la statistique avec R > Représentations Graphiques
> smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
> str(smp.c)
'data.frame':
799 obs. of 9 variables:
$ age
: int 31 49 50 47 23 34 24 52 42 45 ...
$ prof
: Factor w/ 8 levels "agriculteur",..: 3 NA 7 6...
$ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ...
$ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ...
$ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ...
$ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ...
$ rs
: int 2 2 2 2 2 1 3 2 3 2 ...
$ ed
: int 1 2 3 2 2 2 3 2 3 2 ...
$ dr
: int 1 1 2 2 2 1 2 2 1 2 ...
Pr. Bruno Falissard
Diagramme en bâton
Introduction à la statistique avec R > Représentations Graphiques
0
50
100
150
200
> barplot(table(smp.c$prof))
agriculteur
artisan
cadre
prof.intermédiaire
employé
ouvrier
autre
sans emploi
Pr. Bruno Falissard
Diagramme en bâton
Introduction à la statistique avec R > Représentations Graphiques
> barplot(table(smp.c$prof))
> str(smp.c$prof)
Factor w/ 8 levels "agriculteur",..: 3 NA 7 6 8 6 3 2 6 6 ...
> table(smp.c$prof)
agriculteur
6
cadre
24
prof.intermédiaire
58
artisan
90
employé
135
sans emploi
222
autre
31
ouvrier
227
Pr. Bruno Falissard
Diagramme en bâton
Introduction à la statistique avec R > Représentations Graphiques
0
50
100
150
200
> barplot(table(smp.c$prof))
agriculteur
artisan
cadre
prof.intermédiaire
employé
ouvrier
autre
sans emploi
Pr. Bruno Falissard
Camembert
Introduction à la statistique avec R > Représentations Graphiques
> pie(table(smp.c$prof))
employé
cadre
autre
artisan
ouvrier
agriculteur
sans emploi
prof.intermédiaire
Pr. Bruno Falissard
Histogramme
Introduction à la statistique avec R > Représentations Graphiques
> hist(smp.c$age)
60
40
20
0
Frequency
80
100
120
Histogram of smp.c$age
20
30
40
50
60
70
80
smp.c$age
Pr. Bruno Falissard
Histogramme
Introduction à la statistique avec R > Représentations Graphiques
60
40
20
0
Frequency
80
100
120
> hist(smp.c$age,col="grey",main="",
xlab="age")
20
30
40
50
60
70
80
age
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
20
30
40
50
60
70
80
> boxplot(smp.c$age,xlab="age")
age
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
70
80
> boxplot(smp.c$age,xlab="age")
50
60
25% des données
40
25% des données
30
25% des données
20
25% des données
age
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
70
80
> boxplot(smp.c$age,xlab="age")
50
60
25% des données
40
25% des données
30
25% des données
20
25% des données
age
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
50
40
30
20
age
60
70
80
> boxplot(smp.c$age~smp.c$rs,ylab="age",
xlab="Recherche de sensation")
1
2
3
Recherche de sensation
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
50
40
30
20
age
60
70
80
> boxplot(smp.c$age~smp.c$rs,ylab="age",
xlab="Recherche de sensation")
1
2
3
Recherche de sensation
Pr. Bruno Falissard
Boîte à moustache
Introduction à la statistique avec R > Représentations Graphiques
50
40
30
20
age
60
70
80
> boxplot(smp.c$age~smp.c$rs,ylab="age",
xlab="Recherche de sensation")
1
2
3
Recherche de sensation
Pr. Bruno Falissard
Diagramme cartésien (« ou diagramme en x,y »)
Introduction à la statistique avec R > Représentations Graphiques
> plot(smp.c$age,smp.c$n.enfant)
Pr. Bruno Falissard
Diagramme cartésien (« ou diagramme en x,y »)
Introduction à la statistique avec R > Représentations Graphiques
> plot(jitter(smp.c$age),
jitter(smp.c$n.enfant))
Pr. Bruno Falissard
Diagramme temporel
Introduction à la statistique avec R > Représentations Graphiques
20
15
10
repdat$HDRS
25
> repdat <- read.csv2("C:/Users/Bruno/outils hdrs.csv")
> str(repdat)
'data.frame':
1053 obs. of 3 variables:
$ NUMERO: int 96 96 96 96 96 96 96 96 157 157 ...
$ VISIT : int 0 4 7 14 21 28 42 56 0 4 ...
$ HDRS : int 34 26 12 7 5 1 1 1 27 19 ...
n=146 n=139 n=137 n=133 n=129 n=127 n=122 n=120
0
4
7
14
21
28
42
56
repdat$VISIT
Pr. Bruno Falissard
Diagramme temporel
Introduction à la statistique avec R > Représentations Graphiques
20
15
10
repdat$HDRS
25
> library(gplots)
> plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
n=146 n=139 n=137 n=133 n=129 n=127 n=122 n=120
0
4
7
14
21
28
42
56
repdat$VISIT
Pr. Bruno Falissard
Diagramme en fagot
Introduction à la statistique avec R > Représentations Graphiques
30
20
10
0
mean of repdat$HDRS
40
> interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
0
4
7
14
21
28
42
56
repdat$VISIT
Pr. Bruno Falissard
Conclusion
Introduction à la statistique avec R > Représentations Graphiques
smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
str(smp.c)
barplot(table(smp.c$prof))
pie(table(smp.c$prof))
hist(smp.c$age)
hist(smp.c$age,col="grey", main="",xlab="age")
boxplot(smp.c$age,xlab="age")
boxplot(smp.c$age~smp.c$rs,ylab="age",xlab=
"Recherche de sensation")
plot(smp.c$age,smp.c$n.enfant)
plot(jitter(smp.c$age),jitter(smp.c$n.enfant))
repdat <- read.csv2("D:/MOOC/Data/hdrs.csv")
str(repdat)
library(gplots)
plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
Pr. Bruno Falissard
Conclusion
Introduction à la statistique avec R > Représentations Graphiques
smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
str(smp.c)
barplot(table(smp.c$prof))
pie(table(smp.c$prof))
hist(smp.c$age)
hist(smp.c$age,col="grey", main="",xlab="age")
boxplot(smp.c$age,xlab="age")
boxplot(smp.c$age~smp.c$rs,ylab="age",xlab=
"Recherche de sensation")
plot(smp.c$age,smp.c$n.enfant)
plot(jitter(smp.c$age),jitter(smp.c$n.enfant))
repdat <- read.csv2("D:/MOOC/Data/hdrs.csv")
str(repdat)
library(gplots)
plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
Pr. Bruno Falissard
Conclusion
Introduction à la statistique avec R > Représentations Graphiques
smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
str(smp.c)
barplot(table(smp.c$prof))
pie(table(smp.c$prof))
hist(smp.c$age)
hist(smp.c$age,col="grey", main="",xlab="age")
boxplot(smp.c$age,xlab="age")
boxplot(smp.c$age~smp.c$rs,ylab="age",xlab=
"Recherche de sensation")
plot(smp.c$age,smp.c$n.enfant)
plot(jitter(smp.c$age),jitter(smp.c$n.enfant))
repdat <- read.csv2("D:/MOOC/Data/hdrs.csv")
str(repdat)
library(gplots)
plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
Pr. Bruno Falissard
Conclusion
Introduction à la statistique avec R > Représentations Graphiques
smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
str(smp.c)
barplot(table(smp.c$prof))
pie(table(smp.c$prof))
hist(smp.c$age)
hist(smp.c$age,col="grey", main="",xlab="age")
boxplot(smp.c$age,xlab="age")
boxplot(smp.c$age~smp.c$rs,ylab="age",xlab=
"Recherche de sensation")
plot(smp.c$age,smp.c$n.enfant)
plot(jitter(smp.c$age),jitter(smp.c$n.enfant))
repdat <- read.csv2("D:/MOOC/Data/hdrs.csv")
str(repdat)
library(gplots)
plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
Pr. Bruno Falissard
Conclusion
Introduction à la statistique avec R > Représentations Graphiques
smp.c <- read.csv2("D:/MOOC/Data/smp1.csv")
str(smp.c)
barplot(table(smp.c$prof))
pie(table(smp.c$prof))
hist(smp.c$age)
hist(smp.c$age,col="grey", main="",xlab="age")
boxplot(smp.c$age,xlab="age")
boxplot(smp.c$age~smp.c$rs,ylab="age",xlab=
"Recherche de sensation")
plot(smp.c$age,smp.c$n.enfant)
plot(jitter(smp.c$age),jitter(smp.c$n.enfant))
repdat <- read.csv2("D:/MOOC/Data/hdrs.csv")
str(repdat)
library(gplots)
plotmeans(repdat$HDRS~repdat$VISIT,gap=0,
barcol="black")
interaction.plot(repdat$VISIT,repdat$NUMERO,
repdat$HDRS,lty=1,legend=FALSE)
Pr. Bruno Falissard