Chapitre 2 Introduction à la statistique avec R Représentations Graphiques Pr. Bruno Falissard Plan Introduction à la statistique avec R > Représentations Graphiques • Variables qualitatives • Variables quantitatives • Diagramme en bâtons, camemberts, histogrammes, boîtes à moustaches, diagrammes cartésiens, diagrammes en fagot Pr. Bruno Falissard Le fichier smp.c Introduction à la statistique avec R > Représentations Graphiques • L’étude santé mentale en prison (smp) – – – – 799 détenus tirés au sort Âge Profession Dépression, schizophrénie (diagnostic issu du consensus de deux cliniciens) – Gravité de la pathologie éventuelle – Nombre d’enfants Pr. Bruno Falissard Le fichier smp.c Introduction à la statistique avec R > Représentations Graphiques • L’étude santé mentale en prison (smp), variables évaluant la personnalité des détenus – Recherche de sensation (rs) : curiosité, attrait pour le risque et la nouveauté – Évitement du danger (ed) : timidité, précautionneux – Dépendance à la récompense (dr) : sensibilité aux relations sociales, influençable Pr. Bruno Falissard Le fichier smp.c Introduction à la statistique avec R > Représentations Graphiques > smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") > str(smp.c) 'data.frame': 799 obs. of 9 variables: $ age : int 31 49 50 47 23 34 24 52 42 45 ... $ prof : Factor w/ 8 levels "agriculteur",..: 3 NA 7 6... $ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ... $ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ... $ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ... $ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ... $ rs : int 2 2 2 2 2 1 3 2 3 2 ... $ ed : int 1 2 3 2 2 2 3 2 3 2 ... $ dr : int 1 1 2 2 2 1 2 2 1 2 ... Pr. Bruno Falissard Le fichier smp.c Introduction à la statistique avec R > Représentations Graphiques > smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") > str(smp.c) 'data.frame': 799 obs. of 9 variables: $ age : int 31 49 50 47 23 34 24 52 42 45 ... $ prof : Factor w/ 8 levels "agriculteur",..: 3 NA 7 6... $ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ... $ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ... $ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ... $ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ... $ rs : int 2 2 2 2 2 1 3 2 3 2 ... $ ed : int 1 2 3 2 2 2 3 2 3 2 ... $ dr : int 1 1 2 2 2 1 2 2 1 2 ... Pr. Bruno Falissard Le fichier smp.c Introduction à la statistique avec R > Représentations Graphiques > smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") > str(smp.c) 'data.frame': 799 obs. of 9 variables: $ age : int 31 49 50 47 23 34 24 52 42 45 ... $ prof : Factor w/ 8 levels "agriculteur",..: 3 NA 7 6... $ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ... $ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ... $ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ... $ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ... $ rs : int 2 2 2 2 2 1 3 2 3 2 ... $ ed : int 1 2 3 2 2 2 3 2 3 2 ... $ dr : int 1 1 2 2 2 1 2 2 1 2 ... Pr. Bruno Falissard Diagramme en bâton Introduction à la statistique avec R > Représentations Graphiques 0 50 100 150 200 > barplot(table(smp.c$prof)) agriculteur artisan cadre prof.intermédiaire employé ouvrier autre sans emploi Pr. Bruno Falissard Diagramme en bâton Introduction à la statistique avec R > Représentations Graphiques > barplot(table(smp.c$prof)) > str(smp.c$prof) Factor w/ 8 levels "agriculteur",..: 3 NA 7 6 8 6 3 2 6 6 ... > table(smp.c$prof) agriculteur 6 cadre 24 prof.intermédiaire 58 artisan 90 employé 135 sans emploi 222 autre 31 ouvrier 227 Pr. Bruno Falissard Diagramme en bâton Introduction à la statistique avec R > Représentations Graphiques 0 50 100 150 200 > barplot(table(smp.c$prof)) agriculteur artisan cadre prof.intermédiaire employé ouvrier autre sans emploi Pr. Bruno Falissard Camembert Introduction à la statistique avec R > Représentations Graphiques > pie(table(smp.c$prof)) employé cadre autre artisan ouvrier agriculteur sans emploi prof.intermédiaire Pr. Bruno Falissard Histogramme Introduction à la statistique avec R > Représentations Graphiques > hist(smp.c$age) 60 40 20 0 Frequency 80 100 120 Histogram of smp.c$age 20 30 40 50 60 70 80 smp.c$age Pr. Bruno Falissard Histogramme Introduction à la statistique avec R > Représentations Graphiques 60 40 20 0 Frequency 80 100 120 > hist(smp.c$age,col="grey",main="", xlab="age") 20 30 40 50 60 70 80 age Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 20 30 40 50 60 70 80 > boxplot(smp.c$age,xlab="age") age Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 70 80 > boxplot(smp.c$age,xlab="age") 50 60 25% des données 40 25% des données 30 25% des données 20 25% des données age Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 70 80 > boxplot(smp.c$age,xlab="age") 50 60 25% des données 40 25% des données 30 25% des données 20 25% des données age Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 50 40 30 20 age 60 70 80 > boxplot(smp.c$age~smp.c$rs,ylab="age", xlab="Recherche de sensation") 1 2 3 Recherche de sensation Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 50 40 30 20 age 60 70 80 > boxplot(smp.c$age~smp.c$rs,ylab="age", xlab="Recherche de sensation") 1 2 3 Recherche de sensation Pr. Bruno Falissard Boîte à moustache Introduction à la statistique avec R > Représentations Graphiques 50 40 30 20 age 60 70 80 > boxplot(smp.c$age~smp.c$rs,ylab="age", xlab="Recherche de sensation") 1 2 3 Recherche de sensation Pr. Bruno Falissard Diagramme cartésien (« ou diagramme en x,y ») Introduction à la statistique avec R > Représentations Graphiques > plot(smp.c$age,smp.c$n.enfant) Pr. Bruno Falissard Diagramme cartésien (« ou diagramme en x,y ») Introduction à la statistique avec R > Représentations Graphiques > plot(jitter(smp.c$age), jitter(smp.c$n.enfant)) Pr. Bruno Falissard Diagramme temporel Introduction à la statistique avec R > Représentations Graphiques 20 15 10 repdat$HDRS 25 > repdat <- read.csv2("C:/Users/Bruno/outils hdrs.csv") > str(repdat) 'data.frame': 1053 obs. of 3 variables: $ NUMERO: int 96 96 96 96 96 96 96 96 157 157 ... $ VISIT : int 0 4 7 14 21 28 42 56 0 4 ... $ HDRS : int 34 26 12 7 5 1 1 1 27 19 ... n=146 n=139 n=137 n=133 n=129 n=127 n=122 n=120 0 4 7 14 21 28 42 56 repdat$VISIT Pr. Bruno Falissard Diagramme temporel Introduction à la statistique avec R > Représentations Graphiques 20 15 10 repdat$HDRS 25 > library(gplots) > plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") n=146 n=139 n=137 n=133 n=129 n=127 n=122 n=120 0 4 7 14 21 28 42 56 repdat$VISIT Pr. Bruno Falissard Diagramme en fagot Introduction à la statistique avec R > Représentations Graphiques 30 20 10 0 mean of repdat$HDRS 40 > interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) 0 4 7 14 21 28 42 56 repdat$VISIT Pr. Bruno Falissard Conclusion Introduction à la statistique avec R > Représentations Graphiques smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") str(smp.c) barplot(table(smp.c$prof)) pie(table(smp.c$prof)) hist(smp.c$age) hist(smp.c$age,col="grey", main="",xlab="age") boxplot(smp.c$age,xlab="age") boxplot(smp.c$age~smp.c$rs,ylab="age",xlab= "Recherche de sensation") plot(smp.c$age,smp.c$n.enfant) plot(jitter(smp.c$age),jitter(smp.c$n.enfant)) repdat <- read.csv2("D:/MOOC/Data/hdrs.csv") str(repdat) library(gplots) plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) Pr. Bruno Falissard Conclusion Introduction à la statistique avec R > Représentations Graphiques smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") str(smp.c) barplot(table(smp.c$prof)) pie(table(smp.c$prof)) hist(smp.c$age) hist(smp.c$age,col="grey", main="",xlab="age") boxplot(smp.c$age,xlab="age") boxplot(smp.c$age~smp.c$rs,ylab="age",xlab= "Recherche de sensation") plot(smp.c$age,smp.c$n.enfant) plot(jitter(smp.c$age),jitter(smp.c$n.enfant)) repdat <- read.csv2("D:/MOOC/Data/hdrs.csv") str(repdat) library(gplots) plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) Pr. Bruno Falissard Conclusion Introduction à la statistique avec R > Représentations Graphiques smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") str(smp.c) barplot(table(smp.c$prof)) pie(table(smp.c$prof)) hist(smp.c$age) hist(smp.c$age,col="grey", main="",xlab="age") boxplot(smp.c$age,xlab="age") boxplot(smp.c$age~smp.c$rs,ylab="age",xlab= "Recherche de sensation") plot(smp.c$age,smp.c$n.enfant) plot(jitter(smp.c$age),jitter(smp.c$n.enfant)) repdat <- read.csv2("D:/MOOC/Data/hdrs.csv") str(repdat) library(gplots) plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) Pr. Bruno Falissard Conclusion Introduction à la statistique avec R > Représentations Graphiques smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") str(smp.c) barplot(table(smp.c$prof)) pie(table(smp.c$prof)) hist(smp.c$age) hist(smp.c$age,col="grey", main="",xlab="age") boxplot(smp.c$age,xlab="age") boxplot(smp.c$age~smp.c$rs,ylab="age",xlab= "Recherche de sensation") plot(smp.c$age,smp.c$n.enfant) plot(jitter(smp.c$age),jitter(smp.c$n.enfant)) repdat <- read.csv2("D:/MOOC/Data/hdrs.csv") str(repdat) library(gplots) plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) Pr. Bruno Falissard Conclusion Introduction à la statistique avec R > Représentations Graphiques smp.c <- read.csv2("D:/MOOC/Data/smp1.csv") str(smp.c) barplot(table(smp.c$prof)) pie(table(smp.c$prof)) hist(smp.c$age) hist(smp.c$age,col="grey", main="",xlab="age") boxplot(smp.c$age,xlab="age") boxplot(smp.c$age~smp.c$rs,ylab="age",xlab= "Recherche de sensation") plot(smp.c$age,smp.c$n.enfant) plot(jitter(smp.c$age),jitter(smp.c$n.enfant)) repdat <- read.csv2("D:/MOOC/Data/hdrs.csv") str(repdat) library(gplots) plotmeans(repdat$HDRS~repdat$VISIT,gap=0, barcol="black") interaction.plot(repdat$VISIT,repdat$NUMERO, repdat$HDRS,lty=1,legend=FALSE) Pr. Bruno Falissard
© Copyright 2024 ExpyDoc