Statistiek in het Profielwerkstuk (pdf, 571 kB)

9-5-2014
Wiskundedialoog 13 mei 2014
Statistiek in het profielwerkstuk
Lianne Dirven
Montessori College Nijmegen
Radboud Universiteit FNWI
Saskia van Boven
Radboud Docenten Academie
De onderzoekscyclus
1
9-5-2014
•
•
•
•
Probleemstelling
Vraag formuleren
Variabelen benoemen
Het verzamelen van data:
-
Welke populatie ondervragen?
Welke data verzamelen?
Hoe data verzamelen?
Hoeveel data verzamelen?
Welk meetbaarheid?
Hoe data weergeven?
Hoe doe je onderzoek?
• Verwachtingen uitspreken
• Analyse van de data:
-
Datatabel beoordelen.
Diagrammen en grafieken, visualisaties beoordelen.
Beschrijven van waarneming (patronen, regelmaat, …)
Relaties tussen variabelen beschrijven.
- Kwantificatie middels geschikte centrummaten en spreidingsmaten .
- Oorzaken van fouten:
-
Nauwkeurigheid van metingen?
Representativiteit steekproef?
Systematische fout gemaakt?
Te beperkte vraagstelling?
Te grote non-response (bij enquêtes)?
- Conclusies trekken (ook verwachtingen bijstellen)
• Voorstellen voor nader onderzoek
Waarmee komen leerlingen en collega’s?
•
•
•
•
•
•
•
•
Ik wil iets met drugs
Schoonheid
Duikreflex
Sporten beter met of zonder muziek?
Tweelingen
Hoe groot moet mijn steekproef zijn?
Welke data heb ik nodig?
….
Maar hoe buig je dit om tot een onderzoekbare onderzoeksvraag?
2
9-5-2014
Vanuit de toetsende statistiek geredeneerd:
• Het vergelijken van twee groepen (bijvoorbeeld jongens en
meisjes)
• Het vergelijken van meerdere groepen (bijvoorbeeld leerlingen met
een verschillend profiel)
• Het vergelijken van een score voor en na een interventie
Over welke toetsen hebben we het dan?
•
•
•
•
de binomiale toets
de z-toets (normale verdeling)
de t-toets
2
de  toets
Welke toetsen kunnen we gebruiken?
Toetsen
Eén variabele
Z-toets
 bekend
T- toets
 onbekend
Twee variabelen
Tekentoets
Binomiaal
Meerdere variabelen
Ongepaard
2 onafhankelijke
steekproeven (2
verschillende
groepen)
Gepaard
2 afhankelijke
steekproeven
(dezelfde
proefpersonen)
T-toets
 onbekend
T-toets
 onbekend
Chi kwadraat
Kruistabel, meerdere
groepen mogelijk
Voorbeeld 1: T-toets met 1 variabele
Voorbeeldvariabele
Gemiddelde cijfer CE van klas 6A
Voorbeeldsituatie
In Euclides lees je dat het landelijk gemiddelde 6,5 is
Voorbeeldvraag
Wijkt het gemiddelde van mijn klas significant af van het landelijk
gemiddelde?
Hypothese
Het gemiddelde van mijn klas wijkt niet significant af van het landelijk
gemiddelde.
Aannamen
Steekproef: willekeurig samengesteld (aselect)
Verdeling: steekproefgemiddelde is normaal verdeeld. Je mag
volgens de centrale limietstelling altijd aannemen dat de
steekproef bij benadering normaal verdeeld is als je meer dan
20-30 waarnemingen hebt.
Variantie: de werkelijke variantie van het landelijk cijfer is onbekend, anders
zou je een z-toets doen.
Steekproefresultaat
n=23; µ = 6,2,  = 0,82 levert in VU-stat
3
9-5-2014
In VU-stat ziet dat er zo uit:
• vustat.exe
• data_voor_13_mei.xlsx
t-toets: normale verdeling, SD onbekend
De grootheid Xi is normaal verdeeld.
Nulhypothese H0 : µ = 6,5.
Alternatieve hypothese H1 : µ <> 6,5
Aantal waarnemingen n = 23
Het gemiddelde van de waarnemingen is 6,2
De standaarddeviatie van de waarnemingen is 0,82
Toetsingsgrootheid t = (XGem. - 6,5)/( SD / √23)
De grootheid t is volgens de nulhypothese student-t verdeeld met 22 vrijheidsgraden
Op grond van de waarnemingen is t = -1,75457
De overschrijdingskans is P( abs(t) > 1,7546) = 0,0933
Bij een significantieniveau (alfa) van 0.05 wordt de nulhypothese niet verworpen.
4
9-5-2014
Of met de GR
• Tests, T- test, data, invoeren van cijfers (los) in L1
• t= -1,7545…. En p= 0,09325…..
Tests, T- test, stat, invoeren van gemiddelde en SD
 0  6,5
x  6,2
s x  0,82
n  23
  0
Of een plaatje (DRAW)
5
9-5-2014
Levert allemaal hetzelfde resultaat:
Bruikbaar bij:
• Leerlingen die een steekproefuitslag willen vergelijken met een landelijke
uitspraak
• Jonge mannen van 18-25 jaar drinken het meest; 94 procent drinkt wel
eens alcohol, gemiddeld 1,8 glazen per dag.
• Jongeren van 18 tot 25 jaar doen daarnaast net zo vaak vrijwilligerswerk
als mensen van 25 jaar of ouder. In 2008 ging het om ongeveer
42 procent. Ze zetten zich vooral in voor sportverenigingen en voor
jeugdwerk.
(Bron: www.cbs.nl)
Welke toetsen kunnen we gebruiken?
Toetsen
Eén variabele
Z-toets
 Bekend
GR
T- toets
 Onbekend
Vu stat
Twee variabelen
Tekentoets
Binomiaal
GR
Meerdere variabelen
Ongepaard
2 onafhankelijke
steekproeven (2
verschillende
groepen)
Gepaard
2 afhankelijke
steekproeven
(dezelfde
proefpersonen)
T-toets
 Onbekend
GR
T-toets
 Onbekend
Excel
Chi kwadraat
Kruistabel, meerdere
groepen mogelijk
GR, Excel
6
9-5-2014
Voorbeeld 2: T-toets met 2 onafhankelijke variabelen
Voorbeeldvariabele
Proefwerkcijfer voor wiskunde A
Voorbeeldsituatie
Verschillen tussen leerlingen met een EM- en een NG-profiel
Voorbeeldvraag
Wijkt het gemiddelde toetscijfer van de EM-leerling significant af van het
gemiddelde cijfer van de NG-leerling?
Hypothese
Het gemiddelde cijfer van de NG en EM leerlingen is gelijk
H 0 :  EM   NG
H1 :  EM   NG
Aannamen
Steekproeven: willekeurig samengesteld (aselect). De
steekproefgroottes hoeven niet gelijk te zijn. De toets houdt
hier rekening mee. Er mag geen samenhang zijn tussen
de cijfers (ongepaarde steekproeven).
Verdeling: steekproefgemiddeldes zijn normaal verdeeld. Je
mag volgens de centrale limietstelling altijd aannemen dat een
steekproef bij benadering normaal verdeeld is als je meer dan
20-30 waarnemingen hebt per groep.
Varianties: de werkelijke varianties zijn onbekend.
Steekproefresultaat
In de GR: resultaten van de eerste groep in L2, de resultaten van de tweede
groep in L3  2-sample t-test (pooled betekent dat de varianties van beide
verdelingen gelijk zijn, maar die zijn onbekend. Dus Pooled = No.
In Excel
• T.TEST(F18:F59;F60:F80;2;3)
• 0,182559
• 2-sampleTTest pooled no
• Profielendata.xlsx
Met de GR invoeren in L2 en L3
7
9-5-2014
N2 = 21
Voorbeeld 3: T-toets met 2 afhankelijke variabelen
Voorbeeldvariabele
IQ van leerlingen geschat door de wiskundedocent en door de mentor
(Engels)
Voorbeeldsituatie
Omdat mentoren iets meer geneigd zijn om in termen van mogelijkheden
over hun leerlingen te denken en wiskundedocenten iets meer letten op de
daadwerkelijke prestaties zou er een verschil kunnen zijn, de mentoren
zouden de leerlingen iets hoger inschatten.
Voorbeeldvraag
Wijkt het geschatte door de wiskundedocent IQ significant af van het door
de mentor geschatte IQ?
Hypothese
Het geschatte IQ van leerlingen is gelijk
H 0 : m  w  0
H1 :  m   w  0
Aannamen
Steekproeven: het gaat om een herhaalde meting in dezelfde groep, dus
een paarsgewijze steekproef.
Verdeling: steekproefgemiddeldes zijn normaal verdeeld. Je
mag volgens de centrale limietstelling altijd aannemen dat een
steekproef bij benadering normaal verdeeld is als je meer dan
20-30 waarnemingen hebt per groep.
Varianties: de werkelijke varianties zijn onbekend.
Steekproefresultaat
Zie tabel
8
9-5-2014
Paar
Verschil
Paar
Mentor
Wi-docent
Mentor
Wi-docent
1
115
Schatting door
115
0
12
115
Schatting door
105
Verschil
10
2
125
135
-10
13
115
115
0
3
135
135
0
14
115
115
4
125
115
10
15
120
120
0
5
135
115
20
16
115
130
-15
6
125
95
30
17
115
115
0
7
85
105
-20
18
115
130
-15
8
125
115
10
19
115
115
0
0
9
125
115
10
20
130
115
15
10
125
115
10
21
115
120
-5
11
95
95
0
22
120
90
30
Gemiddelde verschil V  3,64
sv  13,11
3,64  0
V  V
 22  1,30
sV  n 
13,11
df  n  1  22  1  21
tv 
Opzoeken in een tabel geeft:
Bij   0,05 en df  21
PR (tV  1,30)  0,1038
• De conclusie is dat we de nulhypothese behouden (geen verschil)
T-toets voor afhankelijke waarnemingen is eenvoudig met
de hand of GR te berekenen:
In GR:
L1 eerste waarneming
L2 tweede waarneming
L3 = L1 – L2
CALCULATE 1-VAR-STATS om (gemiddelde en)
standaarddeviatie te berekenen
T-test (één variabele, namelijk het verschil!) μ = 0 tegen μ > 0
En je vindt p=0,1037
Bij α = 0,05 kun je de nulhypothese behouden
9
9-5-2014
Dat ziet er zo uit:
Voorbeeld waar je een gepaarde t-toets zou kunnen
gebruiken:
Voorbeeld 4: chi kwadraattoets met 6 categorieën
Voorbeeldvariabele
Aantal ogen van een dobbelsteen
Voorbeeldsituatie
Omdat er heel vaak 2 of 6 wordt gegooid kun je je afvragen of er met een
dobbelsteen is geknoeid
Voorbeeldvraag
Wijkt de frequentieverdeling van de dobbelsteen significant af van de
verwachte frequentieverdeling?
Hypothese
De aantallen ogen komen even vaak voor. Ofwel: de kans op een 1 is even
groot als de kans op een 2 enz.
H 0 : 1   2   3   4   5   6
H1 : niet H 0
Aannamen
Steekproeven: Het gaat om een aantal keren gooien met een dobbelsteen.
Verdeling: minder dan 20% van de categorieën heeft een frequentie van
minder dan 5, geen enkele categorie heeft frequentie 0.
Steekproefresultaat
Zie tabel
10
9-5-2014
Steekproefresultaat
Waarde dobbelsteen
Geobserveerde
frequenties
Verwachte
frequenties
1
2
3
4
5
6
Totaal
fo
11
9
12
10
11
7
60
fe
10
10
10
10
10
10
60
We verwachten in elke cel van de tabel ongeveer dezelfde frequentie
Toetsingsgrootheid is in dit geval chi-kwadraat met 5 vrijheidsgraden (k - 1):
2  
( f0  fe )2
fe
Hier levert dat
 2  0,859
Dat is een relatief kleine waarde, de kritieke waarde ligt bij α = 0.05 bij 11,07. Uit deze
steekproef kun je dus niet concluderen dat de dobbelsteen onzuiver is.
In de GR ziet dat er zo uit:
Welke toetsen kunnen we gebruiken?
Toetsen
Eén variabele
Z-toets
 bekend
T- toets
 onbekend
Twee variabelen
Tekentoets
Binomiaal
Meerdere variabelen
Ongepaard
2 onafhankelijke
steekproeven (2
verschillende
groepen)
Gepaard
2 afhankelijke
steekproeven
(dezelfde
proefpersonen)
T-toets
 onbekend
T-toets
 onbekend
Chi kwadraat
Kruistabel, meerdere
groepen mogelijk
11