9-5-2014 Wiskundedialoog 13 mei 2014 Statistiek in het profielwerkstuk Lianne Dirven Montessori College Nijmegen Radboud Universiteit FNWI Saskia van Boven Radboud Docenten Academie De onderzoekscyclus 1 9-5-2014 • • • • Probleemstelling Vraag formuleren Variabelen benoemen Het verzamelen van data: - Welke populatie ondervragen? Welke data verzamelen? Hoe data verzamelen? Hoeveel data verzamelen? Welk meetbaarheid? Hoe data weergeven? Hoe doe je onderzoek? • Verwachtingen uitspreken • Analyse van de data: - Datatabel beoordelen. Diagrammen en grafieken, visualisaties beoordelen. Beschrijven van waarneming (patronen, regelmaat, …) Relaties tussen variabelen beschrijven. - Kwantificatie middels geschikte centrummaten en spreidingsmaten . - Oorzaken van fouten: - Nauwkeurigheid van metingen? Representativiteit steekproef? Systematische fout gemaakt? Te beperkte vraagstelling? Te grote non-response (bij enquêtes)? - Conclusies trekken (ook verwachtingen bijstellen) • Voorstellen voor nader onderzoek Waarmee komen leerlingen en collega’s? • • • • • • • • Ik wil iets met drugs Schoonheid Duikreflex Sporten beter met of zonder muziek? Tweelingen Hoe groot moet mijn steekproef zijn? Welke data heb ik nodig? …. Maar hoe buig je dit om tot een onderzoekbare onderzoeksvraag? 2 9-5-2014 Vanuit de toetsende statistiek geredeneerd: • Het vergelijken van twee groepen (bijvoorbeeld jongens en meisjes) • Het vergelijken van meerdere groepen (bijvoorbeeld leerlingen met een verschillend profiel) • Het vergelijken van een score voor en na een interventie Over welke toetsen hebben we het dan? • • • • de binomiale toets de z-toets (normale verdeling) de t-toets 2 de toets Welke toetsen kunnen we gebruiken? Toetsen Eén variabele Z-toets bekend T- toets onbekend Twee variabelen Tekentoets Binomiaal Meerdere variabelen Ongepaard 2 onafhankelijke steekproeven (2 verschillende groepen) Gepaard 2 afhankelijke steekproeven (dezelfde proefpersonen) T-toets onbekend T-toets onbekend Chi kwadraat Kruistabel, meerdere groepen mogelijk Voorbeeld 1: T-toets met 1 variabele Voorbeeldvariabele Gemiddelde cijfer CE van klas 6A Voorbeeldsituatie In Euclides lees je dat het landelijk gemiddelde 6,5 is Voorbeeldvraag Wijkt het gemiddelde van mijn klas significant af van het landelijk gemiddelde? Hypothese Het gemiddelde van mijn klas wijkt niet significant af van het landelijk gemiddelde. Aannamen Steekproef: willekeurig samengesteld (aselect) Verdeling: steekproefgemiddelde is normaal verdeeld. Je mag volgens de centrale limietstelling altijd aannemen dat de steekproef bij benadering normaal verdeeld is als je meer dan 20-30 waarnemingen hebt. Variantie: de werkelijke variantie van het landelijk cijfer is onbekend, anders zou je een z-toets doen. Steekproefresultaat n=23; µ = 6,2, = 0,82 levert in VU-stat 3 9-5-2014 In VU-stat ziet dat er zo uit: • vustat.exe • data_voor_13_mei.xlsx t-toets: normale verdeling, SD onbekend De grootheid Xi is normaal verdeeld. Nulhypothese H0 : µ = 6,5. Alternatieve hypothese H1 : µ <> 6,5 Aantal waarnemingen n = 23 Het gemiddelde van de waarnemingen is 6,2 De standaarddeviatie van de waarnemingen is 0,82 Toetsingsgrootheid t = (XGem. - 6,5)/( SD / √23) De grootheid t is volgens de nulhypothese student-t verdeeld met 22 vrijheidsgraden Op grond van de waarnemingen is t = -1,75457 De overschrijdingskans is P( abs(t) > 1,7546) = 0,0933 Bij een significantieniveau (alfa) van 0.05 wordt de nulhypothese niet verworpen. 4 9-5-2014 Of met de GR • Tests, T- test, data, invoeren van cijfers (los) in L1 • t= -1,7545…. En p= 0,09325….. Tests, T- test, stat, invoeren van gemiddelde en SD 0 6,5 x 6,2 s x 0,82 n 23 0 Of een plaatje (DRAW) 5 9-5-2014 Levert allemaal hetzelfde resultaat: Bruikbaar bij: • Leerlingen die een steekproefuitslag willen vergelijken met een landelijke uitspraak • Jonge mannen van 18-25 jaar drinken het meest; 94 procent drinkt wel eens alcohol, gemiddeld 1,8 glazen per dag. • Jongeren van 18 tot 25 jaar doen daarnaast net zo vaak vrijwilligerswerk als mensen van 25 jaar of ouder. In 2008 ging het om ongeveer 42 procent. Ze zetten zich vooral in voor sportverenigingen en voor jeugdwerk. (Bron: www.cbs.nl) Welke toetsen kunnen we gebruiken? Toetsen Eén variabele Z-toets Bekend GR T- toets Onbekend Vu stat Twee variabelen Tekentoets Binomiaal GR Meerdere variabelen Ongepaard 2 onafhankelijke steekproeven (2 verschillende groepen) Gepaard 2 afhankelijke steekproeven (dezelfde proefpersonen) T-toets Onbekend GR T-toets Onbekend Excel Chi kwadraat Kruistabel, meerdere groepen mogelijk GR, Excel 6 9-5-2014 Voorbeeld 2: T-toets met 2 onafhankelijke variabelen Voorbeeldvariabele Proefwerkcijfer voor wiskunde A Voorbeeldsituatie Verschillen tussen leerlingen met een EM- en een NG-profiel Voorbeeldvraag Wijkt het gemiddelde toetscijfer van de EM-leerling significant af van het gemiddelde cijfer van de NG-leerling? Hypothese Het gemiddelde cijfer van de NG en EM leerlingen is gelijk H 0 : EM NG H1 : EM NG Aannamen Steekproeven: willekeurig samengesteld (aselect). De steekproefgroottes hoeven niet gelijk te zijn. De toets houdt hier rekening mee. Er mag geen samenhang zijn tussen de cijfers (ongepaarde steekproeven). Verdeling: steekproefgemiddeldes zijn normaal verdeeld. Je mag volgens de centrale limietstelling altijd aannemen dat een steekproef bij benadering normaal verdeeld is als je meer dan 20-30 waarnemingen hebt per groep. Varianties: de werkelijke varianties zijn onbekend. Steekproefresultaat In de GR: resultaten van de eerste groep in L2, de resultaten van de tweede groep in L3 2-sample t-test (pooled betekent dat de varianties van beide verdelingen gelijk zijn, maar die zijn onbekend. Dus Pooled = No. In Excel • T.TEST(F18:F59;F60:F80;2;3) • 0,182559 • 2-sampleTTest pooled no • Profielendata.xlsx Met de GR invoeren in L2 en L3 7 9-5-2014 N2 = 21 Voorbeeld 3: T-toets met 2 afhankelijke variabelen Voorbeeldvariabele IQ van leerlingen geschat door de wiskundedocent en door de mentor (Engels) Voorbeeldsituatie Omdat mentoren iets meer geneigd zijn om in termen van mogelijkheden over hun leerlingen te denken en wiskundedocenten iets meer letten op de daadwerkelijke prestaties zou er een verschil kunnen zijn, de mentoren zouden de leerlingen iets hoger inschatten. Voorbeeldvraag Wijkt het geschatte door de wiskundedocent IQ significant af van het door de mentor geschatte IQ? Hypothese Het geschatte IQ van leerlingen is gelijk H 0 : m w 0 H1 : m w 0 Aannamen Steekproeven: het gaat om een herhaalde meting in dezelfde groep, dus een paarsgewijze steekproef. Verdeling: steekproefgemiddeldes zijn normaal verdeeld. Je mag volgens de centrale limietstelling altijd aannemen dat een steekproef bij benadering normaal verdeeld is als je meer dan 20-30 waarnemingen hebt per groep. Varianties: de werkelijke varianties zijn onbekend. Steekproefresultaat Zie tabel 8 9-5-2014 Paar Verschil Paar Mentor Wi-docent Mentor Wi-docent 1 115 Schatting door 115 0 12 115 Schatting door 105 Verschil 10 2 125 135 -10 13 115 115 0 3 135 135 0 14 115 115 4 125 115 10 15 120 120 0 5 135 115 20 16 115 130 -15 6 125 95 30 17 115 115 0 7 85 105 -20 18 115 130 -15 8 125 115 10 19 115 115 0 0 9 125 115 10 20 130 115 15 10 125 115 10 21 115 120 -5 11 95 95 0 22 120 90 30 Gemiddelde verschil V 3,64 sv 13,11 3,64 0 V V 22 1,30 sV n 13,11 df n 1 22 1 21 tv Opzoeken in een tabel geeft: Bij 0,05 en df 21 PR (tV 1,30) 0,1038 • De conclusie is dat we de nulhypothese behouden (geen verschil) T-toets voor afhankelijke waarnemingen is eenvoudig met de hand of GR te berekenen: In GR: L1 eerste waarneming L2 tweede waarneming L3 = L1 – L2 CALCULATE 1-VAR-STATS om (gemiddelde en) standaarddeviatie te berekenen T-test (één variabele, namelijk het verschil!) μ = 0 tegen μ > 0 En je vindt p=0,1037 Bij α = 0,05 kun je de nulhypothese behouden 9 9-5-2014 Dat ziet er zo uit: Voorbeeld waar je een gepaarde t-toets zou kunnen gebruiken: Voorbeeld 4: chi kwadraattoets met 6 categorieën Voorbeeldvariabele Aantal ogen van een dobbelsteen Voorbeeldsituatie Omdat er heel vaak 2 of 6 wordt gegooid kun je je afvragen of er met een dobbelsteen is geknoeid Voorbeeldvraag Wijkt de frequentieverdeling van de dobbelsteen significant af van de verwachte frequentieverdeling? Hypothese De aantallen ogen komen even vaak voor. Ofwel: de kans op een 1 is even groot als de kans op een 2 enz. H 0 : 1 2 3 4 5 6 H1 : niet H 0 Aannamen Steekproeven: Het gaat om een aantal keren gooien met een dobbelsteen. Verdeling: minder dan 20% van de categorieën heeft een frequentie van minder dan 5, geen enkele categorie heeft frequentie 0. Steekproefresultaat Zie tabel 10 9-5-2014 Steekproefresultaat Waarde dobbelsteen Geobserveerde frequenties Verwachte frequenties 1 2 3 4 5 6 Totaal fo 11 9 12 10 11 7 60 fe 10 10 10 10 10 10 60 We verwachten in elke cel van de tabel ongeveer dezelfde frequentie Toetsingsgrootheid is in dit geval chi-kwadraat met 5 vrijheidsgraden (k - 1): 2 ( f0 fe )2 fe Hier levert dat 2 0,859 Dat is een relatief kleine waarde, de kritieke waarde ligt bij α = 0.05 bij 11,07. Uit deze steekproef kun je dus niet concluderen dat de dobbelsteen onzuiver is. In de GR ziet dat er zo uit: Welke toetsen kunnen we gebruiken? Toetsen Eén variabele Z-toets bekend T- toets onbekend Twee variabelen Tekentoets Binomiaal Meerdere variabelen Ongepaard 2 onafhankelijke steekproeven (2 verschillende groepen) Gepaard 2 afhankelijke steekproeven (dezelfde proefpersonen) T-toets onbekend T-toets onbekend Chi kwadraat Kruistabel, meerdere groepen mogelijk 11
© Copyright 2025 ExpyDoc