Uitwerkingen-quizzes-2014

1. gegevens: 4, 4, 5, 5, 6, 7, 8, 9. De mediaan van de gegevens boven is hetzelfde als het gemiddelde
5.5. Klopt niet, want de mediaan is 5.5 en het gemiddelde is 6
2. Zelfde gegevens. De studie kan geanalyseerd worden dmv een numerieke variabele.
Klopt, want de cijfers zijn waarden van de ene variabele
3. Zelfde gegevens. De modus van deze dataverzameling is:
5.0, de modus is de waarde die het meeste voorkomt. 4. Haarkleur, met als waarden blond, rood en zwart is een kwalitatieve variabele. Klopt, een kwalitatieve variabele plaatst een individu in een groep. 5. Welke soort vraiabele (meetniveau) is de variabele 'leeftijd', als men hiervoor de volgende waarden
hanteert: jong (onder 20), jong-volwassene (21-30), vroeg middelbaar leeftijd (31-45), late middelbare
leeftijd (45-65), oud (boven 65).
Ordinaal. Een ordinale variabele plaatst individuen in een van de reeks
gerangschikte categorieen (categorieen met een belangrijke volgorde)
6. Doosdiagrammen (boxplots) laten welke van de volgende elementen in een verdeling zien? Eerste kwartielafstand, uitschieters, de interkwartielafstand
7. 5, 5, 5, 5, 5, 5, 5, wat is de standaardafwijking?
0
8. Bij een rechtscheve verdeling (dwz met een lange staart rechts):
ligt het gemiddelde hoger dan de mediaan. 9. Bij normale verdelingen: - correspondeert de afstand tot het gemiddelde in aantal standaardafwijkingen met de frequentie
van de observatie
- valt het gemiddelde samen met de mediaan
- heeft men met numerieke variabelen te maken
geen van boven
10. Als verdelingen ongeveer normaal zijn, kan men ze goed beschrijven dmv hun gemiddelde en
standaardafwijking. Bij scheve verdelingen zijn de vijf getallen (minimum, maximum, mediaan, eerste
en derde kwartiel) beter. klopt
11. de mediaan is minder resistent dan het gemiddelde klopt
12. Iedere afwijking van een rechte lijn in het normaalkwantieldiagram van steekproefgegevens
betekent dat de populatie waaruit de steekproef is genomen vermoedelijk niet normaal verdeeld is
klopt niet
13. Michael krijgt een score van 13 op zijn toets waar de scores normaal verdeeld zijn met gem. 15 en
standaardafwijking 2. De corresponderende gestandaardiseerde z-score is
-1, want z-scores geven de positie van een score of meting aan tav het gemiddelde
(in aantal standaardafwijkingen)
14. Moniek draagt schoenen in maat 40. Schoenmaten voor vrouwen zijn normaal verdeeld (37, 1.5).
Hoeveel vrouwen hebben grotere schoenen dan Moniek?
- ong. 300.000
- ong. 2.5%
- ong. 5%
- dit is niet uit de beschikbare informatie af te leiden
ongeveer 2.5%, we weten dat 95% van de normale verdeling binnen twee SD's van
het gemiddelde is en dat de verdeling symmetrisch is. dus ligt 2.5% meer dan 2
SD's boven het gemiddelde (en 2.5% meer dan 2 SD's beneden het gemiddelde)
15. Schoenmaten voor vrouwen zin normaal verdeeld N(37, 1.5). Onder welke grens zitten de kleinste
16% van de vrouwenschoenen? - onder de grote rivieren
- onder de bovenste 84%
- maat 35.5
- dit is niet uit de beschikbare informatie af te leiden.
Maat 35.5, want we weten dat 68% van de normale verdeling binnen een SD van
het gem. is en dat de verdeling symmetrisch is. Dus ligt 32% meer dan 1 SD
beneden of boven het gem. en gelijk gesplitst. Dus ligt 16% meer dan 1 SD
beneden het gem. (en 16% meer dan 1 SD boven het gem.). 1 SD beneden het
gem. is maat (37 - 1.5 = 35.
Quiz 2
1. Als het onbekend is of een verdeling van gegevens normaal is, mag men niet concluderen dat 95%
van de gegevens binnnen twee SD's van het gemiddelde ligt.
Klopt, men mag dat niet concluderen. 2. Overal waar het verzamelen van gegevens onverwacht lang duurde, verdient een tijdreeksgrafiek
de aanbeveling. Klopt niet. Tijdreeksgrafieken geven inzicht in het verloop van metingen in de tijd, of
deze metingen over korte lan gwel langere perioden werden uitgevoerd. 3. De vertaling naar z-scores vergemakkelijkt de interpretatie van gegevens maar maakt de
statistische analyse lastiger. Klopt niet. 4. Met welke z-waarde correspondeert de score 139 met een verdeling N(125, 7)
2
5. De laagste 10% van de scores van de scholieren op een gestandaardiseerde leestoets worden
geidentificeerd zodat leerkrachten voor problemen alert kunnen zijn. De toetsscores zijn normaal
verdeeld, met gem. 60 en standaardafwijking 7.8. Wat zijn de laagste 10% van de scores?
≤ 50
6. Als klant besluit iets te kopen bij het internetbedrijf koop-ze, dan besteedt hij of zij gem. 22E per
bezoek (sd = 9). Het bedrijf wil een actie starten voor de belangrijke 1% van hun klanten. Hoeveel
moet een klant bij een bezoek beteden om binnen de top van 1% te vallen?
≤43
7. Je bestudeert de resultaten van een herkenbaarheidsonderzoek van een merknaam dmv een tots
met een bekende SD(10) in een populatie van tieners die potentiele klanten zijn. Het
steekproefgemiddelde is 74 bij een steekproef van 25 deelnemers. De standaardfout = - 24
- 15
- 3
- geen van deze cijfers
Geen van deze cijfers, want het gaat om de verdeling van de
steekproefgemiddelden (voor alle denkbare steekproeven)
8. Zelfde gegevens. Wat is de kritieke z-waarde voor een betrouwbaarheidsinterval van 99%?
Ongeveer 2.58 (99% is ongeveer gelijk aan 3 standaardafwijkingen)
9. Zelfde gegevens. Als het bekend is dat het populatiegemiddelde bij deze toets gelijk is aan 70.
Welke z-waarde heeft deze steekproef dan?
- 0.4
- 2.0
- 4.0
- 40%
2.0. Je gebruikt standaardfout ipv Sd omdat je de steekproef analyseert (ipv een
individuele score)
10. Zelfde gegevens. Als je steekproef bestaat uit de reacties van tieners tav de naam
"rhinoscerology", dan kun je zen of deze merknaam anders dan gemiddeld herkenbaar is. Wat is de
correcte vorm van H0 en Ha? We schrijven mr, mur voor de gem. herkenbaarheid van het merk en
malg, mualg voor de gem. herkenbaarheid van welke merknaam dan ook. De griekse letter mu en de
latijnse m hebben (zoals gebruikelijk) verschillende betekenissen. - H0: Mr=Malg, Ha=Mr>Malg
- H0: Mr=Malg, Ha=Mr≠Malg
- H0: Mur=Mualg, Ha: Mur>Mualg
- H0: Mur = Mualg, Ha: Mur ≠ Mualg
H0: Mur = Mualg, Ha: Mur ≠ Mualg. De H0 moet over de populatie gaan, niet over
de steekproef en heeft conceptueel de status van de bewering dat niets bijzonders
aan de hand is. Dus Mu gaat over de populatie en M gaat over de steekproef. 11. Zelfde gegevens. Wat is je conclusie tav de vorige vraag? We wijzen H0 af. Het verschil tussen 'Rhinoscerology' en de gem. andere merknaam
is significant op het niveau SD<0.5. De waarde 74 ligt twee standaardfouten boven
het populatiegem. (70), dus z = 2. Volgens tabel A ligt 0.9772 van de verdeling lager.
De kans dat z op basis van toeval zo hoog of hoger zou zijn is 0.0228. Dit is ook de
kans dat men een zo afwijkende steekproef zou zien als er niets bijzonders aan de
hand is met ' rhinoscerology' . (H0, dwz als dit merk net zo herkenbaar was als de
algemene populatie). Omdat de kans zo klein is, wijzen we H0 af. 12. Je leest een artikel waarin wordt gemeld dat een resultaat werd geanalyseerd dmv een fishers
exact toets en significant is op het niveau SD = 0.005. Dan is het resultaat ook significnt op het niveau
SD = 0.01. Klopt, significant op het niveau SD = X impliceert altijd significant op het niveau SD
= X' (voor X<X')
13. Je moet de resultaten van een onderwijsprogramma onderzoeken. Er is hiervoor een toets
bescihkbaar met gem. mu=85 en SD = 5. Er werd gezegd dat prestaties hoger liggen voor scholieren
die het programma hebben gevolgd. Je wiltnagaan of het programma daadwerkelijk een verbetering
opleverrt. Je neemt een aselecte steekproef van 25 scholieren die het programma volgden.
Identificeerd de nulhypothese en het alternatief. H0: muprog- = muprog+
Ha: Muprog- ≤ muprog+
14. zelfde gegevens. De toetsinsgrootheid is het gemiddelde. Is de toets een of tweezijdig?
eenzijdig, want je zoekt in een richting, namelijk verbetering
15. Zelfde gegevens. Als het gemiddelde resultaat voor scholieren die het programma volgden op
87.5 ligt, wat concludeer je dan?
We wijzen H0 af en accepteren Ha. Het programma is wel degelijk van invloed. De
waarde 87.5 ligt 2.5 standaardfouten boven het populatiegemiddelde (85), dus z =
2.5. Volgens tabel A ligt 0.9938 van de verdeling lager. De kans dat z op basis van
toeval zo hoog of hoger zou zijn is 0.0062. Dit is ok de kans da tmen een zo
afwijkende steekproef zou zien als er niet bijzonders aan de hand is met het
programma (H0). Omdat de kans zo klein is )duidelijk onder het normale niveau van
SD 0.05) wijzen we H0 af.