1. gegevens: 4, 4, 5, 5, 6, 7, 8, 9. De mediaan van de gegevens boven is hetzelfde als het gemiddelde 5.5. Klopt niet, want de mediaan is 5.5 en het gemiddelde is 6 2. Zelfde gegevens. De studie kan geanalyseerd worden dmv een numerieke variabele. Klopt, want de cijfers zijn waarden van de ene variabele 3. Zelfde gegevens. De modus van deze dataverzameling is: 5.0, de modus is de waarde die het meeste voorkomt. 4. Haarkleur, met als waarden blond, rood en zwart is een kwalitatieve variabele. Klopt, een kwalitatieve variabele plaatst een individu in een groep. 5. Welke soort vraiabele (meetniveau) is de variabele 'leeftijd', als men hiervoor de volgende waarden hanteert: jong (onder 20), jong-volwassene (21-30), vroeg middelbaar leeftijd (31-45), late middelbare leeftijd (45-65), oud (boven 65). Ordinaal. Een ordinale variabele plaatst individuen in een van de reeks gerangschikte categorieen (categorieen met een belangrijke volgorde) 6. Doosdiagrammen (boxplots) laten welke van de volgende elementen in een verdeling zien? Eerste kwartielafstand, uitschieters, de interkwartielafstand 7. 5, 5, 5, 5, 5, 5, 5, wat is de standaardafwijking? 0 8. Bij een rechtscheve verdeling (dwz met een lange staart rechts): ligt het gemiddelde hoger dan de mediaan. 9. Bij normale verdelingen: - correspondeert de afstand tot het gemiddelde in aantal standaardafwijkingen met de frequentie van de observatie - valt het gemiddelde samen met de mediaan - heeft men met numerieke variabelen te maken geen van boven 10. Als verdelingen ongeveer normaal zijn, kan men ze goed beschrijven dmv hun gemiddelde en standaardafwijking. Bij scheve verdelingen zijn de vijf getallen (minimum, maximum, mediaan, eerste en derde kwartiel) beter. klopt 11. de mediaan is minder resistent dan het gemiddelde klopt 12. Iedere afwijking van een rechte lijn in het normaalkwantieldiagram van steekproefgegevens betekent dat de populatie waaruit de steekproef is genomen vermoedelijk niet normaal verdeeld is klopt niet 13. Michael krijgt een score van 13 op zijn toets waar de scores normaal verdeeld zijn met gem. 15 en standaardafwijking 2. De corresponderende gestandaardiseerde z-score is -1, want z-scores geven de positie van een score of meting aan tav het gemiddelde (in aantal standaardafwijkingen) 14. Moniek draagt schoenen in maat 40. Schoenmaten voor vrouwen zijn normaal verdeeld (37, 1.5). Hoeveel vrouwen hebben grotere schoenen dan Moniek? - ong. 300.000 - ong. 2.5% - ong. 5% - dit is niet uit de beschikbare informatie af te leiden ongeveer 2.5%, we weten dat 95% van de normale verdeling binnen twee SD's van het gemiddelde is en dat de verdeling symmetrisch is. dus ligt 2.5% meer dan 2 SD's boven het gemiddelde (en 2.5% meer dan 2 SD's beneden het gemiddelde) 15. Schoenmaten voor vrouwen zin normaal verdeeld N(37, 1.5). Onder welke grens zitten de kleinste 16% van de vrouwenschoenen? - onder de grote rivieren - onder de bovenste 84% - maat 35.5 - dit is niet uit de beschikbare informatie af te leiden. Maat 35.5, want we weten dat 68% van de normale verdeling binnen een SD van het gem. is en dat de verdeling symmetrisch is. Dus ligt 32% meer dan 1 SD beneden of boven het gem. en gelijk gesplitst. Dus ligt 16% meer dan 1 SD beneden het gem. (en 16% meer dan 1 SD boven het gem.). 1 SD beneden het gem. is maat (37 - 1.5 = 35. Quiz 2 1. Als het onbekend is of een verdeling van gegevens normaal is, mag men niet concluderen dat 95% van de gegevens binnnen twee SD's van het gemiddelde ligt. Klopt, men mag dat niet concluderen. 2. Overal waar het verzamelen van gegevens onverwacht lang duurde, verdient een tijdreeksgrafiek de aanbeveling. Klopt niet. Tijdreeksgrafieken geven inzicht in het verloop van metingen in de tijd, of deze metingen over korte lan gwel langere perioden werden uitgevoerd. 3. De vertaling naar z-scores vergemakkelijkt de interpretatie van gegevens maar maakt de statistische analyse lastiger. Klopt niet. 4. Met welke z-waarde correspondeert de score 139 met een verdeling N(125, 7) 2 5. De laagste 10% van de scores van de scholieren op een gestandaardiseerde leestoets worden geidentificeerd zodat leerkrachten voor problemen alert kunnen zijn. De toetsscores zijn normaal verdeeld, met gem. 60 en standaardafwijking 7.8. Wat zijn de laagste 10% van de scores? ≤ 50 6. Als klant besluit iets te kopen bij het internetbedrijf koop-ze, dan besteedt hij of zij gem. 22E per bezoek (sd = 9). Het bedrijf wil een actie starten voor de belangrijke 1% van hun klanten. Hoeveel moet een klant bij een bezoek beteden om binnen de top van 1% te vallen? ≤43 7. Je bestudeert de resultaten van een herkenbaarheidsonderzoek van een merknaam dmv een tots met een bekende SD(10) in een populatie van tieners die potentiele klanten zijn. Het steekproefgemiddelde is 74 bij een steekproef van 25 deelnemers. De standaardfout = - 24 - 15 - 3 - geen van deze cijfers Geen van deze cijfers, want het gaat om de verdeling van de steekproefgemiddelden (voor alle denkbare steekproeven) 8. Zelfde gegevens. Wat is de kritieke z-waarde voor een betrouwbaarheidsinterval van 99%? Ongeveer 2.58 (99% is ongeveer gelijk aan 3 standaardafwijkingen) 9. Zelfde gegevens. Als het bekend is dat het populatiegemiddelde bij deze toets gelijk is aan 70. Welke z-waarde heeft deze steekproef dan? - 0.4 - 2.0 - 4.0 - 40% 2.0. Je gebruikt standaardfout ipv Sd omdat je de steekproef analyseert (ipv een individuele score) 10. Zelfde gegevens. Als je steekproef bestaat uit de reacties van tieners tav de naam "rhinoscerology", dan kun je zen of deze merknaam anders dan gemiddeld herkenbaar is. Wat is de correcte vorm van H0 en Ha? We schrijven mr, mur voor de gem. herkenbaarheid van het merk en malg, mualg voor de gem. herkenbaarheid van welke merknaam dan ook. De griekse letter mu en de latijnse m hebben (zoals gebruikelijk) verschillende betekenissen. - H0: Mr=Malg, Ha=Mr>Malg - H0: Mr=Malg, Ha=Mr≠Malg - H0: Mur=Mualg, Ha: Mur>Mualg - H0: Mur = Mualg, Ha: Mur ≠ Mualg H0: Mur = Mualg, Ha: Mur ≠ Mualg. De H0 moet over de populatie gaan, niet over de steekproef en heeft conceptueel de status van de bewering dat niets bijzonders aan de hand is. Dus Mu gaat over de populatie en M gaat over de steekproef. 11. Zelfde gegevens. Wat is je conclusie tav de vorige vraag? We wijzen H0 af. Het verschil tussen 'Rhinoscerology' en de gem. andere merknaam is significant op het niveau SD<0.5. De waarde 74 ligt twee standaardfouten boven het populatiegem. (70), dus z = 2. Volgens tabel A ligt 0.9772 van de verdeling lager. De kans dat z op basis van toeval zo hoog of hoger zou zijn is 0.0228. Dit is ook de kans dat men een zo afwijkende steekproef zou zien als er niets bijzonders aan de hand is met ' rhinoscerology' . (H0, dwz als dit merk net zo herkenbaar was als de algemene populatie). Omdat de kans zo klein is, wijzen we H0 af. 12. Je leest een artikel waarin wordt gemeld dat een resultaat werd geanalyseerd dmv een fishers exact toets en significant is op het niveau SD = 0.005. Dan is het resultaat ook significnt op het niveau SD = 0.01. Klopt, significant op het niveau SD = X impliceert altijd significant op het niveau SD = X' (voor X<X') 13. Je moet de resultaten van een onderwijsprogramma onderzoeken. Er is hiervoor een toets bescihkbaar met gem. mu=85 en SD = 5. Er werd gezegd dat prestaties hoger liggen voor scholieren die het programma hebben gevolgd. Je wiltnagaan of het programma daadwerkelijk een verbetering opleverrt. Je neemt een aselecte steekproef van 25 scholieren die het programma volgden. Identificeerd de nulhypothese en het alternatief. H0: muprog- = muprog+ Ha: Muprog- ≤ muprog+ 14. zelfde gegevens. De toetsinsgrootheid is het gemiddelde. Is de toets een of tweezijdig? eenzijdig, want je zoekt in een richting, namelijk verbetering 15. Zelfde gegevens. Als het gemiddelde resultaat voor scholieren die het programma volgden op 87.5 ligt, wat concludeer je dan? We wijzen H0 af en accepteren Ha. Het programma is wel degelijk van invloed. De waarde 87.5 ligt 2.5 standaardfouten boven het populatiegemiddelde (85), dus z = 2.5. Volgens tabel A ligt 0.9938 van de verdeling lager. De kans dat z op basis van toeval zo hoog of hoger zou zijn is 0.0062. Dit is ok de kans da tmen een zo afwijkende steekproef zou zien als er niet bijzonders aan de hand is met het programma (H0). Omdat de kans zo klein is )duidelijk onder het normale niveau van SD 0.05) wijzen we H0 af.
© Copyright 2025 ExpyDoc