OEFENINGENBUNDEL STATISTIEK Oefeningen bij het vak statistiek van prof. dr. M. Hubert 2004-2005 Eerste bachelor wiskunde, informatica en natuurkunde 1 Discrete verdelingen algemeen REEKS 1 1. Kies willekeurig een Amerikaans gezin en stel X het aantal personen die in het gezin wonen. De gezinnen met meer dan zeven inwoners laten we eruit. De kansverdeling van X is als volgt: Aantal Kans 1 0.237 2 0.317 3 0.178 4 0.157 5 0.070 6 0.026 7 0.015 • Ga na dat dit een goede discrete kansverdeling is en teken de dichtheidsfunctie. • Wat is P (X ≥ 5)? • Wat is P (X > 5)? • Wat is P (2 < X ≤ 4)? • Wat is P (X 6= 1)? • Wat is de kans van de gebeurtenis dat een willekeurig gekozen gezin meer dan twee personen bevat? 2. Bereken gemiddelde en standaarddeviatie voor de volgende verdelingen. Teken de dichtheidsfunctie en de verdelingsfunctie en duid het gemiddelde aan. (a) k 0 1 2 3 f (k) 0.01 0.10 0.38 0.51 (b) k 0 1 2 3 f (k) 0.07 0.10 0.18 0.65 3. Drie kranten A,B,C worden verkocht in een bepaalde stad. Uit een onderzoek blijkt het volgende: 20% van de bevolking koopt krant A 16% van de bevolking koopt krant B 14% van de bevolking koopt krant C 8% van de bevolking koopt kranten A en B 5% van de bevolking koopt kranten A en C 4% van de bevolking koopt kranten B en C 2% van de bevolking koopt kranten A,B en C Wat is de waarschijnlijkheid dat een persoon twee kranten koopt? 4. Sommige kansspelen zijn gebaseerd op het werpen met twee dobbelstenen. Elke dobbelsteen heeft zes kanten, gemarkeerd met 1,2,...,6. De dobbelstenen die men in casino’s gebruikt, worden zorgvuldig gebalanceerd zodat elke kant gelijke kans heeft. De uitkomst die van belang is voor een gokker is de som van het aantal ogen op de twee dobbelstenen. Noem dit de toevalsvariabele X. • Schrijf alle mogelijke uitkomsten op van de twee dobbelstenen. 2 • Als alle paren dezelfde kans hebben, wat is dan de kans van ´e´en paar? • Schrijf de waarde van X naast elk paar en gebruik dit om de kansverdeling van X te bepalen. Teken een histogram van deze kansverdeling. • Een man wint in een weddenschap indien een 7 of een 11 tevoorschijn komt bij de volgende worp van de twee dobbelstenen. Wat is de kans van deze gebeurtenis? • Wat is de kans dat iets anders dan 7 wordt gegooid? 5. De weg die een bestuurder gebruikt naar zijn werk bevat twee kruispunten met verkeerslichten. Na jarenlange ervaring weet hij: de kans dat ik aan het eerste licht moet stoppen is 0.4; de kans dat ik aan het tweede licht moet stoppen is 0.5 en aan geen enkel licht is 0.4. Wat is de kans dat hij voor het eerste licht, maar niet voor het tweede licht moet stoppen? En omgekeerd? 6. Aan een bepaalde universiteit zijn er voor het eerste jaar bio-ingenieur 200 studenten ingeschreven. Bij het begin van het academiejaar worden ze door lottrekking ingedeeld in 11 groepen: 10 groepen (genummerd van 1 tot en met 10) van vijftien studenten en 1 groep (groepsnummer 11) van vijftig studenten. E´en van de studenten is Eric. Noem X de grootte van de groep waarin deze student terecht komt. X kan je aanzien als een s.v. Bepaal EX. Men beschikt verder over 11 assistenten: eveneens door lottrekking wordt aan ieder een groep toegewezen. Noem Y de grootte van de groep die aan de oudste assistent wordt toegekend. Bepaal EY en vergelijk met EX. 7. Je kan de keuze maken uit twee spelen. In spel A werp je een (gebalanceerde) dobbelsteen ´e´enmaal en ontvang je het bedrag X = {het geworpen aantal ogen (in $) }. In spel B werp je een (gebalanceerde) dobbelsteen tweemaal en ontvang je Y = {het maximum van de twee uitkomsten}. Indien de inzet voor spel A 3 dollar is, en voor spel B 3.5 dollar, welk spel zou je dan kiezen? 8. Zoek a zodat 2 a 0.3 − 2a f (k) = 0.2 0 als k = 0 als k = 1 als k = 2 elders een discrete verdeling is van een stochastische veranderlijke. 9. Stel dat n kandidaten voor een bepaalde job geordend werden van 1, 2, ..., n. Stel X = het rangnummer van een geselecteerde kandidaat, waarbij X een dichtheidsfunctie heeft als volgt: 1/n voor k = 1, 2, ..., n f (k) = 0 anders (Dit noemt men de discrete uniforme verdeling). Bereken het gemiddelde en de variantie. (Hint: de som van de eerste n positieve natuurlijke getallen is n(n + 1)/2, en de som van hun kwadraten is n(n + 1)(2n + 1)/6.) 10. In een experiment op het gedrag van jonge kinderen werd elk kind in een ruimte geplaatst met vijf stuks speelgoed. Men is vnl. ge¨ınteresseerd in het aantal stuks speelgoed waarmee het kind speelt. We gebruiken de dichtheidsfunctie die bekomen werd uit vroegere experimenten die uitgevoerd werden op een groot aantal kinderen: 3 k f (k) 0 0.03 1 0.16 2 0.30 3 0.23 4 0.17 5 0.11 Bereken verwachtingswaarde en standaarddeviatie. 11. Tegen betaling van anderhalve euro inzet in een gokspel op de kermis kan men kiezen 2 tussen twee mogelijke terugbetalingen: g(X) = 2X en h(X) = X15 . X is hierbij een getal dat lukraak door de speler getrokken wordt uit een zak waarin de getallen 0 tot en met 50 steken. Welke terugbetalingsvorm zal je kiezen indien je de gemiddelde opbrengst wil maximaliseren? (Hint: de som van de eerste n positieve natuurlijke getallen is n(n + 1)/2, en de som van hun kwadraten is n(n + 1)(2n + 1)/6.) 12. Een klassieke jackpot bestaat uit drie draaiende schijven waarop twintig plaatjes staan afgebeeld met daarop kersen, citroenen, pruimen, sinaasappels, klokken of ‘BAR’ geschilderd. De verdeling van de plaatjes per schijf is als volgt: kersen sinaasappels citroenen pruimen klokken BAR schijf 1 7 3 3 4 2 1 schijf 2 7 7 0 1 2 3 schijf 3 0 6 4 6 3 1 Wanneer je nu een muntje in de jackpot steekt en aan een hendel trekt, maak je kans op een vermenigvuldiging van je inzet naargelang de drie plaatjes die op het scherm verschijnen. Een typische uitbetalingstabel voor een jackpot is de volgende (met “beloning” bedoelen we het aantal keer dat je je inzet terugkrijgt): schijf 1 BAR klok klok pruim sinaasappel sinaasappel kers kers schijf 2 BAR klok klok pruim sinaasappel sinaasappel kers alles behalve een kers schijf 3 BAR klok BAR pruim sinaasappel BAR om het even om het even beloning 60 20 18 14 10 6 2 1 In alle andere situaties verlies je je inzet en is de “beloning” dus gelijk aan 0. Verder is het zo dat de verschillende schijven onafhankelijk van elkaar draaien en dat ieder plaatje op de schijf evenveel kans maakt om uiteindelijk op het scherm te verschijnen. Noem X de winst na ´e´en spel. Waaraan is EX gelijk? Hoe voordelig is het bijgevolg, op lange termijn bekeken, om met deze jackpot te spelen? 13. Bepaal c zodanig dat de volgende rij een discrete verdeling vormt: P(X = k) = f (k) = c/3k als k = 0, 1, 2, . . . en nul elders. Bereken bovendien P(X is even) en P(X is oneven). Hulpformule: ∞ X 1 xk = als |x| < 1. 1−x k=0 14. Gebaseerd op vorige jaren veronderstelt een fietsenhandelaar dat hij volgend jaar tussen 40 en 90 nieuwe fietsen met 12 versnellingen zal verkopen, met de volgende verdeling: 4 (waarbij x = aantal verkochte fietsen) k 40 50 60 70 80 90 f (k) 0.05 0.15 0.41 0.34 0.04 0.01 • Wat is het gemiddelde aantal verkochte fietsen? Wat is de standaarddeviatie? • Als de handelaar 60 fietsen bestelt, wat is de kans dat hij ze allemaal zal verkopen? Wat is de kans dat er fietsen zullen overblijven? • Hoeveel fietsen moet de handelaar bestellen om bijna zeker te zijn (95%) dat hij genoeg fietsen heeft? REEKS 2 15. Drie spelers A, B en C besluiten de volgende tornooiformule aan te gaan: wie het eerst tweemaal na elkaar de overwinning behaalt, wint het tornooi. Tevens wordt afgesproken dat A en B het eerst tegen elkaar spelen; de winnaar van deze partij speelt dan tegen C. Ofwel is het tornooi dan afgelopen (met A of B als winnaar), ofwel neemt C het vervolgens op tegen de verliezer van het laatste onderlinge duel tussen de twee anderen. Zo gaat men verder totdat er uiteindelijk een tornooiwinnaar zal zijn. Onderstel verder dat alle drie de spelers die elkaar bekampen even sterk zijn (dus met kans een half kan iedere deelnemer een spelletje verliezen maar ook winnen) en dat dit zo blijft ongeacht de tijdsduur dat het ganse evenement in beslag kan nemen. Noteer met respectievelijk a, b of c de gebeurtenis dat een zekere spelronde door speler A, B of C gewonnen is. Alle mogelijke uitkomsten (Ω) van dit tornooi kunnen dan beschreven worden als volgt: aa, acc, acbb, acbaa, acbacc, acbacbb, acbacbaa, . . . bb, bcc, bcaa, bcabb, bcabcc, bcabcaa, bcabcabb, . . . Ga dit na. Ω is dus duidelijk een aftelbaar-oneindige verzameling. De kansmaat P wordt uitsluitend bepaald door de “lengte van het tornooi”, met andere woorden P(aa) = 1/4, P(acc) = 1/8, P(acbb) = 1/16, P(acbaa) = 1/32, . . . P(bb) = 1/4, P(bcc) = 1/8, P(bcaa) = 1/16, P(bcabb) = 1/32, . . . Toon aan dat P wel degelijk een kansmaat is, dit wil zeggen: de som van alle kansen is gelijk aan 1. Wat is de kans dat speler A het tornooi wint? En speler B? En speler C? Hulpformule: ∞ X 1 xk = als |x| < 1. 1−x k=0 Onderstel tot slot dat speler B zijn goed hart toont en speler A het eerste spel (en alleen maar het eerste spel!) laat winnen. De nieuwe kansruimte (horende bij deze “nieuwe” tornooiformule) kan dan als volgt beschreven worden: Ω′ = {a, cc, cbb, cbaa, cbacc, cbacbb, cbacbaa, . . .}. 5 Herbereken alle kansen. Welke prijs betaalt speler B voor zijn liefdadigheid? En heeft speler C enige baat bij deze afspraak tussen A en B? 16. Onderstel dat het aantal mensen (noem dit X) dat op een werkdag in de dorpswinkel een krant wil kopen als volgt verdeeld is: γk als 1 ≤ k ≤ 24 P(X = k) = 0 elders Noteer verder met α de prijs die de winkeleigenaar per krant aan de uitgever betaalt en met β de prijs waaraan hij ze verkoopt. Onderstel dat β gelijk is aan 75 eurocent en dat α gelijk is aan 50 eurocent. Neem tot slot aan dat kranten die niet verkocht geraken, door de uitgever niet worden terugbetaald en dat de eigenaar van de winkel dagelijks n (n ≤ 24) kranten aankoopt. Noem Yn de winst die de winkelier op ´e´en werkdag bij aankoop van n kranten zal maken. Duidelijk is dat Yn = hn (X), met hn een functie die voor elke concrete waarde van X berekent wat de “dagwinst” zal zijn. • Bepaal γ zodat X een discrete stochastische veranderlijke is. • Waaraan is E(Yn ) gelijk? • Voor welke waarde van n is de verwachte dagwinst maximaal? Voor welke waarden van n zal de verwachte winst negatief worden? 17. De volgende oefening zal je nog een andere kijk geven op het gemiddelde van een stochastische veranderlijke. Toon aan dat voor een positieve discrete s.v. X (d.w.z. X ∈ N) met bijhorende verdelingsfunctie FX het volgende geldt: EX = ∞ X P(X > l) = ∞ X l=0 l=0 (1 − FX (l)). Pas deze eigenschap toe om het gemiddelde van een eerlijke dobbelsteenworp te berekenen. Maak ook een tekening van een willekeurige positieve discrete verdelingsfunctie en tracht zo een visuele interpretatie aan deze eigenschap te geven. 18. Bepaal c zodanig dat de volgende rij een discrete verdeling vormt: P(X = k) = f (k) = c/(k3k ) als k = 1, 2, . . . en nul elders. Hulpformule: ∞ X zk = −log(1 − z) als |z| < 1. k k=1 Bereken bovendien P(X is even) en P (X is oneven) 6 2 Binomiaal- en Poissonverdeling REEKS 1 1. Een verkoper voor een groot farmaceutisch bedrijf bezoekt een apotheker driemaal per jaar. De kans dat hij iets verkoopt bij een bezoek is 80%. Stel X het aantal verkopen in een jaar. • Stel een frequentietabel op van de dichtheidsfunctie f (x) en teken ze. • Wat is de kans op tenminste twee verkopen? 2. Veronderstel dat beide ouders in een familie met 4 kinderen genen dragen voor bloedgroep A en B. Dan is de bloedgroep van hun kinderen onafhankelijk en elk kind heeft kans 1/4 op bloedgroep A. Stel X het aantal kinderen in de familie met bloedgroep A. Bereken de dichtheid van X. 3. Van alle pati¨enten, besmet met een zeldzame tropische ziekte en behandeld met het klassieke geneesmiddel, overleeft 20% niet. Wanneer 5 studenten terugkeren van een uitwisselingsprogramma, zijn allen besmet met die tropische ziekte en worden zij behandeld met het klassieke geneesmiddel. Wat is de kans dat meer dan de helft herstelt? 4. De ELISA-test werd medio de jaren ’80 ingevoerd om bloed uit een bloedbank te testen op antilichamen die wijzen op de aanwezigheid van het AIDS-virus. Wanneer besmet bloed wordt getest geeft ELISA een positief resultaat in 98 percent van alle (besmette) gevallen. Stel dat er precies 20 bloedstalen besmet zijn. • Wat is de kans dat ELISA alle gevallen zal ontdekken? • Wat is de kans dat meer dan 2 van de 20 stalen de test ongemerkt zullen doorstaan? 5. Bij de productie van panty’s is de kans dat een geproduceerde panty geen ladders vertoont 90%. Neem aan dat het voorkomen van ladders in opeenvolgend geproduceerde panty’s onafhankelijke gebeurtenissen zijn. Bereken • Het gemiddeld aantal panty’s zonder ladders in een partij van 10 stuks. • De kans op meer dan 7 goede panty’s in deze partij. • De kans op 5 opeenvolgende goede panty’s. 6. Het aantal auto-ongevallen √ per maand op een bepaalde weg heeft een Poisson-verdeling met standaardafwijking 3. Bepaal de kans dat er volgende maand • geen enkel ongeval gebeurt. • minder dan 3 ongevallen gebeuren. • juist 2 ongevallen gebeuren. 7. Op 14 juli ga ik voor mijn verjaardag naar een concert en bevind ik mij in een zaal met 1000 personen. Wat is de kans dat er nog 3 andere mensen uit de zaal jarig zijn? 8. Een dossier bevat 1000 fakturen. Op deze 1000 zijn er 20 die fouten vertonen. De auditor neemt een steekproef van 50 fakturen. Wat is de kans dat er in de steekproef 2 fakturen zijn die fouten vertonen? 7 9. Neem aan dat het aantal fouten op een magnetische diskette Poisson verdeeld is met een gemiddelde van ´e´en fout per 105 bits. Een sector bestaat uit 4096 8-bit bytes. • Wat is de kans op meer dan ´e´en fout per sector? • Wat is het gemiddeld aantal sectoren die gecheckt moeten worden vooraleer een fout wordt gevonden? 10. Om wat zakgeld bij te verdienen, solliciteert Pieter op 6 gelijke, maar onafhankelijke jobs. Pieter heeft 40% kans om een job te krijgen en verdient 200 euro bij elke job. De kosten die hij maakt bij het solliciteren voor de 6 jobs samen raamt hij op 300 euro. • Wat is het verwacht aantal jobs dat hij zal krijgen? • Wat is de verwachte winst? • Wat is de kans dat hij winst maakt? • Wat is de kans dat hij eraan verliest? 11. Een elektrische centrale bezit een maximaal vermogen van 300MW, voortgebracht door 10 generatoren van 30MW. Gedurende 90% van de tijd is een generator beschikbaar. De perioden van onbeschikbaarheid zijn onderling onafhankelijk. Wat is de kans dat de centrale meer dan 256MW vermogen kan leveren? 12. Een autoverhuurder bezit 2 wagens, die per dag worden verhuurd. Het aantal aanvragen voor een dag is Poisson verdeeld met λ = 1.5. • welk percentage van de dagen zijn beide wagens thuis? • Welk percentage van de dagen zijn beide wagens uit? • Indien beide wagens evenveel worden gebruikt, welk percentage van de dagen is ´e´en bepaalde wagen dan thuis? 13. Het aantal TV-toestellen van een bepaald type dat men dagelijks verkoopt is Poissonverdeeld met parameter 1.5. De bevoorrading gebeurt op maandagvoormiddag en de zaak sluit op zondag. Hoeveel toestellen moet men telkens op maandag in voorraad brengen om de komende week met 90% zekerheid onmiddellijk te kunnen leveren? 14. Een kandidaat neemt deel aan een quiz waarbij opeenvolgende vragen gesteld worden. Hij mag naar de volgende ronde overstappen als hij 50 vragen juist beantwoord heeft. Om aan een saldo van 50 juiste antwoorden te komen, mag de kandidaat zich hoogstens 4 keer vergissen. Bereken de kans dat de kandidaat in de volgende ronde geraakt als men veronderstelt dat de kans om een goed antwoord te geven 0.9 bedraagt. 15. Een niet geordende databank van personeelsinformatie bevat verschillende karakteristieken voor ieder personeelslid. Men weet dat 35% van de personeelsleden ouder is dan 50 jaar. Men doorloopt sequentieel de databank met de bedoeling 5 personeelsleden te selecteren die ouder zijn dan 50 jaar. Wat is de kans dat men deze selectie heeft gevonden nadat men ten hoogste 6 databank records heeft onderzocht? 8 REEKS 2 16. De kans dat een oproep aan een dienstlijn beantwoord wordt, bedraagt 0.75. De oproepen worden onafhankelijk van elkaar verondersteld. • Als men 20 maal belt, wat is dan het gemiddeld aantal oproepen dat binnen de 30 seconden wordt beantwoord? • Wat is de kans dat men vier maal moet bellen om voor het eerst een reactie binnen de dertig seconden te krijgen? • Wat is het gemiddeld aantal oproepen dat men moet uitvoeren totdat men een eerste reactie krijgt binnen de dertig seconden? • Wat is dan de kans dat men precies zes maal moet bellen om twee oproepen te bekomen die binnen de 30 seconden worden beantwoord? 17. Bij de HEMA loopt een actie waarbij een klant iedere keer dat deze afrekent, een zegeltje krijgt met daarop ´e´en van de letters van het woord HEMA. Als de klant een volledig woord heeft, krijgt deze een chocoladereep cadeau. Wat is het verwachte aantal keer dat een klant moet afrekenen om een chocoladereep te krijgen? 18. Het aantal eieren door een vogel gelegd is Poisson verdeeld met parameter µ. De kans dat ´e´en ei voor het uitbroeden vernietigd wordt is p. Zoek de kans dat geen enkel ei uitgebroed wordt. 9 3 Continue verdelingen REEKS 1 1. Beschouw de functie f (x) = C(2x − x3 ) 0 als 0 < x < 2 elders Kan f bekeken worden als de dichtheidsfunctie van een stochastische veranderlijke X? Zo ja, bepaal C en bereken gemiddelde en variantie van X. Herhaal vervolgens dezelfde opdrachten voor de functie g met C(2x − x2 ) als 0 < x < 2 g(x) = 0 elders 2. Noteer met de s.v. L de speelduur (uitgedrukt in minuten) van een radioluidspreker van een zeer populair model uit de jaren ′ 50. Onderstel dat de dichtheidsfunctie van L gelijk is aan: 500 als t > 500 t2 fL (t) = 0 als 0 ≤ t ≤ 500 • Schets fL en controleer dat fL daadwerkelijk een dichtheidsfunctie is. • Bereken de verdelingsfunctie van L. Maak opnieuw een schets. • Waaraan is de kans gelijk dat de luidspreker tussen 600 en 1200 speelminuten zal functioneren? • Wat is de kans dat de luidspreker meer dan 100 speeluur muziekklanken zal produceren? • Hoelang moet de luidspreker zijn job blijven doen opdat er slechts 2.5% kans is dat een andere radioluidspreker van dit merk het beter doet? • Bereken EL. Strookt dit resultaat met het kwaliteitsbeeld dat je van de luidsprekers hebt op basis van de vorige vraagjes? 3. Om te gaan werken moet ik eerst de bus nemen dicht bij mij thuis en daarna moet ik overstappen op een tweede bus. De wachttijd (in minuten) heeft dichtheidsfunctie: 1 0≤x<5 25 x 2 1 − x 5 ≤ x ≤ 10 f (x) = 5 25 0 voor x < 0 of x > 10 • Wat is de kans dat de totale wachttijd ten hoogste drie minuten is? • Wat is de kans dat de totale wachttijd ten hoogste acht minuten is? • Wat is de kans dat de totale wachttijd tussen drie en acht minuten ligt? • Wat is de kans dat de totale wachttijd kleiner is dan twee minuten of groter is dan zes minuten? 4. Stel dat X normaal verdeeld is met gemiddelde 16 en standaarddeviatie 5. Bereken dan • P (X > 20); • P (20 < X < 25); 10 • P (X < 10); • P (12 < X < 24). 5. Onderstel dat het netto maandelijks inkomen van pas afgestudeerde informatici normaal verdeeld is met gemiddelde µ = 1360 euro en standaarddeviatie σ = 156 euro. Bereken vervolgens de kans dat • de netto maandwedde van een beginnende informaticus minder dan 1000 euro bedraagt. • het netto inkomen van zo’n informaticus tussen 1250 en 1625 euro ligt. • een pas afgestudeerde informaticus meer dan 1750 euro netto verdient. 6. Onderstel dat de levensduur van een stofzuiger normaal verdeeld is met een gemiddelde van 6 jaar en een standaarddeviatie van 1 jaar. Onderstel dat er garantie is op de stofzuiger. Hoeveel jaar mag de garantie dan maximaal duren opdat de kans dat de stofzuiger stuk gaat voor de garantie verstreken is, hoogstens 0.2 bedraagt? Wat is de oplossing als de garantie in volledige jaren wordt verleend? 7. Het benzineverbruik per 100 kilometer van een middelgrote wagen is normaal verdeeld met gemiddelde 8 liter en standaarddeviatie 1 liter. • Welk percentage van de wagens verbruikt niet meer dan 7 liter? • Welk percentage van de wagens verbruikt tussen 6 en 9 liter? • Als een fabrikant een middelgrote wagen wil construeren die 85% van de huidige markt achter zich laat inzake zuinig rijden, wat mag dan het verbruik van de nieuwe wagen hoogstens zijn? 8. Een vertaler is gespecialiseerd in technische tekst. Onderstel dat de vertaaltijd per pagina normaal verdeeld is met µ = 30 minuten en σ = 6 minuten. Op hoeveel tijd mag hij voor 1 bladzijde rekenen als hij met 90% zekerheid binnen deze termijn klaar wil zijn? En als hij 99% zekerheid wil? 9. De tijd die nodig is om een toelatingsexamen voor een bepaalde cursus te be¨eindigen, is normaal verdeeld met een gemiddelde van 110 minuten en een standaarddeviatie van 20 minuten. • Welke proportie van studenten heeft in 2 uur het examen be¨eindigd? • Hoelang moet het examen dan duren opdat 90% van de studenten het examen be¨eindigd heeft? 10. De tijd tussen opeenvolgende telefoonoproepen is exponentieel verdeeld met een gemiddelde van 10 minuten. • Wat is dan de waarde van λ? • Wat is de kans dat de wachttijd tot de eerste oproep minder dan 5 minuten bedraagt? • Wat is de kans dat de wachttijd tussen de tweede en de derde oproep tussen de 5 en de 15 minuten bedraagt? • Bepaal de lengte van een tijdsinterval waarvoor de kans op het voorkomen van tenminste 1 oproep 0.90 bedraagt. • Als er geen oproep geweest is de laatste 10 minuten, wat is dan de kans dat de wachttijd tot de volgende oproep minder dan 5 minuten bedraagt? 11 11. Veronderstel dat de ontwikkelingstijd voor een bepaald type fotografisch papier dat gedurende vijf seconden blootgesteld is aan een lichtbron , normaal verdeeld is met gemiddelde 25 seconden en standaarddeviatie 1.3 seconden. Wat is de kans dat • de ontwikkelingstijd langer dan 26.5 seconden duurt? • de ontwikkelingstijd tenminste 23 seconden duurt? • de ontwikkelingstijd meer dan 2.5 seconden verschilt van de verwachte tijd? 12. Dure experimenten met ventilatoren van een bepaald type die gebruikt worden in dieselmotoren hebben aangetoond dat de exponenti¨ele verdeling een goed model is voor de tijd tot aan een defect. Veronderstel dat de gemiddelde tijd tot aan een defect 25000 uren is. Wat is de kans dat • een willekeurig geselecteerde ventilator tenminste 20000 uren zal meegaan? • een willekeurig geselecteerde ventilator tenhoogste 30000 uren zal meegaan? • een willekeurig geselecteerde ventilator tussen 20000 en 30000 uren zal meegaan? • de levensduur van een ventilator de gemiddelde waarde met meer dan twee standaarddeviaties zal overschrijden? • de levensduur van een ventilator de gemiddelde waarde met meer dan drie standaarddeviaties zal overschrijden? 13. Piet en Kim overwegen om dit of volgend jaar een huis kopen. Ze denken dat de prijsstijging van de huizen in ´e´en jaar benaderend normaal verdeeld is met gemiddelde 8% en een standaarddeviatie van 10%. • Als de prijsstijging van de huizen in ´e´en jaar meer dan 25% is, kunnen ze zich geen huis meer veroorloven. Wat is de kans hiervan? • Als echter de prijzen van de huizen in een jaar dalen, halen ze er voordeel uit om een jaar te wachten. Bereken de kans hiervan. 14. De CPU van een PC heeft een levensduur die exponentieel verdeeld is met een gemiddelde leeftijd van 6 jaar. Je bezit je PC reeds 3 jaar. • Wat is de kans dat de CPU in de eerstvolgende drie jaar zal begeven? • Stel dat de firma 10 PC’s bezit sinds drie jaar en stel dat de CPU’s onafhankelijk van elkaar begeven. Wat is de kans dat tenminste ´e´en uitvalt in de eerstvolgende drie jaar? REEKS 2 15. De dichtheidsfunctie van een s.v. X wordt gegeven door fX (x) = ax2 + bx als 0 ≤ x ≤ 3 en nul elders. Bovendien weet je dat de kans dat X de waarde 2 niet overschrijdt gelijk is aan 2/3. Bepaal hieruit de waarde van de parameters a en b. 16. DefinieerR eerst de gammafunctie als volgt: ∞ Γ(α) = 0 sα−1 e−s ds voor positieve α. Definieer nu de gammaverdeling met parameters α en β door volgende dichtheid: 1 xα−1 e−x/β Γ(α)β α =0 f (x) = 12 x>0 x≤0 Toon aan dat dit een dichtheidsfunctie is. Bereken ook de verwachtingswaarde en de variantie van deze gammaverdeling. 17. De weerstand van resistoren van een bepaald type is normaal verdeeld, waarbij 10% van alle resistoren een weerstand hebben die groter is dan 10.256 ohm, en 5% hebben een weerstand kleiner dan 9.671 ohm. Wat is het gemiddelde en de standaarddeviatie van de verdeling? 18. Zij T exponentieel verdeeld met parameter λ. Zij X de discrete variabele gedefinieerd als X = k als k ≤T <k+1 (k = 0, 1, 2, . . .). Vind de verdeling van X. 19. Noem X het aantal kilogram verse aardbeien dat mensen tijdens de zomermaanden in een fruitwinkel willen kopen. Onderstel dat de dichtheidsfunctie van X gegeven wordt door γ(100 − x) als 0 ≤ x ≤ 100 fX (x) = 0 als x > 100 Noteer verder met α de prijs per kilogram waaraan de winkeleigenaar de aarbeien koopt bij een plaatselijke fruitteler. De prijs die de klant moet betalen is gelijk aan 2α euro. Tot slot is het zo dat de winkelier verse aardbeien die niet verkocht geraken iedere avond toch nog kan doorverkopen aan een ambachtelijke confituurmaker voor de prijs van α/2 euro per kilogram. Noem Ys de winst die de winkelier op ´e´en werkdag zal maken, indien hij ’s morgens s kilogram verse aardbeien aankoopt (s ≤ 100). Opnieuw zal Ys = gs (X), met gs een functie die voor elke concrete waarde van X berekent wat de “dagwinst” zal zijn. • Bepaal γ zodat fX een dichtheidsfunctie is. • Waaraan is E(Ys ) gelijk? • Voor welke waarde van s zal de verwachte dagwinst maximaal zijn? 13 4 Centrale limietstelling REEKS 1 1. Het gemiddeld aantal geboorten per dag in een streek is 228, met een standaarddeviatie σ gelijk aan 20. Bepaal de kans dat er in 1 jaar tijd meer dan 82 000 baby’s geboren worden (1 jaar = 365 dagen). 2. De dokter is bezorgd dat Judy lijdt aan hypokalemia (een laag kaliumgehalte in het bloed). Er is een spreiding in het werkelijke kaliumgehalte in het bloed en in de bloedtest die dit gehalte meet. Judy’s gemeten kaliumgehalte varieert volgens een normale verdeling met µ = 3.8 en σ = 0.2. Een patient lijdt aan hypokalemia indien dit gehalte lager is dan 3.5. • Indien ´e´en enkele test werd gedaan, wat is de kans dat de prognose luidt dat Judy aan hypokalemia lijdt? • Indien de metingen echter op 4 verschillende dagen gedaan werden en het gemiddelde meetresultaat vergeleken wordt met 3.5, wat is dan de kans dat de prognose luidt dat Judy aan hypokalemia lijdt? 3. Een laboratorium weegt filters uit steenkoolmijnen om het gehalte aan stof in de mijnatmosfeer te bepalen. Herhaalde metingen van het gewicht van stof op dezelfde filter vari¨eren normaal met variantie σ 2 = 0.08 mg omdat de meting niet perfect is. Het stof op een bepaalde filter heeft een N (123, 0.08) verdeling. • Het laboratorium rapporteert het gemiddelde van drie metingen. Wat is de verdeling van dit gemiddelde? • Wat is de kans dat dit gemiddelde groter is dan 124? 4. Een firma die een wagenpark beheert, zegt dat de levensduur van de remmen benaderend normaal verdeeld zijn met gemiddelde 55000 mijlen en standaarddeviatie 4500 mijlen. Een nieuw merk van remmen werd ge¨ınstalleerd op 8 wagens. • Indien de remmen van het nieuwe merk dezelfde verdeling zouden hebben als de oude, wat is de verdelingsfunctie van het steekproefgemiddelde van de levensduur voor de 8 nieuwe wagens? • De gemiddelde levensduur van de remmen van het nieuwe merk is 51800 mijlen en standaarddeviatie is 4500 mijlen. Wat is de kans dat het steekproefgemiddelde (van de levensduur voor de nieuwe remmen) tenhoogste 51800 is? 5. Het gehalte van stikstofoxide (NOX) in de uitlaat van een bepaald automodel varieert met gemiddelde 1.4g/mi en standaarddeviatie 0.3 g/mi. Een firma heeft 125 auto’s van dit model in haar wagenpark. Indien x het gemiddelde NOX gehalte is voor deze auto’s, hoe groot is dan het gehalte L zodat de kans dat X groter is dan L slechts 0.01 is? 6. Veronderstel dat de populatie van de gewichten van passagiers op Flyways Airline een gemiddelde van 150 pond en een standaarddeviatie van 25 pond heeft. Flyways’ lijnvlucht vliegtuig heeft een capaciteit van 7800 pond. Flyways denkt eraan om in het vliegtuig 50 zetels te installeren. Wat is de kans dat het vliegtuig zal overladen zijn als het volgeboekt is? 7. Om de temperatuur van het afvalwater bij een nucleaire opwerkingsfabriek te bepalen werd elke maandag gedurende 52 weken een monster genomen. 16 graden Celsius is het veiligheidspunt voor de vissen. Het aantal maandagen waarbij de temperatuur boven de 14 16C uitsteeg was dan ook van hoofdbelang. Kan je de verdeling van deze stochastische grootheid benaderend beschrijven? 8. Herneem oefeningen 8 p7 en 14 p8. Los deze benaderend op en vergelijk met het exacte resultaat. 9. In een productie van miljoenen electronische chips zijn slechts 2% defect. Wat is de kans dat op 1000 chips 40 of meer defect zijn? 10. Alle auto’s van een bepaald model die geleverd werden in 1990 moeten, worden teruggeroepen naar de garage o.w.v. een klein defect in de ophanging. Slechts 20% van de binnengekomen wagens moeten werkelijk hersteld worden. Een kleine autohandelaar met een tekort aan personeel, hoopt dat niet meer dan 5 van de 50 binnengekomen wagens moet hersteld worden. Wat is de kans hiervan? 11. In de presidentsverkiezingen in 1988 in de V.S., stemden 53.9% van de kiezers voor Bush. Een Gallop opiniepeiling nam een willekeurige steekproef van 1000 kiezers uit deze populatie. Wat is de kans dat Bush een minderheid van stemmen heeft in deze opiniepeiling? 12. Een Amerikaanse universiteit wil graag 1200 eerstejaarsstudenten hebben. Om in de universiteit te kunnen beginnen, hebben de studenten de toelating nodig. Niet elke student die de toelating krijgt, gaat echter naar die universiteit. Ervaring uit vorige jaren leert aan dat ongeveer 70% van de toegelaten studenten, in die universiteit begint. De universiteit beslist om 1500 studenten toelating te geven. Indien het aantal studenten die de toelating aanvaarden kleiner is dan 1200, laat de universiteit ook studenten toe die op de wachtlijst staan. • Wat is het gemiddelde en de standaarddeviatie van het aantal studenten die de toelating aanvaarden? • Bereken de kans dat tenminste 1000 studenten de aanbieding aanvaarden. • De universiteit wil niet meer dan 1200 studenten. Wat is de kans dat meer dan 1200 studenten de toelating aanvaarden? • Indien de universiteit het aantal toegelaten studenten verhoogt tot 1700, wat is de kans dat meer dan 1200 studenten aanvaarden? 13. Een fietsenbedrijf gebruikt kettingen die tenhoogste 1/4 inch afwijken van 54 inchen. De individuele schakels fluctueren rond en gemiddelde lengte van 1/2 inch met een standaarddeviatie van 1/100 inch. • Hoeveel schakels heeft men nodig voor ´e´en ketting? • Welke proportie van de kettingen voldoet aan de eisen (d.w.z. ten hoogste 1/4 inch afwijken van 54 inchen)? 14. Een Gallup opiniepeiling stelde de vraag ”Ga je vaak joggen?” aan een willekeurige steekproef van 1540 volwassenen. Veronderstel dat 15% van alle Amerikaanse volwassenen vaak joggen. • Bereken het gemiddelde en de variantie van het aantal volwassenen uit de steekproef die joggen. • Gebruik de normale approximatie om de kans te vinden dat tussen 13% en 17% van de volwassenen uit de steekproef joggen. • Welke steekproefgrootte is vereist om de standaarddeviatie te reduceren tot de helft van degene die je vond in 1.? 15 15. Een vrachtschip heeft een maximaal laadvermogen van 50 ton. Het schip wordt geladen met dozen rijst die elk gemiddeld 50 kilogram wegen met een standaarddeviatie van 5 kilogram. • Als er 995 dozen geladen worden, wat is de kans dat het maximaal laadvermogen overschreden wordt? • Hoeveel dozen mag men maximaal laden opdat de kans dat het maximaal laadvermogen overschreden wordt kleiner of gelijk is aan 0.001? 16. Bij aankoop van een nieuwe wagen raadt de garagist mijn buurman aan om telkens na 5000 kilometer rijden de olie te verversen. Mijn gebuur weet nu, na jarenlange ervaring, dat hij gemiddeld ongeveer 40 kilometer per dag met de nieuwe wagen zal rijden met een standaarddeviatie van 7 kilometer. Hoeveel dagen kan hij dan onbezorgd met de auto rondtoeren zodanig dat de kans dat hij meer kilometers rijdt dan toegelaten ten hoogste 0.01 is? 17. Doorgaans komt ´e´en derde van de mensen die in januari de apotheek binnenstappen, een welbepaalde hoestsiroop kopen. Onderstel dat de apotheker op een zekere dag 120 klanten over de vloer kreeg. Hoeveel flessen van deze hoestsiroop moest hij dan minstens in voorraad hebben opdat de kans dat de vraag het aanbod die dag oversteeg hoogstens 0.2 is? 18. Een bedrijf start een nieuwe vestiging met 1000 werknemers. Het restaurant bedient de lunch in twee shiften. De werknemers kiezen vrij (onafhankelijk van elkaar) in welke shift ze gaan lunchen. De directie weet nu dat in haar andere vestigingen de kans dat een werknemer voor de eerste shift kiest gelijk is aan 2/3. Ze gaat er vanuit dat dit ook in het nieuwe bedrijf het geval gaat zijn. Hoeveel stoelen moet de directie dan voorzien als ze niet meer dan 2% kans wil hebben dat er in het restaurant te weinig plaats is? REEKS 2 19. De managers van Mercury Mufflers zeggen dat de tijd t (in minuten) die een arbeider nodig heeft om een knalpotten te plaatsen varieert. Over een periode van een jaar verzamelden ze volgende gegevens: t 20 30 40 50 rel. freq. 10% 50% 30% 10% • Bereken het gemiddelde en de standaarddeviatie van de vervangingstijd t. • Ze plannen om 50 knalpotten met 4 mensen in ´e´en dag (van 9.00 tot 17.00 uur) te vervangen. Wat is de kans dat ze zullen falen om op tijd klaar te zijn? 20. De hoeveelheid calorie¨en bij het ontbijt opgenomen is een toevalsvariabele met verwachtingswaarde 500 en een standaarddeviatie van 50. Bij het middagmaal bedraagt het gemiddelde 800 en de standaarddeviatie is 100, terwijl bij het avondeten dit 1700 met een standaarddeviatie va 200 bedraagt. (Stel dat we steeds drie maaltijden per dag eten.) Wat is de kans dat mijn gemiddelde dagelijkse calorieopname over een jaar tussen de 2950 en de 3050 ligt? Specifieer uw onderstellingen. 16 21. Een dobbelsteen wordt opgeworpen tot de totale som van de ogen 700 of meer is. Schat de kans dat hiervoor tussen 180 en 210 worpen nodig zijn. 22. Een bank aanvaardt rollen muntstukken van 1 eurocent die 50 stuks zouden moeten bevatten. In ruil geeft de bank 50 cent, maar omdat het om zulke kleine bedragen gaat, wordt de inhoud niet nageteld. Stel dat een rol 49 eurocent bevat in 30 procent van de gevallen, 50 eurocent in 60 procent en 51 eurocent in 10 procent van de gevallen. (a) Schat de kans dat de bank op 100 rollen meer dan 25 cent verliest. (b) Hoeveel rollen moet de bank inzamelen om met minstens 99 procent kans een netto verlies te maken? 23. Stel dat men n maal een muntstuk opgooit. Noem Sn het aantal maal dat men “munt” bekomt. • Wat is de kans dat S50 50 meer dan 0.1 verschilt van 0.5? • Hoeveel maal ga je minstens een muntstuk moeten opwerpen opdat de kans dat meer dan 0.1 verschilt van 0.5 kleiner is dan 0.01? Sn n 24. Een gokker begint in een casino te spelen met een zeker beginkapitaal C. Onderstel dat hij steeds bij hetzelfde spel blijft staan en dat hij een kans p heeft om een spelronde te winnen. Spelrondes geschieden onafhankelijk van elkaar. Als de gokker een bedrag a inzet en hij wint het spel, dan krijgt hij ditzelfde bedrag van het casino als beloning. In het andere geval verliest hij zijn inzet. Dit is nu zijn spelstrategie. Na iedere spelronde beslist hij om een constante fractie α (0 < α < 1) in te zetten van het kapitaal dat hij op dat ogenblik nog in zijn bezit heeft. Je mag er vanuit gaan dat dit steeds mogelijk blijft. Bij het begin zal hij dus αC euro inzetten. Wint hij, dan bekomt de speler C + αC euro. Verliest hij, dan blijft er nog C − αC euro voor hem over. Noem Xn zijn kapitaal na de n-de spelronde. • Toon aan dat Xn = C(1 + α)N (n) (1 − α)n−N (n) , met N (n) het aantal keer dat hij succes heeft na n spelen. • Bepaal het limietgedrag van log(Xn )/n. • Bespreek het limietgedrag van Xn . Meer concreet: hoe groot moet p zijn, wil Xn → ∞, als n → ∞? 17 5 Betrouwbaarheidsintervallen 5.1 Voor het centrum 1. Een industri¨ele fabriek stoot dagelijks zwaveloxide uit. Voor 60 dagen werd gemiddeld 18.85 ton zwaveloxide gemeten, terwijl s2 = 30.77. Construeer een 90% BI voor de gemiddelde dagelijkse emissie van de fabriek. 2. Een agentschap wil de gemiddelde verkoopsprijs van de huizen in een voorstad van Atlanta schatten. Het neemt een willekeurige steekproef van 25 recent verkochte huizen en vindt als gemiddelde verkoopsprijs x = 148000$ en standaarddeviatie s = 62000$. • Bereken een 95% BI voor het gemiddelde van alle recente verkoopsprijzen. • We hebben gehoord dat een vriend van ons een huis heeft gekocht voor 206000$. Is dat plausibel, of is er een meldingsfout opgetreden? 3. In 1976 werd een onderzoek verricht in 225 (willekeurig gekozen) van de 2700 hoge scholen in de V.S. Het onderzoek toonde aan dat het gemiddeld aantal inschrijvingen per instelling gelijk is aan 3700, met een standaarddeviatie gelijk aan 6000 inschrijvingen. Stel een 95% BI op voor het totaal aantal inschrijvingen in al de 2700 instellingen. 4. Om de nauwkeurigheid van een meetinstrument te bepalen, wordt een standaardgewicht van 10 gram herhaaldelijk gemeten. De gemeten waarden zijn normaal verdeeld met ongekend gemiddelde (dit gemiddelde is 10 gram indien er geen afwijking zit op het meetinstrument). De standaarddeviatie van de gemeten waarden is σ = 0.0002 gram. • Het standaardgewicht wordt vijf keer gemeten. Het gemiddelde resultaat is 10.0023 gram. Bereken een 99% BI voor het gemiddelde van de metingen van het gewicht. • Leg in woorden uit wat dit BI betekent. • Bereken ook eens een 90% BI en vergelijk je resultaat met het vorige interval. • Stel dat σ niet gekend is, maar dat uit de steekproef volgt dat s = 0.00018. Bepaal nu een 99% BI voor het gemiddelde van de metingen van het gewicht. Vergelijk je resultaat met je oorspronkelijk BI. • Het standaardgewicht wordt 10 keer gemeten. Het gemiddelde resultaat blijft toevallig 10.0023 gram. Bereken een 99% BI voor het gemiddelde van de metingen van het gewicht. Vergelijk je resultaat met je eerste BI. • Hoeveel metingen heb je minimaal nodig om een foutenmarge te krijgen van ± 0.0001 bij een 99% BI ? 5. Het gewicht van een willekeurige steekproef van 24 lopers werd gemeten. Het steekproefgemiddelde is x = 60 kg. Veronderstel dat de standaarddeviatie van de populatie gekend is als σX = 5kg. • Geef een 95% BI voor µX , het gemiddelde van de populatie waaruit de steekproef genomen werd. • Bereken een 99% BI voor µX . Is dit BI breder of smaller dan het BI gevonden in 1 ? We willen nu een BI voor het gemiddelde gewicht in ponden (1 kg = 2.2 ponden). Stel dus X het gewicht in kg, en Y = 2.2X, hetzelfde gewicht gemeten in ponden. • Bereken σY en σY . Bereken vervolgens een 95% BI voor µY , het populatiegemiddelde uitgedrukt in ponden. 18 • Vermenigvuldig de eindpunten van het 95% BI voor µX met 2.2. Is het resultaat hetzelfde? 6. Beschouw de toevalsvariabele ‘Azijn’ uit het handboek in Sectie 1.5.4. Deze variabele is niet normaal verdeeld. • Voor de logaritme van ‘Azijn’ kunnen we wel normaliteit veronderstellen. Bepaal een 95% betrouwbaarheidsinterval voor het gemiddelde van de logaritme van ‘Azijn’. • Leid hieruit een 95% betrouwbaarheidsinterval voor de mediaan van ‘Azijn’ (niet log(Azijn)) af. • Leg uit waarom je niet op analoge manier een 95% betrouwbaarheidsinterval kan bepalen voor het gemiddelde van de variabele ‘Azijn’. • Bepaal een 95% betrouwbaarheidsinterval voor de mediaan van ‘Azijn’ met behulp van de techniek uit Sectie 6.3.2. • Vergelijk de breedte van beide 95% BI voor de mediaan van ‘Azijn’. 5.2 Voor een proportie 7. Er werd een steekproef genomen om na te gaan welk percentage van gezinnen onder de armoedegrens leeft in een bepaalde regio. Van de 20 onderzochte gezinnen waren dat er 3. • Bereken een benaderend 95% betrouwbaarheidsinterval voor de proportie gezinnen die onder de armoedegrens leven. • Hoe groot moet je de steekproef nemen opdat de standaardfout ten hoogste 0.02 is, als je weet dat de gezochte proportie ongeveer 0.15 is ? • Toon aan dat de standaardfout van een steekproefproportie voor vaste n het grootst is als p = 0.5. Hoe groot moeten we de steekproef nemen opdat de standaardfout ten hoogste 0.02 is, als je weet dat de gezochte proportie ongeveer 0.5 is ? 8. Een handelaar in kerstbomen in Indiana liet een onderzoek uitvoeren naar het aantal gezinnen in Indiana met een kerstboom. Een willekeurige steekproef van 500 gezinnen werd opgesteld. Zij werden telefonisch gecontacteerd met een twee minuten durend interview. E´en vraag die gesteld werd, was: ”Had jij een kerstboom dit jaar?” Van de 500 antwoorden luidden er 421 ”ja”. Bereken een 95% BI voor de werkelijke proportie van alle gezinnen in Indiana die een kerstboom hadden. 5.3 Voor andere parameters 9. Beschouw X ∼ N (µ, σ 2 ). • Hoe zou je σ 2 schatten ? • Wat weet je over de verdeling van deze schatter ? • Bepaal een 80% betrouwbaarheidsinterval voor de variantie σ 2 van een normale verdeling als n = 30. 10. Stel X ∼ Exp(λ). • Zoek een verband tussen het gemiddelde van de exponenti¨ele verdeling en λ. • Hoe zou je dit verband kunnen gebruiken om λ te schatten op basis van een steekproef ? • Wat weet je over de verdeling van deze schatter als n voldoende groot ? 19 • Bepaal een 99% betrouwbaarheidsinterval voor de parameter λ bij een exponenti¨ele verdeling Exp(λ) als n voldoende groot is. 11. De echte gemiddelde opbrengst van twee chemische processen is in beide gevallen gelijk aan µ, doch de variantie bij proces 1 is σ 2 terwijl ze bij het tweede proces 4σ 2 bedraagt. X1 , . . . , Xm zijn m onafhankelijke opbrenstgegevens van proces 1; Y1 , . . . , Yn zijn n onafhankelijke observaties van het tweede proces. • Toon aan dat voor elke waarde a ∈ (0, 1) ¯ + (1 − a)Y¯ µ ˆ = aX een zuivere schatter voor µ is. • Bij gegeven m en n, zoek die waarde van a die de variantie van µ ˆ het kleinst mogelijk maakt. • Bepaal een 95% betrouwbaarheidsinterval voor de schatter die je bekomt met deze optimale a waarde. 20 6 Hypothesetesten 6.1 Voor gemiddeldes 1. Een industri¨ele fabriek stoot dagelijks zwaveloxide uit. De fabriek beweert dat er een gemiddelde dagelijkse emissie is van 15 ton. Voor 60 dagen werd gemiddeld 18.85 ton zwaveloxide gemeten, terwijl s2 = 30.77. Controleer de bewering van de fabriek met een geschikte hypothese test met α = 0.1. • Formuleer een geschikte nulhypothese en alternatieve hypothese. • Geef aan welke teststatistiek je zal gebruiken bij deze hypothese test. Wat is de verdeling onder H0 ? • Voer de test uit, door het 90% BI te beschouwen. • Bereken ook het aanvaardingsgebied en formuleer een besluit voor de test. • Bereken ook de P-waarde voor de test en formuleer een besluit voor de hypothese test. 2. Om de nauwkeurigheid van een meetinstrument te bepalen, wordt een standaardgewicht van 10 gram herhaaldelijk gemeten. De gemeten waarden zijn normaal verdeeld met ongekend gemiddelde (dit gemiddelde is 10 gram indien er geen afwijking zit op het meetinstrument). Het standaardgewicht wordt vijf keer gemeten. Het gemiddelde resultaat is 10.0023 gram. De standaarddeviatie s = 0.00018 gram. • Formuleer een nulhypothese en alternatieve hypothese om na te gaan of het meetinstrument juist gecalibreerd is of niet op significantieniveau 0.01. • Geef aan welke teststatistiek je zal gebruiken bij deze hypothese test. Wat is de verdeling onder H0 ? • Voer de test uit, door het 99% BI te beschouwen. • Bereken ook het aanvaardingsgebied en de P-waarde en formuleer een besluit voor de hypothese test. • Hoe verandert je besluit als α toeneemt ? Als n toeneemt ? 3. Als gevolg van een aardbeving heeft een verzekeringsmaatschappij een onderzoek ingesteld om de grootte van de schade en de verwachte schadevorderingen te schatten. Van de 200 onderzochte polishouders was de gemiddelde schade 4800$ met een standaarddeviatie van 1300$. • Bereken een 95% BI voor de gemiddelde schade voor alle polishouders in het gebied van de aardbeving. • Gebaseerd op ervaring uit vorige jaren had de verzekeringsmaatschappij verondersteld dat, voor een aardbeving van deze grootte in deze streek, de gemiddelde schade 5000$ is. Test deze hypothese met behulp van de informatie die je hier gekregen hebt. 4. Een lukrake steekproef van 30 debietmeters voor intraveneuze injectie worden getest bij een debiet van 200 ml/u. Het steekproefgemiddelde blijkt 194 ml/u en de steekproefstandaarddeviatie 12 ml/u. Bewijzen deze gegevens dat het werkelijk debiet systematisch verschilt van het ingestelde debiet? Test de hypothese bij een significantieniveau van 5%. 5. Veronderstel in de vorige oefening dat de onderzoeker op voorhand weet dat de standaarddeviatie σ = 10 ml/u. Indien de onderzoeker wenst dat de kans van een Type-II fout 5% is als het werkelijk gemiddeld debiet overeenkomt met 195 ml/u, welke steekproefomvang dient hij dan te gebruiken voor het significantieniveau α = 0.05? 21 6. Tijdens de zomermaanden voert de watermaatschappij regelmatig steekproeven uit om te kijken of het gemiddeld waterverbruik per gezin de alarmdrempel van 200 liter niet overschrijdt. Hier zijn de resultaten van zo’n steekproef gehouden bij 26 gezinnen: x = 218 l en s = 40.5 l. Moet de maatschappij overgaan tot het nemen van maatregelen? Neem α = 0.01. (je mag er van uitgaan dat het waterverbruik per gezin benaderend normaal verdeeld is) 7. De hoeveelheid kleur in een olie-gebaseerde verf werd gemeten op 8.3g/kg verf, met een gekende standaardfout van 0.17g gebaseerd op uitgebreid onderzoek in het verleden. • Test, op een 5% significantieniveau, of deze hoeveelheid significant verschilt van de hoeveelheid, juist 8g, die het bedrijf wordt verondersteld te gebruiken. • Voer dezelfde test uit op een 10% significantieniveau. • Voer dezelfde test uit op een 1% significantieniveau. 8. De calibratie van een meetschaal wordt gecheckt door een 10 kg gewicht 25 maal met dit apparaat te wegen. We veronderstellen dat de verschillende metingen onafhankelijk van elkaar plaatsvinden en dat de metingen normaal verdeeld zijn met met σ = 0.200 kg. Stel door µ de echte gemiddelde gewichtsaflezing voor van dit 10 kg gewicht. • Welke hypothese wordt getest ? • Onderstel dat de schaal gehercalibreerd wordt als x ¯ ≥ 10.1032 of x ¯ ≤ 9.8968. Wat is de kans dat men hercalibreert als dit infeite onnnodig is? • Wat is de kans dat men niet hercalibreert als in werkelijkheid µ = 10.1. 9. Een ingenieur bestudeert de celluloseinhoud van een hooivarieteit. De celluloseconcentratie bezit een populatiestandaarddeviatie van σ = 8 mg/g. Een steekproef met 15 stalen bevatten een gemiddelde celluloseconcentratie van x ¯ = 145 mg/g. • Geef een 90% BI voor de gemiddelde celluloseconcentratie in de populatie. • Een eerdere studie beweerde dat dit onbekende gemiddelde gelijk is aan 140 mg/g, doch de ingenieur gelooft dat het gemiddelde hoger ligt. Stel een H0 en H1 op en voer de overeenkomstige test uit om na te gaan of de nieuwe gegevens dit geloof ondersteunen. 10. Een fabrikant van limonades heeft last met zijn flessenleverancier. Hij hoopt door statistische controle het probleem op te lossen. Er wordt voorgesteld 24 flessen uit elke zending van 24.000 flessen te monsteren. Als de gemiddelde sterkte van deze 24 flessen onder de 180 (kg/inch2 ) valt zal het lot teruggestuurd worden. Stel nu dat het lot van de maand daarop voldoet aan de volgende eigenschap: µ = 182 en σ = 1 (de sterkte is stel normaal verdeeld). • Wat is de kans dat dit lot inderdaad verworpen wordt ? • Interpreteer deze kans in een hypothesetestprobleem, opgesteld vanuit het standpunt van de limonadefabrikant. 11. Helpen stero¨ıden de spieren versterken? Om dit te helpen bestuderen vond men 20 gewichtheffers bereid mee te werken aan het volgend experiment: 10 van hen werden op toevallige wijze gekozen en met stero¨ıden behandeld, de 10 andere kregen een placebo (i.e. nep) behandeling. Een consistent trainingsprogramma werd aan alle 20 gegeven gedurende 6 weken. De meting betrof de toename in gewicht (pond) dat ze konden duwen na het programma. De resultaten waren: 22 Placebo Stero¨ıde x ¯ 14.6 15.1 s 12.4 4.2 Wat kun je besluiten omtrent het verschil in gemiddeld effect? 12. Een volksvertegenwoordiger van Groen! probeert, op de feestvergadering van de Belgische pomphouders, zijn publiek er van te overtuigen dat BIODIESEL niet alleen milieuvriendelijker is maar ook aanleiding geeft tot een lager gemiddeld verbruik per 100 kilometer. Zijn doorslaggevende argumenten staan samengevat in de volgende tabel: diesel gewone diesel biodiesel jaartal 1995 1996 n 10 12 x 8.2 liter 6.9 liter s 1.4 liter 1.0 liter Hierbij slaat ‘jaartal’ op het jaar waarin de steekproef op 10, respectievelijk 12 verschillende gezinswagens is afgenomen. Welke significante bewijskracht heeft zijn bewering? Argumenteer door een gepaste hypothesetoets op te stellen. Neem α achtereenvolgens gelijk aan 0.1, 0.05 en 0.01. Je mag hierbij onderstellen dat de 2 steekproeven onafhankelijk van elkaar zijn afgenomen, het verbruik per 100 km voor een wagen benaderend normaal verdeeld is en dat σ12 = σ22 = σ 2 met σ 2 ongekend. 13. Bij 14 lukraak gekozen blanke meisjes uit de USA werd de breedte (in cm) van de aangezichten gemeten, eens op 5 jaar (X) en eens op 6 jaar (Y ). Test vervolgens de hypothese (met tweezijdig alternatief) dat op 6 jaar de aangezichten gemiddeld 0.2 eenheden wijder zijn dan die van vijfjarigen. X Y 1 7.33 7.53 2 7.49 7.70 3 7.27 7.46 4 7.93 8.21 5 7.56 7.81 6 7.81 8.01 7 7.46 7.72 8 6.94 7.13 9 7.49 7.68 10 7.44 7.66 11 7.95 8.11 12 7.04 7.20 13 7.10 7.25 14 7.64 7.79 14. Men wenst de trekkracht van mortel die met polymeerlatex is behandeld te vergelijken met dat van gewone mortel. De uitslagen van de gewijzigde mortel is x ¯ = 18.12 kgf/cm2 (n1 = 40); voor de klassieke soort vindt men y¯ = 16.87 kgf/cm2 (n2 = 32). Als men aanneemt dat σ1 = 1.6 en σ2 = 1.4, test dan H0 : µ1 − µ2 ≤ 0 vs. H1 : µ1 − µ2 > 0. • Geef de p-waarde van de test. Beslis op significantieniveau 0.01. • Bereken de type II fout kans van de test op significantieniveau 0.01 als µ1 − µ2 = 1. • Stel dat men het significantieniveau op 0.05 stelt en de type II fout kans op 0.1 bij µ1 − µ2 = 1. Welke waarde van n2 dient genomen als n1 = 40 ? 6.2 Voor de mediaan 15. De massa van een 100 munten van 1 euro werd gemeten, en deze massa was niet normaal verdeeld. Toets de nulhypothese dat de mediaan kleiner is of gelijk aan 7.53, tegenover de alternatieve hypothese dat de mediaan groter is dan 7.53 op significantieniveau α = 0.05. Dit was het resultaat van de meting: x < 7.49: 22 munten 7.49 < x < 7.50: 11 munten 7.50 < x < 7.51: 10 munten 7.51 < x < 7.52: 13 munten 23 7.52 < x < 7.53: 12 munten 7.53 < x < 7.54: 8 munten 7.54 < x: 24 munten 16. Tien bodemstalen werden op lukrake wijze in een bepaald gebied genomen om de pH ervan te bepalen. De gevonden waarden zijn: 5.93 5.90 6.08 5.95 5.86 5.89 5.91 5.98 6.12 5.96 Men geloofde tot dan toe dat de theoretische mediaan pH-waarde 6.0 was. Duiden de bovenstaande gegevens een significante afwijking van die waarde 6.0 aan? Stel de gepaste hypothese op en voer de test uit met behulp van de kanswaarde. 17. Onderstel dat de tussentijden tussen opeenvolgende oproepen in een alarmcentrale exponentieel verdeeld zijn en men wenst te testen H0 : Med ≤ 3 uur versus H1 : Med > 3 uur, waarbij Med de mediaan van de wachttijden aanduidt. Een steekproef met 10 wachttijden wordt genomen en stel Y gelijk aan het aantal maal dat 3 uur wordt overschreden. Verwerp de nulhypothese als y ∈ 8, 9, 10. • Geef het verband tussen Med en de parameter λ. • Wat is de kans op een type 1 fout? • Wat is de kans op een type 2 fout als λ = .1189 ? 6.3 Voor proporties 18. Een bedrijf wordt beschuldigd van discriminatie. Het feit is dat meer mannen dan vrouwen een uitvoerende positie hebben. Er zijn 19 mannen en 17 vrouwen. • Wat is de steekproefgrootte? • Wat is het percentage vrouwen? • Wat is de standaardfout van dit percentage? • Stel een 95% BI op voor het percentage vrouwen. • Test de hypothese van discriminatie. 19. De afdeling kwaliteitscontrole van een bedrijf wil aanpassingen doorvoeren aan de drukmachine voor compact-discs indien er op de dagproductie van 5000 discs significant meer dan 3% defecten zijn. • De dagproductie van vandaag bevatte 173 defecten. Zal de afdeling in dit geval aanpassingen maken aan de machine? (kies significantieniveau 5%) • De dagproductie van vandaag bevatte 96 defecten. Zal de afdeling in dit geval aanpassingen maken aan de machine? 20. Een steekproef van 355 personen toonde aan dat 54.2% van hen van plan was om te stemmen v´ oo´r een nieuwe brug in de stad. Kunnen we hieruit het besluit trekken dat dit initiatief zal goedgekeurd worden als er verkiezingen gehouden worden in de stad? 21. Een oudere landbouwer beweert dat hij in staat is om met een pendel water te ontdekken. 5 identieke vaten worden hem gepresenteerd, sommige met en sommige zonder water. Hij is in vier van de vijf gevallen correct. 24 • Noem de kans dat hij voor een vat correct is p. Als hij zuiver gokt is p = 0.5. Stel een H0 en H1 op voor een test om uit te maken of hij gokt of niet. • Bepaal de verdeling van uw teststatistiek als p = 0.5. • Wat is de P-waarde van de test met de gegeven vier correcte antwoorden op vijf? 22. Wegens een alarmerend hoog aantal fouten in een produktieproces werd in een chemisch bedrijf de procescontrole verscherpt. Na een actie werden opnieuw 500 eindprodukten gecontroleerd. De uitslagen voor en na de actie geven: OK niet OK voor 400 100 na 450 50 Kan men spreken van een significante verbetering ? 23. In locatie A worden zeer veel slangen van soort S gevonden. Inspectie van 167 volwassen mannelijke slangen brengt aan het licht dat 35 onder hen een lichtgekleurde band in de nek hebben. In een tweede locatie, B, op respectabele afstand van A, vindt men dit fenomeen bij 6 van de 27 gevonden mannetjesslangen terug. Is er een significant verschil tussen beide locaties voor wat betreft de frequentie van de banden? 25 7 Onafhankelijheid 7.1 Twee kwalitatieve variabelen 1. In een studie naar infectieproblemen veroorzaakt door muizen in kip- en kalkoenhouderijen werd een toevallig gekozen groep installaties bezocht en de ernst van de problematiek werd opgetekend. De volgende uitslagen werden bekomen: Licht problematisch Middelmatig Ernstig Kiphouders 34 33 7 Kalkoenhouders 22 22 4 • Bereken een schatting van de kans op een lichte, middelmatige of ernstige problematiek, of je nu een kip- of kalkoenhouderij hebt (dit is: type van de houderij van geen belang). • Laat X het niveau van de problematiek voorstellen (1 licht, 2 normaal en 3 ernstig) en Y het type van de houderij (1 kip- en 2 kalkoenhouderij). Stel P (X = i, Y = j) = pij (i = 1, 2, 3; j = 1, 2). Bereken een schatting voor deze zes kansen. • Bereken een schatting voor de kans dat je een ernstig probleem hebt, als je een kiphouder bent. • Lijkt de assumptie van onafhankelijkheid plausibel? 2. Onderstaande tabel geeft de populatieproportie van de bevolking weer in de U.S.A. (in 1974) die resp. v´ oo´r of tegen abortus waren. Man Vrouw V´ oo´r 0.27 0.24 Tegen 0.21 0.28 • Wat is de kans dat een willekeurig gekozen persoon v´ oo´r abortus is? • Als men een man kiest, wat is de kans dat hij voor abortus is? • Als men een vrouw kiest, wat is de kans dat zij voor abortus is? • Zijn het geslacht van een persoon en de mening omtrent abortus van die persoon onafhankelijk ? 3. Stel X het aantal klanten in een winkel die wachten op het inpakken van hun geschenkjes. X heeft mogelijke uitkomsten 0,1,2,3,4 met bijbehorende kansen .1, .2, .3, .25, .15. Een willekeurig gekozen klant moet 1, 2 of 3 geschenkjes laten inpakken met respectievelijk kans .6, .3 en .1 . Stel Y het totaal aantal pakjes die moeten ingepakt worden voor de klanten in de wachtrij.. Veronderstel dat het aantal pakjes dat voor ´e´en klant moeten ingepakt worden, onafhankelijk is van het aantal pakjes die moeten ingepakt worden voor de volgende klant. • Bepaal P (Y = 5|X = 2). • Bepaal P (X = 3, Y = 3). 4. Tijdens “Mens-erger-je-niet” krijg je een sterk vermoeden dat jouw tegenspeler met een valse dobbelsteen werpt. Je legt het spel stil en besluit dit te testen. Een steekproef van 60 worpen levert de volgende resultaten op: 26 aantal ogen aantal worpen 1 5 2 7 3 11 4 8 5 12 6 17 Wat is je beslissing? Neem α gelijk aan 0.01. 5. In een biologisch laboratorium testen studenten de erfelijkheidsleer van Mendel door experimenten uit te voeren op ma¨ıs. De theorie van Mendel zegt dat de frequenties van de 4 mogelijke soorten van ma¨ıs, namelijk “glad en geel”, “gerimpeld en geel”, “glad en purper” en “gerimpeld en purper” zich als volgt verhouden: 9:3:3:1. Dit wil bijvoorbeeld zeggen dat je in de natuur drie keer meer kans hebt om de ma¨ıssoort “glad en geel” aan te treffen dan de ma¨ıssoort “glad en purper”. Na een telling krijgt een student de volgende frequentietabel: aantal glad en geel 124 gerimpeld en geel 30 glad en purper 43 gerimpeld en purper 11 Ondersteunen deze data de theorie van Mendel? 7.2 Twee kwantitatieve variabelen 6. De gezamenlijke dichtheid van X en Y wordt gegeven door: 0 10 x\y 0 .10 0.15 5 .30 0.45 Zijn X en Y (on)afhankelijk? (on)gecorreleerd? 7. Bewijs dat Cov(aW + bX, cY + dZ) = acCov(W, Y ) + bcCov(X, Y ) + adCov(W, Z) + bdCov(X, Z). 8. De groei van jonge kinderen is bijna lineair. Hier zijn de gegevens van Sarah: leeftijd (in maanden) lengte (in cm) 36 86 48 90 51 91 54 93 57 94 60 95 • Zet deze gegevens uit op een grafiek (scatterplot). Verwacht je dat de correlatieco¨efficient positief/negatief is? Bijna ±1? • Bereken de correlatieco¨efficient tussen de lengte en de leeftijd van Sarah. • Hoe zou de correlatieco¨effici¨ent veranderen als Sarah op elk moment 2cm groter was ? 9. In de USA werd een onderzoek uitgevoerd naar het effect van gevangenisstraffen voor jongeren. Een van de onderzochte kenmerken was het gewicht van de jongeren. Hieronder vind je voor 6 jongeren het gewicht bij het begin en op het einde van de gevangenisstraf. initie¨ele gewicht eindgewicht 63.2 65.9 48.8 55.2 78.0 76.9 67.0 69.1 60.1 65.2 55.9 61.3 Ga na of er een significante associatie is tussen het initi¨ele gewicht en het eindgewicht. • • • • Formuleer de geschikte nulhypothese en alternatieve hypothese. Bereken de P-waarde voor de test. Formuleer je besluit op significantieniveau 0.05. Formuleer de veronderstellingen die je gemaakt hebt bij je berekeningen. 27 8 Regressie REEKS 1 1. We hernemen de dataset uit oefening 8 p27: de groei van jonge kinderen is bijna lineair. Hier zijn de gegevens van Sarah: leeftijd (in maanden) lengte (in cm) 36 86 48 90 51 91 54 93 57 94 60 95 (a) Stel de regressie vergelijking op. (b) Is de regressie zinnig? Welke test kan je hiervoor uitvoeren? (c) Formuleer de veronderstellingen die je hebt gedaan bij de vorige vraag. (d) Evalueer het resultaat van de regressie op basis van R2 . (e) Komen je besluiten overeen met wat je berekend had bij de oefening op correlatie? 2. In de USA werd een onderzoek uitgevoerd naar het effect van gevangenisstraffen voor jongeren. Een van de onderzochte, gemakkelijk meetbare, kenmerken was het gewicht van de jongeren. Hieronder vind je voor 6 jongeren het gewicht bij het begin en op het einde van de gevangenisstraf . Ga na of er een significante associatie is tussen het initi¨ele gewicht en het eindgewicht op significantieniveau 0.05. Initi¨ele gewicht 63.2 48.8 78.0 67.0 60.1 55.9 Eindgewicht 65.9 55.2 76.9 69.1 65.2 61.3 • Formuleer de geschikte nulhypothese en alternatieve hypothese. • Bereken de P-waarde voor de test. • Formuleer je besluit op significantieniveau 0.05. • Formuleer de veronderstellingen die je gemaakt hebt bij je berekeningen. 3. Een student economie bestudeert voor zijn thesis het verband tussen de verkoop van een product (Y , in miljoenen dollars) en de grootte van de bevolking waar het product wordt verspreid (X, in miljoenen personen) in 50 gebieden. Hij doet een regressie-analyse op de data en verkrijgt de volgende waarden : Variable Intercept Slope DF 1 1 Parameter Estimate 7.43119 0.755048 Standard Error 2.1 0.3 t Value 3.538 2.5168 p-value 0.00079 ? (a) Vul het vraagteken aan en bespreek. (b) Duid op een schets de p-waarde en t-waarde aan voor de slope. (c) Geef een schatting voor de verkoop van het produkt in een gebied met 10 miljoen personen. 4. Ga na dat een regressie rechte steeds door het punt (¯ x, y¯) gaat. 28 REEKS 2 1. Voor drie waarden van X werden telkens twee observaties Y gedaan. De waarden van X zijn X = 5, X = 10 en X = 15. Toon aan dat het regressie model door de drie punten (5, Y¯1 ), (10, Y¯2 ) en (15, Y¯3 ) identiek is aan het regressie model opgesteld op basis van de 6 punten apart. Bedenk hierbij dat Y¯i is het gemiddelde van de twee Y -waarden per i-de X-waarde. 29
© Copyright 2024 ExpyDoc