OEFENINGENBUNDEL STATISTIEK

OEFENINGENBUNDEL STATISTIEK
Oefeningen bij het vak statistiek van
prof. dr. M. Hubert
2004-2005
Eerste bachelor wiskunde, informatica en natuurkunde
1
Discrete verdelingen algemeen
REEKS 1
1. Kies willekeurig een Amerikaans gezin en stel X het aantal personen die in het gezin wonen. De gezinnen met meer dan zeven inwoners laten we eruit. De kansverdeling van X is
als volgt:
Aantal
Kans
1
0.237
2
0.317
3
0.178
4
0.157
5
0.070
6
0.026
7
0.015
• Ga na dat dit een goede discrete kansverdeling is en teken de dichtheidsfunctie.
• Wat is P (X ≥ 5)?
• Wat is P (X > 5)?
• Wat is P (2 < X ≤ 4)?
• Wat is P (X 6= 1)?
• Wat is de kans van de gebeurtenis dat een willekeurig gekozen gezin meer dan twee
personen bevat?
2. Bereken gemiddelde en standaarddeviatie voor de volgende verdelingen. Teken de dichtheidsfunctie en de verdelingsfunctie en duid het gemiddelde aan.
(a)
k
0
1
2
3
f (k)
0.01
0.10
0.38
0.51
(b)
k
0
1
2
3
f (k)
0.07
0.10
0.18
0.65
3. Drie kranten A,B,C worden verkocht in een bepaalde stad. Uit een onderzoek blijkt het
volgende:
20% van de bevolking koopt krant A
16% van de bevolking koopt krant B
14% van de bevolking koopt krant C
8% van de bevolking koopt kranten A en B
5% van de bevolking koopt kranten A en C
4% van de bevolking koopt kranten B en C
2% van de bevolking koopt kranten A,B en C
Wat is de waarschijnlijkheid dat een persoon twee kranten koopt?
4. Sommige kansspelen zijn gebaseerd op het werpen met twee dobbelstenen. Elke dobbelsteen heeft zes kanten, gemarkeerd met 1,2,...,6. De dobbelstenen die men in casino’s
gebruikt, worden zorgvuldig gebalanceerd zodat elke kant gelijke kans heeft. De uitkomst
die van belang is voor een gokker is de som van het aantal ogen op de twee dobbelstenen.
Noem dit de toevalsvariabele X.
• Schrijf alle mogelijke uitkomsten op van de twee dobbelstenen.
2
• Als alle paren dezelfde kans hebben, wat is dan de kans van ´e´en paar?
• Schrijf de waarde van X naast elk paar en gebruik dit om de kansverdeling van X te
bepalen. Teken een histogram van deze kansverdeling.
• Een man wint in een weddenschap indien een 7 of een 11 tevoorschijn komt bij de
volgende worp van de twee dobbelstenen. Wat is de kans van deze gebeurtenis?
• Wat is de kans dat iets anders dan 7 wordt gegooid?
5. De weg die een bestuurder gebruikt naar zijn werk bevat twee kruispunten met verkeerslichten. Na jarenlange ervaring weet hij: de kans dat ik aan het eerste licht moet stoppen
is 0.4; de kans dat ik aan het tweede licht moet stoppen is 0.5 en aan geen enkel licht is
0.4. Wat is de kans dat hij voor het eerste licht, maar niet voor het tweede licht moet
stoppen? En omgekeerd?
6. Aan een bepaalde universiteit zijn er voor het eerste jaar bio-ingenieur 200 studenten
ingeschreven. Bij het begin van het academiejaar worden ze door lottrekking ingedeeld
in 11 groepen: 10 groepen (genummerd van 1 tot en met 10) van vijftien studenten en 1
groep (groepsnummer 11) van vijftig studenten.
E´en van de studenten is Eric. Noem X de grootte van de groep waarin deze student terecht
komt. X kan je aanzien als een s.v. Bepaal EX.
Men beschikt verder over 11 assistenten: eveneens door lottrekking wordt aan ieder een
groep toegewezen. Noem Y de grootte van de groep die aan de oudste assistent wordt
toegekend. Bepaal EY en vergelijk met EX.
7. Je kan de keuze maken uit twee spelen. In spel A werp je een (gebalanceerde) dobbelsteen
´e´enmaal en ontvang je het bedrag X = {het geworpen aantal ogen (in $) }. In spel B werp
je een (gebalanceerde) dobbelsteen tweemaal en ontvang je Y = {het maximum van de
twee uitkomsten}. Indien de inzet voor spel A 3 dollar is, en voor spel B 3.5 dollar, welk
spel zou je dan kiezen?
8. Zoek a zodat
 2
a



0.3 − 2a
f (k) =
0.2



0
als k = 0
als k = 1
als k = 2
elders
een discrete verdeling is van een stochastische veranderlijke.
9. Stel dat n kandidaten voor een bepaalde job geordend werden van 1, 2, ..., n. Stel X = het
rangnummer van een geselecteerde kandidaat, waarbij X een dichtheidsfunctie heeft als
volgt:
1/n voor k = 1, 2, ..., n
f (k) =
0
anders
(Dit noemt men de discrete uniforme verdeling).
Bereken het gemiddelde en de variantie. (Hint: de som van de eerste n positieve natuurlijke
getallen is n(n + 1)/2, en de som van hun kwadraten is n(n + 1)(2n + 1)/6.)
10. In een experiment op het gedrag van jonge kinderen werd elk kind in een ruimte geplaatst
met vijf stuks speelgoed. Men is vnl. ge¨ınteresseerd in het aantal stuks speelgoed waarmee
het kind speelt. We gebruiken de dichtheidsfunctie die bekomen werd uit vroegere experimenten die uitgevoerd werden op een groot aantal kinderen:
3
k
f (k)
0
0.03
1
0.16
2
0.30
3
0.23
4
0.17
5
0.11
Bereken verwachtingswaarde en standaarddeviatie.
11. Tegen betaling van anderhalve euro inzet in een gokspel op de kermis kan men kiezen
2
tussen twee mogelijke terugbetalingen: g(X) = 2X en h(X) = X15 . X is hierbij een getal
dat lukraak door de speler getrokken wordt uit een zak waarin de getallen 0 tot en met 50
steken.
Welke terugbetalingsvorm zal je kiezen indien je de gemiddelde opbrengst wil maximaliseren? (Hint: de som van de eerste n positieve natuurlijke getallen is n(n + 1)/2, en de som
van hun kwadraten is n(n + 1)(2n + 1)/6.)
12. Een klassieke jackpot bestaat uit drie draaiende schijven waarop twintig plaatjes staan
afgebeeld met daarop kersen, citroenen, pruimen, sinaasappels, klokken of ‘BAR’ geschilderd. De verdeling van de plaatjes per schijf is als volgt:
kersen
sinaasappels
citroenen
pruimen
klokken
BAR
schijf 1
7
3
3
4
2
1
schijf 2
7
7
0
1
2
3
schijf 3
0
6
4
6
3
1
Wanneer je nu een muntje in de jackpot steekt en aan een hendel trekt, maak je kans op een
vermenigvuldiging van je inzet naargelang de drie plaatjes die op het scherm verschijnen.
Een typische uitbetalingstabel voor een jackpot is de volgende (met “beloning” bedoelen
we het aantal keer dat je je inzet terugkrijgt):
schijf 1
BAR
klok
klok
pruim
sinaasappel
sinaasappel
kers
kers
schijf 2
BAR
klok
klok
pruim
sinaasappel
sinaasappel
kers
alles behalve een kers
schijf 3
BAR
klok
BAR
pruim
sinaasappel
BAR
om het even
om het even
beloning
60
20
18
14
10
6
2
1
In alle andere situaties verlies je je inzet en is de “beloning” dus gelijk aan 0. Verder is
het zo dat de verschillende schijven onafhankelijk van elkaar draaien en dat ieder plaatje
op de schijf evenveel kans maakt om uiteindelijk op het scherm te verschijnen.
Noem X de winst na ´e´en spel. Waaraan is EX gelijk? Hoe voordelig is het bijgevolg, op
lange termijn bekeken, om met deze jackpot te spelen?
13. Bepaal c zodanig dat de volgende rij een discrete verdeling vormt: P(X = k) = f (k) =
c/3k als k = 0, 1, 2, . . . en nul elders.
Bereken bovendien P(X is even) en P(X is oneven).
Hulpformule:
∞
X
1
xk =
als |x| < 1.
1−x
k=0
14. Gebaseerd op vorige jaren veronderstelt een fietsenhandelaar dat hij volgend jaar tussen
40 en 90 nieuwe fietsen met 12 versnellingen zal verkopen, met de volgende verdeling:
4
(waarbij x = aantal verkochte fietsen)
k
40
50
60
70
80
90
f (k)
0.05
0.15
0.41
0.34
0.04
0.01
• Wat is het gemiddelde aantal verkochte fietsen? Wat is de standaarddeviatie?
• Als de handelaar 60 fietsen bestelt, wat is de kans dat hij ze allemaal zal verkopen?
Wat is de kans dat er fietsen zullen overblijven?
• Hoeveel fietsen moet de handelaar bestellen om bijna zeker te zijn (95%) dat hij genoeg fietsen heeft?
REEKS 2
15. Drie spelers A, B en C besluiten de volgende tornooiformule aan te gaan: wie het eerst
tweemaal na elkaar de overwinning behaalt, wint het tornooi. Tevens wordt afgesproken
dat A en B het eerst tegen elkaar spelen; de winnaar van deze partij speelt dan tegen C.
Ofwel is het tornooi dan afgelopen (met A of B als winnaar), ofwel neemt C het vervolgens
op tegen de verliezer van het laatste onderlinge duel tussen de twee anderen. Zo gaat men
verder totdat er uiteindelijk een tornooiwinnaar zal zijn. Onderstel verder dat alle drie de
spelers die elkaar bekampen even sterk zijn (dus met kans een half kan iedere deelnemer
een spelletje verliezen maar ook winnen) en dat dit zo blijft ongeacht de tijdsduur dat het
ganse evenement in beslag kan nemen.
Noteer met respectievelijk a, b of c de gebeurtenis dat een zekere spelronde door speler A,
B of C gewonnen is. Alle mogelijke uitkomsten (Ω) van dit tornooi kunnen dan beschreven
worden als volgt:
aa, acc, acbb, acbaa, acbacc, acbacbb, acbacbaa, . . .
bb, bcc, bcaa, bcabb, bcabcc, bcabcaa, bcabcabb, . . .
Ga dit na. Ω is dus duidelijk een aftelbaar-oneindige verzameling. De kansmaat P wordt
uitsluitend bepaald door de “lengte van het tornooi”, met andere woorden
P(aa) = 1/4, P(acc) = 1/8, P(acbb) = 1/16, P(acbaa) = 1/32, . . .
P(bb) = 1/4, P(bcc) = 1/8, P(bcaa) = 1/16, P(bcabb) = 1/32, . . .
Toon aan dat P wel degelijk een kansmaat is, dit wil zeggen: de som van alle kansen is
gelijk aan 1. Wat is de kans dat speler A het tornooi wint? En speler B? En speler C?
Hulpformule:
∞
X
1
xk =
als |x| < 1.
1−x
k=0
Onderstel tot slot dat speler B zijn goed hart toont en speler A het eerste spel (en alleen
maar het eerste spel!) laat winnen. De nieuwe kansruimte (horende bij deze “nieuwe”
tornooiformule) kan dan als volgt beschreven worden:
Ω′ = {a, cc, cbb, cbaa, cbacc, cbacbb, cbacbaa, . . .}.
5
Herbereken alle kansen. Welke prijs betaalt speler B voor zijn liefdadigheid? En heeft
speler C enige baat bij deze afspraak tussen A en B?
16. Onderstel dat het aantal mensen (noem dit X) dat op een werkdag in de dorpswinkel een
krant wil kopen als volgt verdeeld is:
γk als 1 ≤ k ≤ 24
P(X = k) =
0
elders
Noteer verder met α de prijs die de winkeleigenaar per krant aan de uitgever betaalt en
met β de prijs waaraan hij ze verkoopt. Onderstel dat β gelijk is aan 75 eurocent en dat α
gelijk is aan 50 eurocent. Neem tot slot aan dat kranten die niet verkocht geraken, door de
uitgever niet worden terugbetaald en dat de eigenaar van de winkel dagelijks n (n ≤ 24)
kranten aankoopt.
Noem Yn de winst die de winkelier op ´e´en werkdag bij aankoop van n kranten zal maken.
Duidelijk is dat Yn = hn (X), met hn een functie die voor elke concrete waarde van X
berekent wat de “dagwinst” zal zijn.
• Bepaal γ zodat X een discrete stochastische veranderlijke is.
• Waaraan is E(Yn ) gelijk?
• Voor welke waarde van n is de verwachte dagwinst maximaal? Voor welke waarden
van n zal de verwachte winst negatief worden?
17. De volgende oefening zal je nog een andere kijk geven op het gemiddelde van een stochastische veranderlijke. Toon aan dat voor een positieve discrete s.v. X (d.w.z. X ∈ N) met
bijhorende verdelingsfunctie FX het volgende geldt:
EX =
∞
X
P(X > l) =
∞
X
l=0
l=0
(1 − FX (l)).
Pas deze eigenschap toe om het gemiddelde van een eerlijke dobbelsteenworp te berekenen.
Maak ook een tekening van een willekeurige positieve discrete verdelingsfunctie en tracht
zo een visuele interpretatie aan deze eigenschap te geven.
18. Bepaal c zodanig dat de volgende rij een discrete verdeling vormt: P(X = k) = f (k) =
c/(k3k ) als k = 1, 2, . . . en nul elders.
Hulpformule:
∞
X
zk
= −log(1 − z) als |z| < 1.
k
k=1
Bereken bovendien P(X is even) en P (X is oneven)
6
2
Binomiaal- en Poissonverdeling
REEKS 1
1. Een verkoper voor een groot farmaceutisch bedrijf bezoekt een apotheker driemaal per
jaar. De kans dat hij iets verkoopt bij een bezoek is 80%. Stel X het aantal verkopen in
een jaar.
• Stel een frequentietabel op van de dichtheidsfunctie f (x) en teken ze.
• Wat is de kans op tenminste twee verkopen?
2. Veronderstel dat beide ouders in een familie met 4 kinderen genen dragen voor bloedgroep
A en B. Dan is de bloedgroep van hun kinderen onafhankelijk en elk kind heeft kans 1/4
op bloedgroep A. Stel X het aantal kinderen in de familie met bloedgroep A. Bereken de
dichtheid van X.
3. Van alle pati¨enten, besmet met een zeldzame tropische ziekte en behandeld met het
klassieke geneesmiddel, overleeft 20% niet. Wanneer 5 studenten terugkeren van een
uitwisselingsprogramma, zijn allen besmet met die tropische ziekte en worden zij behandeld
met het klassieke geneesmiddel. Wat is de kans dat meer dan de helft herstelt?
4. De ELISA-test werd medio de jaren ’80 ingevoerd om bloed uit een bloedbank te testen op
antilichamen die wijzen op de aanwezigheid van het AIDS-virus. Wanneer besmet bloed
wordt getest geeft ELISA een positief resultaat in 98 percent van alle (besmette) gevallen.
Stel dat er precies 20 bloedstalen besmet zijn.
• Wat is de kans dat ELISA alle gevallen zal ontdekken?
• Wat is de kans dat meer dan 2 van de 20 stalen de test ongemerkt zullen doorstaan?
5. Bij de productie van panty’s is de kans dat een geproduceerde panty geen ladders vertoont
90%. Neem aan dat het voorkomen van ladders in opeenvolgend geproduceerde panty’s
onafhankelijke gebeurtenissen zijn. Bereken
• Het gemiddeld aantal panty’s zonder ladders in een partij van 10 stuks.
• De kans op meer dan 7 goede panty’s in deze partij.
• De kans op 5 opeenvolgende goede panty’s.
6. Het aantal auto-ongevallen
√ per maand op een bepaalde weg heeft een Poisson-verdeling
met standaardafwijking 3. Bepaal de kans dat er volgende maand
• geen enkel ongeval gebeurt.
• minder dan 3 ongevallen gebeuren.
• juist 2 ongevallen gebeuren.
7. Op 14 juli ga ik voor mijn verjaardag naar een concert en bevind ik mij in een zaal met
1000 personen. Wat is de kans dat er nog 3 andere mensen uit de zaal jarig zijn?
8. Een dossier bevat 1000 fakturen. Op deze 1000 zijn er 20 die fouten vertonen. De auditor
neemt een steekproef van 50 fakturen. Wat is de kans dat er in de steekproef 2 fakturen
zijn die fouten vertonen?
7
9. Neem aan dat het aantal fouten op een magnetische diskette Poisson verdeeld is met een
gemiddelde van ´e´en fout per 105 bits. Een sector bestaat uit 4096 8-bit bytes.
• Wat is de kans op meer dan ´e´en fout per sector?
• Wat is het gemiddeld aantal sectoren die gecheckt moeten worden vooraleer een fout
wordt gevonden?
10. Om wat zakgeld bij te verdienen, solliciteert Pieter op 6 gelijke, maar onafhankelijke jobs.
Pieter heeft 40% kans om een job te krijgen en verdient 200 euro bij elke job. De kosten
die hij maakt bij het solliciteren voor de 6 jobs samen raamt hij op 300 euro.
• Wat is het verwacht aantal jobs dat hij zal krijgen?
• Wat is de verwachte winst?
• Wat is de kans dat hij winst maakt?
• Wat is de kans dat hij eraan verliest?
11. Een elektrische centrale bezit een maximaal vermogen van 300MW, voortgebracht door
10 generatoren van 30MW. Gedurende 90% van de tijd is een generator beschikbaar.
De perioden van onbeschikbaarheid zijn onderling onafhankelijk. Wat is de kans dat de
centrale meer dan 256MW vermogen kan leveren?
12. Een autoverhuurder bezit 2 wagens, die per dag worden verhuurd. Het aantal aanvragen
voor een dag is Poisson verdeeld met λ = 1.5.
• welk percentage van de dagen zijn beide wagens thuis?
• Welk percentage van de dagen zijn beide wagens uit?
• Indien beide wagens evenveel worden gebruikt, welk percentage van de dagen is ´e´en
bepaalde wagen dan thuis?
13. Het aantal TV-toestellen van een bepaald type dat men dagelijks verkoopt is Poissonverdeeld met parameter 1.5. De bevoorrading gebeurt op maandagvoormiddag en de zaak
sluit op zondag. Hoeveel toestellen moet men telkens op maandag in voorraad brengen
om de komende week met 90% zekerheid onmiddellijk te kunnen leveren?
14. Een kandidaat neemt deel aan een quiz waarbij opeenvolgende vragen gesteld worden. Hij
mag naar de volgende ronde overstappen als hij 50 vragen juist beantwoord heeft. Om
aan een saldo van 50 juiste antwoorden te komen, mag de kandidaat zich hoogstens 4
keer vergissen. Bereken de kans dat de kandidaat in de volgende ronde geraakt als men
veronderstelt dat de kans om een goed antwoord te geven 0.9 bedraagt.
15. Een niet geordende databank van personeelsinformatie bevat verschillende karakteristieken
voor ieder personeelslid. Men weet dat 35% van de personeelsleden ouder is dan 50 jaar.
Men doorloopt sequentieel de databank met de bedoeling 5 personeelsleden te selecteren
die ouder zijn dan 50 jaar. Wat is de kans dat men deze selectie heeft gevonden nadat
men ten hoogste 6 databank records heeft onderzocht?
8
REEKS 2
16. De kans dat een oproep aan een dienstlijn beantwoord wordt, bedraagt 0.75. De oproepen
worden onafhankelijk van elkaar verondersteld.
• Als men 20 maal belt, wat is dan het gemiddeld aantal oproepen dat binnen de 30
seconden wordt beantwoord?
• Wat is de kans dat men vier maal moet bellen om voor het eerst een reactie binnen
de dertig seconden te krijgen?
• Wat is het gemiddeld aantal oproepen dat men moet uitvoeren totdat men een eerste
reactie krijgt binnen de dertig seconden?
• Wat is dan de kans dat men precies zes maal moet bellen om twee oproepen te
bekomen die binnen de 30 seconden worden beantwoord?
17. Bij de HEMA loopt een actie waarbij een klant iedere keer dat deze afrekent, een zegeltje
krijgt met daarop ´e´en van de letters van het woord HEMA. Als de klant een volledig woord
heeft, krijgt deze een chocoladereep cadeau. Wat is het verwachte aantal keer dat een klant
moet afrekenen om een chocoladereep te krijgen?
18. Het aantal eieren door een vogel gelegd is Poisson verdeeld met parameter µ. De kans dat
´e´en ei voor het uitbroeden vernietigd wordt is p. Zoek de kans dat geen enkel ei uitgebroed
wordt.
9
3
Continue verdelingen
REEKS 1
1. Beschouw de functie
f (x) =
C(2x − x3 )
0
als 0 < x < 2
elders
Kan f bekeken worden als de dichtheidsfunctie van een stochastische veranderlijke X?
Zo ja, bepaal C en bereken gemiddelde en variantie van X.
Herhaal vervolgens dezelfde opdrachten voor de functie g met
C(2x − x2 ) als 0 < x < 2
g(x) =
0
elders
2. Noteer met de s.v. L de speelduur (uitgedrukt in minuten) van een radioluidspreker van
een zeer populair model uit de jaren ′ 50. Onderstel dat de dichtheidsfunctie van L gelijk
is aan:
500
als t > 500
t2
fL (t) =
0
als 0 ≤ t ≤ 500
• Schets fL en controleer dat fL daadwerkelijk een dichtheidsfunctie is.
• Bereken de verdelingsfunctie van L. Maak opnieuw een schets.
• Waaraan is de kans gelijk dat de luidspreker tussen 600 en 1200 speelminuten zal
functioneren?
• Wat is de kans dat de luidspreker meer dan 100 speeluur muziekklanken zal produceren?
• Hoelang moet de luidspreker zijn job blijven doen opdat er slechts 2.5% kans is dat
een andere radioluidspreker van dit merk het beter doet?
• Bereken EL. Strookt dit resultaat met het kwaliteitsbeeld dat je van de luidsprekers
hebt op basis van de vorige vraagjes?
3. Om te gaan werken moet ik eerst de bus nemen dicht bij mij thuis en daarna moet ik
overstappen op een tweede bus. De wachttijd (in minuten) heeft dichtheidsfunctie:
 1
0≤x<5
 25 x
2
1
−
x
5 ≤ x ≤ 10
f (x) =
 5 25
0
voor x < 0 of x > 10
• Wat is de kans dat de totale wachttijd ten hoogste drie minuten is?
• Wat is de kans dat de totale wachttijd ten hoogste acht minuten is?
• Wat is de kans dat de totale wachttijd tussen drie en acht minuten ligt?
• Wat is de kans dat de totale wachttijd kleiner is dan twee minuten of groter is dan
zes minuten?
4. Stel dat X normaal verdeeld is met gemiddelde 16 en standaarddeviatie 5. Bereken dan
• P (X > 20);
• P (20 < X < 25);
10
• P (X < 10);
• P (12 < X < 24).
5. Onderstel dat het netto maandelijks inkomen van pas afgestudeerde informatici normaal
verdeeld is met gemiddelde µ = 1360 euro en standaarddeviatie σ = 156 euro. Bereken
vervolgens de kans dat
• de netto maandwedde van een beginnende informaticus minder dan 1000 euro bedraagt.
• het netto inkomen van zo’n informaticus tussen 1250 en 1625 euro ligt.
• een pas afgestudeerde informaticus meer dan 1750 euro netto verdient.
6. Onderstel dat de levensduur van een stofzuiger normaal verdeeld is met een gemiddelde van
6 jaar en een standaarddeviatie van 1 jaar. Onderstel dat er garantie is op de stofzuiger.
Hoeveel jaar mag de garantie dan maximaal duren opdat de kans dat de stofzuiger stuk
gaat voor de garantie verstreken is, hoogstens 0.2 bedraagt? Wat is de oplossing als de
garantie in volledige jaren wordt verleend?
7. Het benzineverbruik per 100 kilometer van een middelgrote wagen is normaal verdeeld met
gemiddelde 8 liter en standaarddeviatie 1 liter.
• Welk percentage van de wagens verbruikt niet meer dan 7 liter?
• Welk percentage van de wagens verbruikt tussen 6 en 9 liter?
• Als een fabrikant een middelgrote wagen wil construeren die 85% van de huidige
markt achter zich laat inzake zuinig rijden, wat mag dan het verbruik van de nieuwe
wagen hoogstens zijn?
8. Een vertaler is gespecialiseerd in technische tekst. Onderstel dat de vertaaltijd per pagina
normaal verdeeld is met µ = 30 minuten en σ = 6 minuten. Op hoeveel tijd mag hij voor
1 bladzijde rekenen als hij met 90% zekerheid binnen deze termijn klaar wil zijn? En als
hij 99% zekerheid wil?
9. De tijd die nodig is om een toelatingsexamen voor een bepaalde cursus te be¨eindigen, is
normaal verdeeld met een gemiddelde van 110 minuten en een standaarddeviatie van 20
minuten.
• Welke proportie van studenten heeft in 2 uur het examen be¨eindigd?
• Hoelang moet het examen dan duren opdat 90% van de studenten het examen
be¨eindigd heeft?
10. De tijd tussen opeenvolgende telefoonoproepen is exponentieel verdeeld met een gemiddelde van 10 minuten.
• Wat is dan de waarde van λ?
• Wat is de kans dat de wachttijd tot de eerste oproep minder dan 5 minuten bedraagt?
• Wat is de kans dat de wachttijd tussen de tweede en de derde oproep tussen de 5 en
de 15 minuten bedraagt?
• Bepaal de lengte van een tijdsinterval waarvoor de kans op het voorkomen van tenminste 1 oproep 0.90 bedraagt.
• Als er geen oproep geweest is de laatste 10 minuten, wat is dan de kans dat de
wachttijd tot de volgende oproep minder dan 5 minuten bedraagt?
11
11. Veronderstel dat de ontwikkelingstijd voor een bepaald type fotografisch papier dat gedurende
vijf seconden blootgesteld is aan een lichtbron , normaal verdeeld is met gemiddelde 25
seconden en standaarddeviatie 1.3 seconden. Wat is de kans dat
• de ontwikkelingstijd langer dan 26.5 seconden duurt?
• de ontwikkelingstijd tenminste 23 seconden duurt?
• de ontwikkelingstijd meer dan 2.5 seconden verschilt van de verwachte tijd?
12. Dure experimenten met ventilatoren van een bepaald type die gebruikt worden in dieselmotoren hebben aangetoond dat de exponenti¨ele verdeling een goed model is voor de tijd
tot aan een defect. Veronderstel dat de gemiddelde tijd tot aan een defect 25000 uren is.
Wat is de kans dat
• een willekeurig geselecteerde ventilator tenminste 20000 uren zal meegaan?
• een willekeurig geselecteerde ventilator tenhoogste 30000 uren zal meegaan?
• een willekeurig geselecteerde ventilator tussen 20000 en 30000 uren zal meegaan?
• de levensduur van een ventilator de gemiddelde waarde met meer dan twee standaarddeviaties zal overschrijden?
• de levensduur van een ventilator de gemiddelde waarde met meer dan drie standaarddeviaties zal overschrijden?
13. Piet en Kim overwegen om dit of volgend jaar een huis kopen. Ze denken dat de prijsstijging
van de huizen in ´e´en jaar benaderend normaal verdeeld is met gemiddelde 8% en een
standaarddeviatie van 10%.
• Als de prijsstijging van de huizen in ´e´en jaar meer dan 25% is, kunnen ze zich geen
huis meer veroorloven. Wat is de kans hiervan?
• Als echter de prijzen van de huizen in een jaar dalen, halen ze er voordeel uit om een
jaar te wachten. Bereken de kans hiervan.
14. De CPU van een PC heeft een levensduur die exponentieel verdeeld is met een gemiddelde
leeftijd van 6 jaar. Je bezit je PC reeds 3 jaar.
• Wat is de kans dat de CPU in de eerstvolgende drie jaar zal begeven?
• Stel dat de firma 10 PC’s bezit sinds drie jaar en stel dat de CPU’s onafhankelijk van
elkaar begeven. Wat is de kans dat tenminste ´e´en uitvalt in de eerstvolgende drie jaar?
REEKS 2
15. De dichtheidsfunctie van een s.v. X wordt gegeven door fX (x) = ax2 + bx als 0 ≤ x ≤ 3
en nul elders. Bovendien weet je dat de kans dat X de waarde 2 niet overschrijdt gelijk is
aan 2/3. Bepaal hieruit de waarde van de parameters a en b.
16. DefinieerR eerst de gammafunctie als volgt:
∞
Γ(α) = 0 sα−1 e−s ds voor positieve α.
Definieer nu de gammaverdeling met parameters α en β door volgende dichtheid:
1
xα−1 e−x/β
Γ(α)β α
=0
f (x) =
12
x>0
x≤0
Toon aan dat dit een dichtheidsfunctie is. Bereken ook de verwachtingswaarde en de
variantie van deze gammaverdeling.
17. De weerstand van resistoren van een bepaald type is normaal verdeeld, waarbij 10% van
alle resistoren een weerstand hebben die groter is dan 10.256 ohm, en 5% hebben een
weerstand kleiner dan 9.671 ohm. Wat is het gemiddelde en de standaarddeviatie van de
verdeling?
18. Zij T exponentieel verdeeld met parameter λ. Zij X de discrete variabele gedefinieerd als
X = k als
k ≤T <k+1
(k = 0, 1, 2, . . .). Vind de verdeling van X.
19. Noem X het aantal kilogram verse aardbeien dat mensen tijdens de zomermaanden in een
fruitwinkel willen kopen. Onderstel dat de dichtheidsfunctie van X gegeven wordt door
γ(100 − x) als 0 ≤ x ≤ 100
fX (x) =
0
als x > 100
Noteer verder met α de prijs per kilogram waaraan de winkeleigenaar de aarbeien koopt
bij een plaatselijke fruitteler. De prijs die de klant moet betalen is gelijk aan 2α euro. Tot
slot is het zo dat de winkelier verse aardbeien die niet verkocht geraken iedere avond toch
nog kan doorverkopen aan een ambachtelijke confituurmaker voor de prijs van α/2 euro
per kilogram.
Noem Ys de winst die de winkelier op ´e´en werkdag zal maken, indien hij ’s morgens s
kilogram verse aardbeien aankoopt (s ≤ 100). Opnieuw zal Ys = gs (X), met gs een functie
die voor elke concrete waarde van X berekent wat de “dagwinst” zal zijn.
• Bepaal γ zodat fX een dichtheidsfunctie is.
• Waaraan is E(Ys ) gelijk?
• Voor welke waarde van s zal de verwachte dagwinst maximaal zijn?
13
4
Centrale limietstelling
REEKS 1
1. Het gemiddeld aantal geboorten per dag in een streek is 228, met een standaarddeviatie σ
gelijk aan 20. Bepaal de kans dat er in 1 jaar tijd meer dan 82 000 baby’s geboren worden
(1 jaar = 365 dagen).
2. De dokter is bezorgd dat Judy lijdt aan hypokalemia (een laag kaliumgehalte in het bloed).
Er is een spreiding in het werkelijke kaliumgehalte in het bloed en in de bloedtest die dit
gehalte meet. Judy’s gemeten kaliumgehalte varieert volgens een normale verdeling met
µ = 3.8 en σ = 0.2. Een patient lijdt aan hypokalemia indien dit gehalte lager is dan 3.5.
• Indien ´e´en enkele test werd gedaan, wat is de kans dat de prognose luidt dat Judy
aan hypokalemia lijdt?
• Indien de metingen echter op 4 verschillende dagen gedaan werden en het gemiddelde
meetresultaat vergeleken wordt met 3.5, wat is dan de kans dat de prognose luidt dat
Judy aan hypokalemia lijdt?
3. Een laboratorium weegt filters uit steenkoolmijnen om het gehalte aan stof in de mijnatmosfeer te bepalen. Herhaalde metingen van het gewicht van stof op dezelfde filter
vari¨eren normaal met variantie σ 2 = 0.08 mg omdat de meting niet perfect is. Het stof op
een bepaalde filter heeft een N (123, 0.08) verdeling.
• Het laboratorium rapporteert het gemiddelde van drie metingen. Wat is de verdeling
van dit gemiddelde?
• Wat is de kans dat dit gemiddelde groter is dan 124?
4. Een firma die een wagenpark beheert, zegt dat de levensduur van de remmen benaderend
normaal verdeeld zijn met gemiddelde 55000 mijlen en standaarddeviatie 4500 mijlen. Een
nieuw merk van remmen werd ge¨ınstalleerd op 8 wagens.
• Indien de remmen van het nieuwe merk dezelfde verdeling zouden hebben als de oude,
wat is de verdelingsfunctie van het steekproefgemiddelde van de levensduur voor de
8 nieuwe wagens?
• De gemiddelde levensduur van de remmen van het nieuwe merk is 51800 mijlen en
standaarddeviatie is 4500 mijlen. Wat is de kans dat het steekproefgemiddelde (van
de levensduur voor de nieuwe remmen) tenhoogste 51800 is?
5. Het gehalte van stikstofoxide (NOX) in de uitlaat van een bepaald automodel varieert met
gemiddelde 1.4g/mi en standaarddeviatie 0.3 g/mi. Een firma heeft 125 auto’s van dit
model in haar wagenpark. Indien x het gemiddelde NOX gehalte is voor deze auto’s, hoe
groot is dan het gehalte L zodat de kans dat X groter is dan L slechts 0.01 is?
6. Veronderstel dat de populatie van de gewichten van passagiers op Flyways Airline een
gemiddelde van 150 pond en een standaarddeviatie van 25 pond heeft. Flyways’ lijnvlucht
vliegtuig heeft een capaciteit van 7800 pond. Flyways denkt eraan om in het vliegtuig 50
zetels te installeren. Wat is de kans dat het vliegtuig zal overladen zijn als het volgeboekt
is?
7. Om de temperatuur van het afvalwater bij een nucleaire opwerkingsfabriek te bepalen
werd elke maandag gedurende 52 weken een monster genomen. 16 graden Celsius is het
veiligheidspunt voor de vissen. Het aantal maandagen waarbij de temperatuur boven de
14
16C uitsteeg was dan ook van hoofdbelang. Kan je de verdeling van deze stochastische
grootheid benaderend beschrijven?
8. Herneem oefeningen 8 p7 en 14 p8. Los deze benaderend op en vergelijk met het exacte
resultaat.
9. In een productie van miljoenen electronische chips zijn slechts 2% defect. Wat is de kans
dat op 1000 chips 40 of meer defect zijn?
10. Alle auto’s van een bepaald model die geleverd werden in 1990 moeten, worden teruggeroepen naar de garage o.w.v. een klein defect in de ophanging. Slechts 20% van de
binnengekomen wagens moeten werkelijk hersteld worden. Een kleine autohandelaar met
een tekort aan personeel, hoopt dat niet meer dan 5 van de 50 binnengekomen wagens
moet hersteld worden. Wat is de kans hiervan?
11. In de presidentsverkiezingen in 1988 in de V.S., stemden 53.9% van de kiezers voor Bush.
Een Gallop opiniepeiling nam een willekeurige steekproef van 1000 kiezers uit deze populatie. Wat is de kans dat Bush een minderheid van stemmen heeft in deze opiniepeiling?
12. Een Amerikaanse universiteit wil graag 1200 eerstejaarsstudenten hebben. Om in de universiteit te kunnen beginnen, hebben de studenten de toelating nodig. Niet elke student
die de toelating krijgt, gaat echter naar die universiteit. Ervaring uit vorige jaren leert aan
dat ongeveer 70% van de toegelaten studenten, in die universiteit begint. De universiteit
beslist om 1500 studenten toelating te geven. Indien het aantal studenten die de toelating
aanvaarden kleiner is dan 1200, laat de universiteit ook studenten toe die op de wachtlijst
staan.
• Wat is het gemiddelde en de standaarddeviatie van het aantal studenten die de toelating aanvaarden?
• Bereken de kans dat tenminste 1000 studenten de aanbieding aanvaarden.
• De universiteit wil niet meer dan 1200 studenten. Wat is de kans dat meer dan 1200
studenten de toelating aanvaarden?
• Indien de universiteit het aantal toegelaten studenten verhoogt tot 1700, wat is de
kans dat meer dan 1200 studenten aanvaarden?
13. Een fietsenbedrijf gebruikt kettingen die tenhoogste 1/4 inch afwijken van 54 inchen. De
individuele schakels fluctueren rond en gemiddelde lengte van 1/2 inch met een standaarddeviatie van 1/100 inch.
• Hoeveel schakels heeft men nodig voor ´e´en ketting?
• Welke proportie van de kettingen voldoet aan de eisen (d.w.z. ten hoogste 1/4 inch
afwijken van 54 inchen)?
14. Een Gallup opiniepeiling stelde de vraag ”Ga je vaak joggen?” aan een willekeurige steekproef
van 1540 volwassenen. Veronderstel dat 15% van alle Amerikaanse volwassenen vaak
joggen.
• Bereken het gemiddelde en de variantie van het aantal volwassenen uit de steekproef
die joggen.
• Gebruik de normale approximatie om de kans te vinden dat tussen 13% en 17% van
de volwassenen uit de steekproef joggen.
• Welke steekproefgrootte is vereist om de standaarddeviatie te reduceren tot de helft
van degene die je vond in 1.?
15
15. Een vrachtschip heeft een maximaal laadvermogen van 50 ton. Het schip wordt geladen
met dozen rijst die elk gemiddeld 50 kilogram wegen met een standaarddeviatie van 5
kilogram.
• Als er 995 dozen geladen worden, wat is de kans dat het maximaal laadvermogen
overschreden wordt?
• Hoeveel dozen mag men maximaal laden opdat de kans dat het maximaal laadvermogen overschreden wordt kleiner of gelijk is aan 0.001?
16. Bij aankoop van een nieuwe wagen raadt de garagist mijn buurman aan om telkens na
5000 kilometer rijden de olie te verversen. Mijn gebuur weet nu, na jarenlange ervaring,
dat hij gemiddeld ongeveer 40 kilometer per dag met de nieuwe wagen zal rijden met een
standaarddeviatie van 7 kilometer.
Hoeveel dagen kan hij dan onbezorgd met de auto rondtoeren zodanig dat de kans dat hij
meer kilometers rijdt dan toegelaten ten hoogste 0.01 is?
17. Doorgaans komt ´e´en derde van de mensen die in januari de apotheek binnenstappen,
een welbepaalde hoestsiroop kopen. Onderstel dat de apotheker op een zekere dag 120
klanten over de vloer kreeg. Hoeveel flessen van deze hoestsiroop moest hij dan minstens
in voorraad hebben opdat de kans dat de vraag het aanbod die dag oversteeg hoogstens
0.2 is?
18. Een bedrijf start een nieuwe vestiging met 1000 werknemers. Het restaurant bedient de
lunch in twee shiften. De werknemers kiezen vrij (onafhankelijk van elkaar) in welke shift
ze gaan lunchen. De directie weet nu dat in haar andere vestigingen de kans dat een
werknemer voor de eerste shift kiest gelijk is aan 2/3. Ze gaat er vanuit dat dit ook in het
nieuwe bedrijf het geval gaat zijn. Hoeveel stoelen moet de directie dan voorzien als ze
niet meer dan 2% kans wil hebben dat er in het restaurant te weinig plaats is?
REEKS 2
19. De managers van Mercury Mufflers zeggen dat de tijd t (in minuten) die een arbeider nodig
heeft om een knalpotten te plaatsen varieert. Over een periode van een jaar verzamelden
ze volgende gegevens:
t
20
30
40
50
rel. freq.
10%
50%
30%
10%
• Bereken het gemiddelde en de standaarddeviatie van de vervangingstijd t.
• Ze plannen om 50 knalpotten met 4 mensen in ´e´en dag (van 9.00 tot 17.00 uur) te
vervangen. Wat is de kans dat ze zullen falen om op tijd klaar te zijn?
20. De hoeveelheid calorie¨en bij het ontbijt opgenomen is een toevalsvariabele met verwachtingswaarde 500 en een standaarddeviatie van 50. Bij het middagmaal bedraagt het gemiddelde 800 en de standaarddeviatie is 100, terwijl bij het avondeten dit 1700 met een
standaarddeviatie va 200 bedraagt. (Stel dat we steeds drie maaltijden per dag eten.)
Wat is de kans dat mijn gemiddelde dagelijkse calorieopname over een jaar tussen de 2950
en de 3050 ligt? Specifieer uw onderstellingen.
16
21. Een dobbelsteen wordt opgeworpen tot de totale som van de ogen 700 of meer is. Schat
de kans dat hiervoor tussen 180 en 210 worpen nodig zijn.
22. Een bank aanvaardt rollen muntstukken van 1 eurocent die 50 stuks zouden moeten bevatten. In ruil geeft de bank 50 cent, maar omdat het om zulke kleine bedragen gaat, wordt
de inhoud niet nageteld. Stel dat een rol 49 eurocent bevat in 30 procent van de gevallen,
50 eurocent in 60 procent en 51 eurocent in 10 procent van de gevallen.
(a) Schat de kans dat de bank op 100 rollen meer dan 25 cent verliest.
(b) Hoeveel rollen moet de bank inzamelen om met minstens 99 procent kans een netto
verlies te maken?
23. Stel dat men n maal een muntstuk opgooit. Noem Sn het aantal maal dat men “munt”
bekomt.
• Wat is de kans dat
S50
50
meer dan 0.1 verschilt van 0.5?
• Hoeveel maal ga je minstens een muntstuk moeten opwerpen opdat de kans dat
meer dan 0.1 verschilt van 0.5 kleiner is dan 0.01?
Sn
n
24. Een gokker begint in een casino te spelen met een zeker beginkapitaal C. Onderstel dat
hij steeds bij hetzelfde spel blijft staan en dat hij een kans p heeft om een spelronde te
winnen. Spelrondes geschieden onafhankelijk van elkaar. Als de gokker een bedrag a inzet
en hij wint het spel, dan krijgt hij ditzelfde bedrag van het casino als beloning. In het
andere geval verliest hij zijn inzet.
Dit is nu zijn spelstrategie. Na iedere spelronde beslist hij om een constante fractie α
(0 < α < 1) in te zetten van het kapitaal dat hij op dat ogenblik nog in zijn bezit heeft.
Je mag er vanuit gaan dat dit steeds mogelijk blijft. Bij het begin zal hij dus αC euro
inzetten. Wint hij, dan bekomt de speler C + αC euro. Verliest hij, dan blijft er nog
C − αC euro voor hem over. Noem Xn zijn kapitaal na de n-de spelronde.
• Toon aan dat
Xn = C(1 + α)N (n) (1 − α)n−N (n) ,
met N (n) het aantal keer dat hij succes heeft na n spelen.
• Bepaal het limietgedrag van log(Xn )/n.
• Bespreek het limietgedrag van Xn . Meer concreet: hoe groot moet p zijn, wil Xn →
∞, als n → ∞?
17
5
Betrouwbaarheidsintervallen
5.1
Voor het centrum
1. Een industri¨ele fabriek stoot dagelijks zwaveloxide uit. Voor 60 dagen werd gemiddeld
18.85 ton zwaveloxide gemeten, terwijl s2 = 30.77. Construeer een 90% BI voor de gemiddelde dagelijkse emissie van de fabriek.
2. Een agentschap wil de gemiddelde verkoopsprijs van de huizen in een voorstad van Atlanta
schatten. Het neemt een willekeurige steekproef van 25 recent verkochte huizen en vindt
als gemiddelde verkoopsprijs x = 148000$ en standaarddeviatie s = 62000$.
• Bereken een 95% BI voor het gemiddelde van alle recente verkoopsprijzen.
• We hebben gehoord dat een vriend van ons een huis heeft gekocht voor 206000$. Is
dat plausibel, of is er een meldingsfout opgetreden?
3. In 1976 werd een onderzoek verricht in 225 (willekeurig gekozen) van de 2700 hoge scholen
in de V.S. Het onderzoek toonde aan dat het gemiddeld aantal inschrijvingen per instelling
gelijk is aan 3700, met een standaarddeviatie gelijk aan 6000 inschrijvingen. Stel een 95%
BI op voor het totaal aantal inschrijvingen in al de 2700 instellingen.
4. Om de nauwkeurigheid van een meetinstrument te bepalen, wordt een standaardgewicht
van 10 gram herhaaldelijk gemeten. De gemeten waarden zijn normaal verdeeld met ongekend gemiddelde (dit gemiddelde is 10 gram indien er geen afwijking zit op het meetinstrument). De standaarddeviatie van de gemeten waarden is σ = 0.0002 gram.
• Het standaardgewicht wordt vijf keer gemeten. Het gemiddelde resultaat is 10.0023
gram. Bereken een 99% BI voor het gemiddelde van de metingen van het gewicht.
• Leg in woorden uit wat dit BI betekent.
• Bereken ook eens een 90% BI en vergelijk je resultaat met het vorige interval.
• Stel dat σ niet gekend is, maar dat uit de steekproef volgt dat s = 0.00018. Bepaal
nu een 99% BI voor het gemiddelde van de metingen van het gewicht. Vergelijk je
resultaat met je oorspronkelijk BI.
• Het standaardgewicht wordt 10 keer gemeten. Het gemiddelde resultaat blijft toevallig 10.0023 gram. Bereken een 99% BI voor het gemiddelde van de metingen van het
gewicht. Vergelijk je resultaat met je eerste BI.
• Hoeveel metingen heb je minimaal nodig om een foutenmarge te krijgen van ± 0.0001
bij een 99% BI ?
5. Het gewicht van een willekeurige steekproef van 24 lopers werd gemeten. Het steekproefgemiddelde is x = 60 kg. Veronderstel dat de standaarddeviatie van de populatie gekend
is als σX = 5kg.
• Geef een 95% BI voor µX , het gemiddelde van de populatie waaruit de steekproef
genomen werd.
• Bereken een 99% BI voor µX . Is dit BI breder of smaller dan het BI gevonden
in 1 ?
We willen nu een BI voor het gemiddelde gewicht in ponden (1 kg = 2.2 ponden).
Stel dus X het gewicht in kg, en Y = 2.2X, hetzelfde gewicht gemeten in ponden.
• Bereken σY en σY . Bereken vervolgens een 95% BI voor µY , het populatiegemiddelde
uitgedrukt in ponden.
18
• Vermenigvuldig de eindpunten van het 95% BI voor µX met 2.2. Is het resultaat
hetzelfde?
6. Beschouw de toevalsvariabele ‘Azijn’ uit het handboek in Sectie 1.5.4. Deze variabele is
niet normaal verdeeld.
• Voor de logaritme van ‘Azijn’ kunnen we wel normaliteit veronderstellen. Bepaal een
95% betrouwbaarheidsinterval voor het gemiddelde van de logaritme van ‘Azijn’.
• Leid hieruit een 95% betrouwbaarheidsinterval voor de mediaan van ‘Azijn’ (niet
log(Azijn)) af.
• Leg uit waarom je niet op analoge manier een 95% betrouwbaarheidsinterval kan
bepalen voor het gemiddelde van de variabele ‘Azijn’.
• Bepaal een 95% betrouwbaarheidsinterval voor de mediaan van ‘Azijn’ met behulp
van de techniek uit Sectie 6.3.2.
• Vergelijk de breedte van beide 95% BI voor de mediaan van ‘Azijn’.
5.2
Voor een proportie
7. Er werd een steekproef genomen om na te gaan welk percentage van gezinnen onder de
armoedegrens leeft in een bepaalde regio. Van de 20 onderzochte gezinnen waren dat er 3.
• Bereken een benaderend 95% betrouwbaarheidsinterval voor de proportie gezinnen
die onder de armoedegrens leven.
• Hoe groot moet je de steekproef nemen opdat de standaardfout ten hoogste 0.02 is,
als je weet dat de gezochte proportie ongeveer 0.15 is ?
• Toon aan dat de standaardfout van een steekproefproportie voor vaste n het grootst
is als p = 0.5. Hoe groot moeten we de steekproef nemen opdat de standaardfout ten
hoogste 0.02 is, als je weet dat de gezochte proportie ongeveer 0.5 is ?
8. Een handelaar in kerstbomen in Indiana liet een onderzoek uitvoeren naar het aantal
gezinnen in Indiana met een kerstboom. Een willekeurige steekproef van 500 gezinnen werd
opgesteld. Zij werden telefonisch gecontacteerd met een twee minuten durend interview.
E´en vraag die gesteld werd, was: ”Had jij een kerstboom dit jaar?” Van de 500 antwoorden
luidden er 421 ”ja”.
Bereken een 95% BI voor de werkelijke proportie van alle gezinnen in Indiana die een
kerstboom hadden.
5.3
Voor andere parameters
9. Beschouw X ∼ N (µ, σ 2 ).
• Hoe zou je σ 2 schatten ?
• Wat weet je over de verdeling van deze schatter ?
• Bepaal een 80% betrouwbaarheidsinterval voor de variantie σ 2 van een normale
verdeling als n = 30.
10. Stel X ∼ Exp(λ).
• Zoek een verband tussen het gemiddelde van de exponenti¨ele verdeling en λ.
• Hoe zou je dit verband kunnen gebruiken om λ te schatten op basis van een steekproef ?
• Wat weet je over de verdeling van deze schatter als n voldoende groot ?
19
• Bepaal een 99% betrouwbaarheidsinterval voor de parameter λ bij een exponenti¨ele
verdeling Exp(λ) als n voldoende groot is.
11. De echte gemiddelde opbrengst van twee chemische processen is in beide gevallen gelijk
aan µ, doch de variantie bij proces 1 is σ 2 terwijl ze bij het tweede proces 4σ 2 bedraagt.
X1 , . . . , Xm zijn m onafhankelijke opbrenstgegevens van proces 1; Y1 , . . . , Yn zijn n onafhankelijke observaties van het tweede proces.
• Toon aan dat voor elke waarde a ∈ (0, 1)
¯ + (1 − a)Y¯
µ
ˆ = aX
een zuivere schatter voor µ is.
• Bij gegeven m en n, zoek die waarde van a die de variantie van µ
ˆ het kleinst mogelijk
maakt.
• Bepaal een 95% betrouwbaarheidsinterval voor de schatter die je bekomt met deze
optimale a waarde.
20
6
Hypothesetesten
6.1
Voor gemiddeldes
1. Een industri¨ele fabriek stoot dagelijks zwaveloxide uit. De fabriek beweert dat er een
gemiddelde dagelijkse emissie is van 15 ton. Voor 60 dagen werd gemiddeld 18.85 ton
zwaveloxide gemeten, terwijl s2 = 30.77. Controleer de bewering van de fabriek met een
geschikte hypothese test met α = 0.1.
• Formuleer een geschikte nulhypothese en alternatieve hypothese.
• Geef aan welke teststatistiek je zal gebruiken bij deze hypothese test. Wat is de
verdeling onder H0 ?
• Voer de test uit, door het 90% BI te beschouwen.
• Bereken ook het aanvaardingsgebied en formuleer een besluit voor de test.
• Bereken ook de P-waarde voor de test en formuleer een besluit voor de hypothese
test.
2. Om de nauwkeurigheid van een meetinstrument te bepalen, wordt een standaardgewicht
van 10 gram herhaaldelijk gemeten. De gemeten waarden zijn normaal verdeeld met ongekend gemiddelde (dit gemiddelde is 10 gram indien er geen afwijking zit op het meetinstrument). Het standaardgewicht wordt vijf keer gemeten. Het gemiddelde resultaat is 10.0023
gram. De standaarddeviatie s = 0.00018 gram.
• Formuleer een nulhypothese en alternatieve hypothese om na te gaan of het meetinstrument juist gecalibreerd is of niet op significantieniveau 0.01.
• Geef aan welke teststatistiek je zal gebruiken bij deze hypothese test. Wat is de
verdeling onder H0 ?
• Voer de test uit, door het 99% BI te beschouwen.
• Bereken ook het aanvaardingsgebied en de P-waarde en formuleer een besluit voor de
hypothese test.
• Hoe verandert je besluit als α toeneemt ? Als n toeneemt ?
3. Als gevolg van een aardbeving heeft een verzekeringsmaatschappij een onderzoek ingesteld
om de grootte van de schade en de verwachte schadevorderingen te schatten. Van de 200
onderzochte polishouders was de gemiddelde schade 4800$ met een standaarddeviatie van
1300$.
• Bereken een 95% BI voor de gemiddelde schade voor alle polishouders in het gebied
van de aardbeving.
• Gebaseerd op ervaring uit vorige jaren had de verzekeringsmaatschappij verondersteld
dat, voor een aardbeving van deze grootte in deze streek, de gemiddelde schade 5000$
is. Test deze hypothese met behulp van de informatie die je hier gekregen hebt.
4. Een lukrake steekproef van 30 debietmeters voor intraveneuze injectie worden getest bij
een debiet van 200 ml/u. Het steekproefgemiddelde blijkt 194 ml/u en de steekproefstandaarddeviatie 12 ml/u. Bewijzen deze gegevens dat het werkelijk debiet systematisch
verschilt van het ingestelde debiet? Test de hypothese bij een significantieniveau van 5%.
5. Veronderstel in de vorige oefening dat de onderzoeker op voorhand weet dat de standaarddeviatie σ = 10 ml/u. Indien de onderzoeker wenst dat de kans van een Type-II fout 5%
is als het werkelijk gemiddeld debiet overeenkomt met 195 ml/u, welke steekproefomvang
dient hij dan te gebruiken voor het significantieniveau α = 0.05?
21
6. Tijdens de zomermaanden voert de watermaatschappij regelmatig steekproeven uit om
te kijken of het gemiddeld waterverbruik per gezin de alarmdrempel van 200 liter niet
overschrijdt. Hier zijn de resultaten van zo’n steekproef gehouden bij 26 gezinnen: x =
218 l en s = 40.5 l. Moet de maatschappij overgaan tot het nemen van maatregelen? Neem
α = 0.01. (je mag er van uitgaan dat het waterverbruik per gezin benaderend normaal
verdeeld is)
7. De hoeveelheid kleur in een olie-gebaseerde verf werd gemeten op 8.3g/kg verf, met een
gekende standaardfout van 0.17g gebaseerd op uitgebreid onderzoek in het verleden.
• Test, op een 5% significantieniveau, of deze hoeveelheid significant verschilt van de
hoeveelheid, juist 8g, die het bedrijf wordt verondersteld te gebruiken.
• Voer dezelfde test uit op een 10% significantieniveau.
• Voer dezelfde test uit op een 1% significantieniveau.
8. De calibratie van een meetschaal wordt gecheckt door een 10 kg gewicht 25 maal met dit
apparaat te wegen. We veronderstellen dat de verschillende metingen onafhankelijk van
elkaar plaatsvinden en dat de metingen normaal verdeeld zijn met met σ = 0.200 kg. Stel
door µ de echte gemiddelde gewichtsaflezing voor van dit 10 kg gewicht.
• Welke hypothese wordt getest ?
• Onderstel dat de schaal gehercalibreerd wordt als x
¯ ≥ 10.1032 of x
¯ ≤ 9.8968. Wat is
de kans dat men hercalibreert als dit infeite onnnodig is?
• Wat is de kans dat men niet hercalibreert als in werkelijkheid µ = 10.1.
9. Een ingenieur bestudeert de celluloseinhoud van een hooivarieteit. De celluloseconcentratie
bezit een populatiestandaarddeviatie van σ = 8 mg/g. Een steekproef met 15 stalen
bevatten een gemiddelde celluloseconcentratie van x
¯ = 145 mg/g.
• Geef een 90% BI voor de gemiddelde celluloseconcentratie in de populatie.
• Een eerdere studie beweerde dat dit onbekende gemiddelde gelijk is aan 140 mg/g,
doch de ingenieur gelooft dat het gemiddelde hoger ligt. Stel een H0 en H1 op en
voer de overeenkomstige test uit om na te gaan of de nieuwe gegevens dit geloof
ondersteunen.
10. Een fabrikant van limonades heeft last met zijn flessenleverancier. Hij hoopt door statistische controle het probleem op te lossen. Er wordt voorgesteld 24 flessen uit elke zending
van 24.000 flessen te monsteren. Als de gemiddelde sterkte van deze 24 flessen onder de
180 (kg/inch2 ) valt zal het lot teruggestuurd worden. Stel nu dat het lot van de maand
daarop voldoet aan de volgende eigenschap: µ = 182 en σ = 1 (de sterkte is stel normaal
verdeeld).
• Wat is de kans dat dit lot inderdaad verworpen wordt ?
• Interpreteer deze kans in een hypothesetestprobleem, opgesteld vanuit het standpunt
van de limonadefabrikant.
11. Helpen stero¨ıden de spieren versterken? Om dit te helpen bestuderen vond men 20
gewichtheffers bereid mee te werken aan het volgend experiment: 10 van hen werden op
toevallige wijze gekozen en met stero¨ıden behandeld, de 10 andere kregen een placebo (i.e.
nep) behandeling. Een consistent trainingsprogramma werd aan alle 20 gegeven gedurende
6 weken. De meting betrof de toename in gewicht (pond) dat ze konden duwen na het
programma. De resultaten waren:
22
Placebo
Stero¨ıde
x
¯
14.6
15.1
s
12.4
4.2
Wat kun je besluiten omtrent het verschil in gemiddeld effect?
12. Een volksvertegenwoordiger van Groen! probeert, op de feestvergadering van de Belgische
pomphouders, zijn publiek er van te overtuigen dat BIODIESEL niet alleen milieuvriendelijker is maar ook aanleiding geeft tot een lager gemiddeld verbruik per 100 kilometer.
Zijn doorslaggevende argumenten staan samengevat in de volgende tabel:
diesel
gewone diesel
biodiesel
jaartal
1995
1996
n
10
12
x
8.2 liter
6.9 liter
s
1.4 liter
1.0 liter
Hierbij slaat ‘jaartal’ op het jaar waarin de steekproef op 10, respectievelijk 12 verschillende gezinswagens is afgenomen.
Welke significante bewijskracht heeft zijn bewering? Argumenteer door een gepaste hypothesetoets op te stellen. Neem α achtereenvolgens gelijk aan 0.1, 0.05 en 0.01. Je mag
hierbij onderstellen dat de 2 steekproeven onafhankelijk van elkaar zijn afgenomen, het
verbruik per 100 km voor een wagen benaderend normaal verdeeld is en dat σ12 = σ22 = σ 2
met σ 2 ongekend.
13. Bij 14 lukraak gekozen blanke meisjes uit de USA werd de breedte (in cm) van de aangezichten gemeten, eens op 5 jaar (X) en eens op 6 jaar (Y ). Test vervolgens de hypothese
(met tweezijdig alternatief) dat op 6 jaar de aangezichten gemiddeld 0.2 eenheden wijder
zijn dan die van vijfjarigen.
X
Y
1
7.33
7.53
2
7.49
7.70
3
7.27
7.46
4
7.93
8.21
5
7.56
7.81
6
7.81
8.01
7
7.46
7.72
8
6.94
7.13
9
7.49
7.68
10
7.44
7.66
11
7.95
8.11
12
7.04
7.20
13
7.10
7.25
14
7.64
7.79
14. Men wenst de trekkracht van mortel die met polymeerlatex is behandeld te vergelijken
met dat van gewone mortel. De uitslagen van de gewijzigde mortel is x
¯ = 18.12 kgf/cm2
(n1 = 40); voor de klassieke soort vindt men y¯ = 16.87 kgf/cm2 (n2 = 32). Als men
aanneemt dat σ1 = 1.6 en σ2 = 1.4, test dan H0 : µ1 − µ2 ≤ 0 vs. H1 : µ1 − µ2 > 0.
• Geef de p-waarde van de test. Beslis op significantieniveau 0.01.
• Bereken de type II fout kans van de test op significantieniveau 0.01 als µ1 − µ2 = 1.
• Stel dat men het significantieniveau op 0.05 stelt en de type II fout kans op 0.1 bij
µ1 − µ2 = 1. Welke waarde van n2 dient genomen als n1 = 40 ?
6.2
Voor de mediaan
15. De massa van een 100 munten van 1 euro werd gemeten, en deze massa was niet normaal
verdeeld. Toets de nulhypothese dat de mediaan kleiner is of gelijk aan 7.53, tegenover de
alternatieve hypothese dat de mediaan groter is dan 7.53 op significantieniveau α = 0.05.
Dit was het resultaat van de meting:
x < 7.49: 22 munten
7.49 < x < 7.50: 11 munten
7.50 < x < 7.51: 10 munten
7.51 < x < 7.52: 13 munten
23
7.52 < x < 7.53: 12 munten
7.53 < x < 7.54: 8 munten
7.54 < x: 24 munten
16. Tien bodemstalen werden op lukrake wijze in een bepaald gebied genomen om de pH ervan
te bepalen. De gevonden waarden zijn:
5.93
5.90
6.08
5.95
5.86
5.89
5.91
5.98
6.12
5.96
Men geloofde tot dan toe dat de theoretische mediaan pH-waarde 6.0 was. Duiden de
bovenstaande gegevens een significante afwijking van die waarde 6.0 aan? Stel de gepaste
hypothese op en voer de test uit met behulp van de kanswaarde.
17. Onderstel dat de tussentijden tussen opeenvolgende oproepen in een alarmcentrale exponentieel verdeeld zijn en men wenst te testen H0 : Med ≤ 3 uur versus H1 : Med > 3 uur,
waarbij Med de mediaan van de wachttijden aanduidt. Een steekproef met 10 wachttijden wordt genomen en stel Y gelijk aan het aantal maal dat 3 uur wordt overschreden.
Verwerp de nulhypothese als y ∈ 8, 9, 10.
• Geef het verband tussen Med en de parameter λ.
• Wat is de kans op een type 1 fout?
• Wat is de kans op een type 2 fout als λ = .1189 ?
6.3
Voor proporties
18. Een bedrijf wordt beschuldigd van discriminatie. Het feit is dat meer mannen dan vrouwen
een uitvoerende positie hebben. Er zijn 19 mannen en 17 vrouwen.
• Wat is de steekproefgrootte?
• Wat is het percentage vrouwen?
• Wat is de standaardfout van dit percentage?
• Stel een 95% BI op voor het percentage vrouwen.
• Test de hypothese van discriminatie.
19. De afdeling kwaliteitscontrole van een bedrijf wil aanpassingen doorvoeren aan de drukmachine voor compact-discs indien er op de dagproductie van 5000 discs significant meer
dan 3% defecten zijn.
• De dagproductie van vandaag bevatte 173 defecten. Zal de afdeling in dit geval
aanpassingen maken aan de machine? (kies significantieniveau 5%)
• De dagproductie van vandaag bevatte 96 defecten. Zal de afdeling in dit geval aanpassingen maken aan de machine?
20. Een steekproef van 355 personen toonde aan dat 54.2% van hen van plan was om te
stemmen v´
oo´r een nieuwe brug in de stad. Kunnen we hieruit het besluit trekken dat dit
initiatief zal goedgekeurd worden als er verkiezingen gehouden worden in de stad?
21. Een oudere landbouwer beweert dat hij in staat is om met een pendel water te ontdekken.
5 identieke vaten worden hem gepresenteerd, sommige met en sommige zonder water. Hij
is in vier van de vijf gevallen correct.
24
• Noem de kans dat hij voor een vat correct is p. Als hij zuiver gokt is p = 0.5. Stel
een H0 en H1 op voor een test om uit te maken of hij gokt of niet.
• Bepaal de verdeling van uw teststatistiek als p = 0.5.
• Wat is de P-waarde van de test met de gegeven vier correcte antwoorden op vijf?
22. Wegens een alarmerend hoog aantal fouten in een produktieproces werd in een chemisch
bedrijf de procescontrole verscherpt. Na een actie werden opnieuw 500 eindprodukten
gecontroleerd. De uitslagen voor en na de actie geven:
OK
niet OK
voor
400
100
na
450
50
Kan men spreken van een significante verbetering ?
23. In locatie A worden zeer veel slangen van soort S gevonden. Inspectie van 167 volwassen
mannelijke slangen brengt aan het licht dat 35 onder hen een lichtgekleurde band in de nek
hebben. In een tweede locatie, B, op respectabele afstand van A, vindt men dit fenomeen
bij 6 van de 27 gevonden mannetjesslangen terug. Is er een significant verschil tussen beide
locaties voor wat betreft de frequentie van de banden?
25
7
Onafhankelijheid
7.1
Twee kwalitatieve variabelen
1. In een studie naar infectieproblemen veroorzaakt door muizen in kip- en kalkoenhouderijen
werd een toevallig gekozen groep installaties bezocht en de ernst van de problematiek werd
opgetekend. De volgende uitslagen werden bekomen:
Licht problematisch
Middelmatig
Ernstig
Kiphouders
34
33
7
Kalkoenhouders
22
22
4
• Bereken een schatting van de kans op een lichte, middelmatige of ernstige problematiek, of je nu een kip- of kalkoenhouderij hebt (dit is: type van de houderij van
geen belang).
• Laat X het niveau van de problematiek voorstellen (1 licht, 2 normaal en 3 ernstig)
en Y het type van de houderij (1 kip- en 2 kalkoenhouderij). Stel
P (X = i, Y = j) = pij (i = 1, 2, 3; j = 1, 2). Bereken een schatting voor deze zes
kansen.
• Bereken een schatting voor de kans dat je een ernstig probleem hebt, als je een
kiphouder bent.
• Lijkt de assumptie van onafhankelijkheid plausibel?
2. Onderstaande tabel geeft de populatieproportie van de bevolking weer in de U.S.A. (in
1974) die resp. v´
oo´r of tegen abortus waren.
Man
Vrouw
V´
oo´r
0.27
0.24
Tegen
0.21
0.28
• Wat is de kans dat een willekeurig gekozen persoon v´
oo´r abortus is?
• Als men een man kiest, wat is de kans dat hij voor abortus is?
• Als men een vrouw kiest, wat is de kans dat zij voor abortus is?
• Zijn het geslacht van een persoon en de mening omtrent abortus van die persoon
onafhankelijk ?
3. Stel X het aantal klanten in een winkel die wachten op het inpakken van hun geschenkjes.
X heeft mogelijke uitkomsten 0,1,2,3,4 met bijbehorende kansen .1, .2, .3, .25, .15. Een
willekeurig gekozen klant moet 1, 2 of 3 geschenkjes laten inpakken met respectievelijk
kans .6, .3 en .1 . Stel Y het totaal aantal pakjes die moeten ingepakt worden voor de
klanten in de wachtrij.. Veronderstel dat het aantal pakjes dat voor ´e´en klant moeten
ingepakt worden, onafhankelijk is van het aantal pakjes die moeten ingepakt worden voor
de volgende klant.
• Bepaal P (Y = 5|X = 2).
• Bepaal P (X = 3, Y = 3).
4. Tijdens “Mens-erger-je-niet” krijg je een sterk vermoeden dat jouw tegenspeler met een
valse dobbelsteen werpt. Je legt het spel stil en besluit dit te testen.
Een steekproef van 60 worpen levert de volgende resultaten op:
26
aantal ogen
aantal worpen
1
5
2
7
3
11
4
8
5
12
6
17
Wat is je beslissing? Neem α gelijk aan 0.01.
5. In een biologisch laboratorium testen studenten de erfelijkheidsleer van Mendel door experimenten uit te voeren op ma¨ıs. De theorie van Mendel zegt dat de frequenties van de 4
mogelijke soorten van ma¨ıs, namelijk “glad en geel”, “gerimpeld en geel”, “glad en purper”
en “gerimpeld en purper” zich als volgt verhouden: 9:3:3:1. Dit wil bijvoorbeeld zeggen
dat je in de natuur drie keer meer kans hebt om de ma¨ıssoort “glad en geel” aan te treffen
dan de ma¨ıssoort “glad en purper”.
Na een telling krijgt een student de volgende frequentietabel:
aantal
glad
en geel
124
gerimpeld
en geel
30
glad
en purper
43
gerimpeld
en purper
11
Ondersteunen deze data de theorie van Mendel?
7.2
Twee kwantitatieve variabelen
6. De gezamenlijke dichtheid van X en Y wordt gegeven door:
0
10
x\y
0 .10 0.15
5 .30 0.45
Zijn X en Y (on)afhankelijk? (on)gecorreleerd?
7. Bewijs dat
Cov(aW + bX, cY + dZ) = acCov(W, Y ) + bcCov(X, Y ) + adCov(W, Z) + bdCov(X, Z).
8. De groei van jonge kinderen is bijna lineair. Hier zijn de gegevens van Sarah:
leeftijd (in maanden)
lengte (in cm)
36
86
48
90
51
91
54
93
57
94
60
95
• Zet deze gegevens uit op een grafiek (scatterplot). Verwacht je dat de correlatieco¨efficient
positief/negatief is? Bijna ±1?
• Bereken de correlatieco¨efficient tussen de lengte en de leeftijd van Sarah.
• Hoe zou de correlatieco¨effici¨ent veranderen als Sarah op elk moment 2cm groter was ?
9. In de USA werd een onderzoek uitgevoerd naar het effect van gevangenisstraffen voor
jongeren. Een van de onderzochte kenmerken was het gewicht van de jongeren. Hieronder vind je voor 6 jongeren het gewicht bij het begin en op het einde van de gevangenisstraf.
initie¨ele gewicht
eindgewicht
63.2
65.9
48.8
55.2
78.0
76.9
67.0
69.1
60.1
65.2
55.9
61.3
Ga na of er een significante associatie is tussen het initi¨ele gewicht en het eindgewicht.
•
•
•
•
Formuleer de geschikte nulhypothese en alternatieve hypothese.
Bereken de P-waarde voor de test.
Formuleer je besluit op significantieniveau 0.05.
Formuleer de veronderstellingen die je gemaakt hebt bij je berekeningen.
27
8
Regressie
REEKS 1
1. We hernemen de dataset uit oefening 8 p27: de groei van jonge kinderen is bijna lineair.
Hier zijn de gegevens van Sarah:
leeftijd (in maanden)
lengte (in cm)
36
86
48
90
51
91
54
93
57
94
60
95
(a) Stel de regressie vergelijking op.
(b) Is de regressie zinnig? Welke test kan je hiervoor uitvoeren?
(c) Formuleer de veronderstellingen die je hebt gedaan bij de vorige vraag.
(d) Evalueer het resultaat van de regressie op basis van R2 .
(e) Komen je besluiten overeen met wat je berekend had bij de oefening op correlatie?
2. In de USA werd een onderzoek uitgevoerd naar het effect van gevangenisstraffen voor jongeren. Een van de onderzochte, gemakkelijk meetbare, kenmerken was het gewicht van de
jongeren. Hieronder vind je voor 6 jongeren het gewicht bij het begin en op het einde van
de gevangenisstraf . Ga na of er een significante associatie is tussen het initi¨ele gewicht en
het eindgewicht op significantieniveau 0.05.
Initi¨ele gewicht
63.2
48.8
78.0
67.0
60.1
55.9
Eindgewicht
65.9
55.2
76.9
69.1
65.2
61.3
• Formuleer de geschikte nulhypothese en alternatieve hypothese.
• Bereken de P-waarde voor de test.
• Formuleer je besluit op significantieniveau 0.05.
• Formuleer de veronderstellingen die je gemaakt hebt bij je berekeningen.
3. Een student economie bestudeert voor zijn thesis het verband tussen de verkoop van een
product (Y , in miljoenen dollars) en de grootte van de bevolking waar het product wordt
verspreid (X, in miljoenen personen) in 50 gebieden. Hij doet een regressie-analyse op de
data en verkrijgt de volgende waarden :
Variable
Intercept
Slope
DF
1
1
Parameter Estimate
7.43119
0.755048
Standard Error
2.1
0.3
t Value
3.538
2.5168
p-value
0.00079
?
(a) Vul het vraagteken aan en bespreek.
(b) Duid op een schets de p-waarde en t-waarde aan voor de slope.
(c) Geef een schatting voor de verkoop van het produkt in een gebied met 10 miljoen
personen.
4. Ga na dat een regressie rechte steeds door het punt (¯
x, y¯) gaat.
28
REEKS 2
1. Voor drie waarden van X werden telkens twee observaties Y gedaan. De waarden van X
zijn X = 5, X = 10 en X = 15. Toon aan dat het regressie model door de drie punten
(5, Y¯1 ), (10, Y¯2 ) en (15, Y¯3 ) identiek is aan het regressie model opgesteld op basis van de
6 punten apart. Bedenk hierbij dat Y¯i is het gemiddelde van de twee Y -waarden per i-de
X-waarde.
29