Discrete willekeurige variabelen
ADiscrete willekeurige variabeleis er een die slechts een telbaar aantal verschillende waarden kan aannemen, zoals 0,1,2,3,4,........ Discrete willekeurige variabelen zijn gewoonlijk (maar niet noodzakelijkerwijs) tellingen. Als een willekeurige variabele slechts een eindig aantal verschillende waarden kan aannemen, dan moet hij discreet zijn. Voorbeelden van discrete willekeurige variabelen zijn het aantal kinderen in een gezin, het bezoek aan een bioscoop op vrijdagavond, het aantal patiënten in een dokterspraktijk, het aantal defecte gloeilampen in een doos van tien.Dekansverdelingvan een discrete willekeurige variabele is een lijst van waarschijnlijkheden geassocieerd met elk van zijn mogelijke waarden. Het wordt ook wel de waarschijnlijkheidsfunctie of de waarschijnlijkheidsmassafunctie genoemd.
(Definities overgenomen van Valerie J. Easton en John H. McColl'sStatistieken Woordenlijst v1.1)
Stel een willekeurige variabeleXkan durenkverschillende waarden, met de kans datX = xigedefinieerd te zijnP(X = xi) = pi. De kansenPimoet voldoen aan het volgende:
- 1:0<Pi <1 voor elke i
- 2:P1+ blz2+ ... + pk= 1.
Voorbeeld
Stel dat een variabele X de waarden 1, 2, 3 of 4 kan aannemen.De kansen die bij elke uitkomst horen, worden beschreven in de volgende tabel:
Uitkomst 1234Kans0.10.30.40.2De kans datXis gelijk aan 2 of 3 is de som van de twee kansen:P(X = 2 of X = 3) = P(X = 2) + P(X = 3)= 0,3 + 0,4 = 0,7. Evenzo de kans datXis groter dan 1 is gelijk aan 1 -P(X = 1)= 1 - 0,1 = 0,9, door decomplement regel.
Deze verdeling kan ook worden beschreven door dekanshistogramrechts weergegeven:
(Definitie overgenomen van Valerie J. Easton en John H. McColl'sStatistieken Woordenlijst v1.1)
Voorbeeld
De cumulatieve verdelingsfunctie voor de bovenstaande kansverdeling wordt als volgt berekend:De kans dat X kleiner is dan of gelijk is aan 1 is 0,1,
de kans dat X kleiner is dan of gelijk is aan 2 is 0,1+0,3 = 0,4,
de kans dat X kleiner is dan of gelijk is aan 3 is 0,1+0,3+0,4 = 0,8, en
de kans dat X kleiner is dan of gelijk is aan 4 is 0,1+0,3+0,4+0,2 = 1.
Het kanshistogram voor de cumulatieve verdeling van deze willekeurige variabele wordt rechts weergegeven:
Continue willekeurige variabelen
Acontinue willekeurige variabeleis er een die een oneindig aantal mogelijke waarden aanneemt. Continue willekeurige variabelen zijn meestal metingen. Voorbeelden zijn lengte, gewicht, de hoeveelheid suiker in een sinaasappel, de tijd die nodig is om een mijl te rennen.(Definitie overgenomen van Valerie J. Easton en John H. McColl'sStatistieken Woordenlijst v1.1)
Een continue willekeurige variabele is niet gedefinieerd op specifieke waarden. In plaats daarvan wordt het gedefinieerd over eenintervalvan waarden, en wordt vertegenwoordigd door degebied onder een curve(in geavanceerde wiskunde staat dit bekend als eenintegraal). De kans op het waarnemen van een enkele waarde is gelijk aan 0, aangezien het aantal waarden dat kan worden aangenomen door de willekeurige variabele oneindig is.
Stel een willekeurige variabeleXkan alle waarden aannemen over een interval van reële getallen. Dan de kans datXzit in de reeks resultatenA, P(A), wordt gedefinieerd als het bovenstaande gebiedAen onder een bocht. De curve, die een functie vertegenwoordigtp(x), moet aan het volgende voldoen:
- 1:De curve heeft geen negatieve waarden (p(x)>0 voor alle x)
- 2:De totale oppervlakte onder de kromme is gelijk aan 1.
Een curve die aan deze vereisten voldoet, staat bekend als adichtheidscurve.
De uniforme verdeling
Een generator voor willekeurige getallen die werkt over een interval van getallen(een, b)heeft een continue verdeling. Aangezien elk interval van getallen van gelijke breedte een gelijke kans heeft om waargenomen te worden, is de curve die de verdeling beschrijft een rechthoek, met constante hoogte over het interval en 0 hoogte elders. Aangezien de oppervlakte onder de kromme gelijk moet zijn aan 1, bepaalt de lengte van het interval de hoogte van de kromme.De volgende grafieken geven de dichtheidscurven weer voor generatoren van willekeurige getallen over de intervallen (4,5) (linksboven), (2,6) (rechtsboven), (5,5,5) (linksonder) en (3,5) ( rechtsonder). De verdelingen die overeenkomen met deze curven staan bekend alsuniforme verdelingen.
Beschouw de uniforme willekeurige variabeleXgedefinieerd op het interval (2,6). Aangezien het interval breedte = 4 heeft, heeft de curve hoogte = 0,25 over het interval en 0 elders. De kans datXis kleiner dan of gelijk aan 5 is het gebied tussen 2 en 5, of (5-2)*0,25 = 0,75. De kans datXgroter is dan 3 maar kleiner dan 4 is het gebied tussen 3 en 4,(4-3)*0,25 = 0,25. Om die kans te vinden datXkleiner is dan 3ofgroter dan 5, tel de twee kansen op:P(X<3 en X>5) = P(X<3) + P(X>5) =(3-2)*0,25 +(6-5)*0,25 = 0,25 + 0,25 = 0,5.
De uniforme verdeling wordt vaak gebruikt om gegevens te simuleren. Stel dat u gegevens wilt simuleren voor 10 worpen met een gewone zeszijdige dobbelsteen. Het gebruik van de opdracht MINITAB "RAND" met de subopdracht "UNIF" genereert 10 getallen in het interval (0,6):
MTB > RAND 10 c2;SUBC> unif 0 6.Ken de discrete willekeurige variabele X als volgt toe aan de waarden 1, 2, 3, 4, 5 of 6:
als 0
Gebruik de gegenereerde MINITAB-gegevens om X toe te wijzen aan een waarde voor elke worp van de dobbelsteen:
Uniforme gegevensX-waarde4.5378655.7747463.6951841.0392924.2383550.3709610.7527215.5656360.8904513.180864Een ander type continue dichtheidscurve is denormale verdelingDe oppervlakte onder de curve is niet eenvoudig te berekenen voor een normale willekeurige variabeleXmet gemiddeldeen standaarddeviatie. Er zijn echter tabellen (en computerfuncties) beschikbaar voor de standaard willekeurige variabeleZ, waaruit wordt berekendXdoor af te trekkenen delen door. Alle waarschijnlijkheidsregels zijn van toepassing op de normale verdeling.