I statistikk jobber du ofte med en tilfeldig variabel . Denne variabelen representerer gjerne et datasett fra et tilfeldig forsøk, eller en statistisk undersøkelse. En tilfeldig variabel har flere mulige utfall. Hvilke utfall som er mulige kommer an på den tilfeldige variabelen.
Eksempel 1
La være tallet du får om du kaster en sekssidet terning. er da en tilfeldig variabel, og betegner antall øyne du kan få når du kaster terningen. De mulige utfallene til er da 1, 2, 3, 4, 5 og 6.
Eksempel 2
Du kjøper et skrapelodd og skraper det. La være antall kroner du vinner. er da en tilfeldig variabel. Det vanligste utfallet til er 0, for som regel vinner du ingenting, men om du vinner kr er utfallet til lik 100.
I eksemplene over ser du at og er veldig forskjellige. har bare seks forskjellige utfall, og alle er akkurat like sannsynlige. har mange mulige utfall, og 0 er mye mer sannsynlig enn noe annet utfall.
Matematisk sier du at og har forskjellige sannsynlighetsfordelinger. En sannsynlighetsfordeling er en regel som sier deg hvor sannsynlig hvert utfall er. betyr «sannsynligheten for at blir .»
Teori
I statistikken brukes ordet sannsynlighetsfordeling om en gitt type formler. Når du leser sannsynlighetsfordeling så tenk formel. Ulike sannsynlighetsfordelinger må tilfredsstille ulike kriterier, slik som for alle andre formler du har møtt på i matematikken.
NB! Det er svært viktig at du vet hva den enkelte sannsynlighetsfordeling krever, slik at du vet hvilken fordeling du skal bruke på et gitt datasett.
Eksempel 3
Sannsynlighetsfordelingen til fra Eksempel 1 over er «Sannsynligheten for 1 er , sannsynligheten for 2 er » og så videre. Dette kan du skrive slik som i tabellen under:
1 | 2 | 3 | 4 | 5 | 6 | |
De viktigste sannsynlighetsfordelingene er binomisk fordeling, hypergeometrisk fordeling og normalfordeling.