Hypergeometrisk sannolikhetsfördelning
Hypergeometrisk sannolikhetsfördelningHypergeometrisk fördelning är en diskret fördelning. Den uppkommer ofta i lotterisituationer. Fördelningens sannolikhetsfunktion är:
P(X=k) = nCp(Np, k) * nCp( N(1-p), n-k) / nCp( N, n)
Där p är sannolikeheten att en viss händelse ska inträffa. (nCp(x,y) ska utläsas x över y. Notationen är den som används av bland annat Texas Instruments.)
Exempel: Det finns N=100 lotter i ett lotteri varav 10 stycken är vinstlotter. Du köper n=3 lotter. Vad är sannolikheten att du köpt exakt k=1 vinstlott?
Lösning:
Givet: Andelen vinstlotter är p = 10/100 = 0,1. Antal lotter N = 100. Antal köpta lotter n = 3. X = "antal vinstlotter". X tillhör Hyp(N,n,p).
Sökt: P(X=1), utläses exempelvis "Sannolikheten att antal vinstlotter är 1".
Lösn: P(X=1) = nCp(100 * 10/100, 1) * nCp( 100 * (1 - 10/100), 3-1) / nCp( 100, 3) = nCp(10,1) * nCp(90, 2) / nCp(100, 1) = = 10 * 4005 / 161700 ~= 0,247680890538 eller ungefär 25 %.
Svar: Sannolikheten att jag köpt exakt en vinstlott är 25 %.
Formeln kan härledas ur den klassiska sannolikhetsläran där sannolikheten för en händelse är "gynsamma utfall" / "möjliga utfall", eller, som man ofta skriver g/m. (Sannolikheten att få en sexa vid kast med tärning är: g=1, m=6 => g/m = 1/6). I exemplet ovan har vi m = "antal sätt att välja 3 lotter bland 100" och g = "antal sätt att välja 1 vinstlott bland 10" * "antal sätt att välja 2 nitlotter bland 90". Detta förefaller naturligt och korrekt enligt kombinatorikens regler.
Lägg märke till följande:För att X ska tillhöra Hyp(N,n,p) måste vi i förväg kunna fastställa antal lotter och antal vinster (vilket ger antalet nitlotter). Om vi ställer följande fråga: "Du äger en skivbutik. Sannolikheten för att det är fel på en CD-skiva är p = 1/100. Du har precis beställt 50 exemplar av Metallicas senaste och bestämmer dig för att göra ett stickprov på 10 utav dem. Vad är sannolikheten för att det är fel på exakt en skiva i stickprovet?"
Det är lätt att förledas tro att detta är en Hypergeometrisk fördelning. Att så inte är fallet framgår av att Np = 50 * 1/100 = 0.5, eller med andra ord: Antalet felaktiga skivor i din beställning är en halv??? För att detta ska kunna betraktas som en Hypergeometrisk fördelning måste vi alltså ha information om hur många skivor i försändelsen som är defekta. Vi kan INTE använda informationen från det totala antalet felaktiga skivor i världen.
Ett annat exempel på när det kan bli fel är: "Ditt närköp säljer tia-lotter. De har 200 på lager och du köper 2 av dem. Sannolikheten för att en lott ska vara vinstlott är 1/10. Vad är sannolikheten för att du köpt exakt en vinstlott?" Även här blir det fel trots att Np= 200 * 1/10 = 20 = ett heltal. Detta för att vi, enligt ovan, inte kan använda informationen från alla tia-lotter i världen. Vad säger att det i butiken finns en enda vinstlott? Det kan ju faktiskt vara så att butiken inte har en enda vinstlott och då är den sökta sannolikheten = 0. Trots att sannolikheten för varje enskild lott är 1/10, i världen.
Artikeln skriven 2009-01-17 av Learning4sharing
Kategorier för Hypergeometrisk sannolikhetsfördelning
(1), va fan har ni inte formler i bilder?(1), skruttsida(1), ser förjävligt ut med bara vanlig text(1), katastrof(1)Intresserad av fler artiklar?
BrigadÖjaren
Flodkräfta
Dividend
Nämnare
Zon3
Michael Redgrave
Richard Dean Anderson
Corin Nemec