Hipergeometrik dağılım

Hipergeometrik
Olasılık kütle fonksiyonu
Yığmalı dağılım fonksiyonu
Parametreler N 0 , 1 , 2 , m 0 , 1 , 2 , , N n 0 , 1 , 2 , , N {\displaystyle {\begin{aligned}N&\in 0,1,2,\dots \\m&\in 0,1,2,\dots ,N\\n&\in 0,1,2,\dots ,N\end{aligned}}\,}
Destek k max ( 0 , n + m N ) , , min ( m , n ) {\displaystyle \scriptstyle {k\,\in \,\max {(0,\,n+m-N)},\,\dots ,\,\min {(m,\,n)}}\,}
Olasılık kütle fonksiyonu (OYF) ( m k ) ( N m n k ) ( N n ) {\displaystyle {{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}}
Birikimli dağılım fonksiyonu (YDF)
Ortalama n m N {\displaystyle nm \over N}
Medyan
Mod ( n + 1 ) ( m + 1 ) N + 2 {\displaystyle \left\lfloor {\frac {(n+1)(m+1)}{N+2}}\right\rfloor }
Varyans n ( m / N ) ( 1 m / N ) ( N n ) ( N 1 ) {\displaystyle n(m/N)(1-m/N)(N-n) \over (N-1)}
Çarpıklık ( N 2 m ) ( N 1 ) 1 2 ( N 2 n ) [ n m ( N m ) ( N n ) ] 1 2 ( N 2 ) {\displaystyle {\frac {(N-2m)(N-1)^{\frac {1}{2}}(N-2n)}{[nm(N-m)(N-n)]^{\frac {1}{2}}(N-2)}}}
Fazladan basıklık [ N 2 ( N 1 ) n ( N 2 ) ( N 3 ) ( N n ) ] {\displaystyle \left[{\frac {N^{2}(N-1)}{n(N-2)(N-3)(N-n)}}\right]}

[ N ( N + 1 ) 6 N ( N n ) m ( N m ) {\displaystyle \cdot \left[{\frac {N(N+1)-6N(N-n)}{m(N-m)}}\right.} + 3 n ( N n ) ( N + 6 ) N 2 6 ] {\displaystyle +\left.{\frac {3n(N-n)(N+6)}{N^{2}}}-6\right]}

Entropi
Moment üreten fonksiyon (mf) ( N m n ) 2 F 1 ( n , m ; N m n + 1 ; e t ) ( N n ) {\displaystyle {\frac {{N-m \choose n}\scriptstyle {\,_{2}F_{1}(-n,-m;N-m-n+1;e^{t})}}{N \choose n}}\,\!}
Karakteristik fonksiyon ( N m n ) 2 F 1 ( n , m ; N m n + 1 ; e i t ) ( N n ) {\displaystyle {\frac {{N-m \choose n}\scriptstyle {\,_{2}F_{1}(-n,-m;N-m-n+1;e^{it})}}{N \choose n}}}

Olasılık kuramında ve istatistikte, hipergeometrik dağılım sonlu bir ana kütle içinden tekrar geri koymadan birbiri arkasına n tane nesnenin çekilmesi işlemi için başarı sayısının dağılımını bir ayrık olasılık dağılımı şekilde betimler.

Yaygın bir örnek, hatalı ve hatasız malları sınıflandıran bir ihtimal tablosunda gösterilebilir:

Çekilmiş Çekilmemiş Toplam
Hatalı k mk m
Hatasız nk N + k − n − m N − m
Toplam n N − n N

İçinde m sayıdan daha fazla hatalı mal birimi olmadığını kabul ettiğimiz N birimlik bir mal teslimi yapılmıştır. Bu N sayıdaki malların içinden tam n sayıda bir örnek alınıp bunlar kontrolden geçilirse bu örnek içinde tam k tane hatalı mal birimi bulunacağı hipergeometrik dağılım ile açıklanır.

Genel olarak: Eğer bir X rassal değişkeni N, m ve n parametreleri olan bir hipergeometrik dağılım gösterirse, tam olarak k sayıda başarı elde edilmesi, şu fonksiyonla bulunur:

f ( k ; N , m , n ) = ( m k ) ( N m n k ) ( N n ) . {\displaystyle f(k;N,m,n)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}.}

k değeri max(0, n+mN) ile min(mn) arasındaysa olasılık pozitiftir.

Bu formül şöyle daha da açıklanabilir: (Geri koyulmadan) alınabilmesi mümkün örnek sayısı ( N n ) {\displaystyle {\tbinom {N}{n}}} 'dir. Hatalı nesne sayısının k olması için ( m k ) {\displaystyle {\tbinom {m}{k}}} sayıda ihtimal bulunur; geride kalan kısmın hatasız nesnelerle doldurulması için de ( N m n k ) {\displaystyle {\tbinom {N-m}{n-k}}} ihtimal mevcuttur.

k, 0 ve N arasında her tam sayı değeri alabildiği için ve olasılık değerlerinin toplamı 1 olduğu için, kombinatorik matematikte bu Vandermonde'nin özdeşliğidir.

Uygulama ve bir örnek

Hipergeometrik dağılımın klasik uygulaması geri koymadan örnekleme adı verilebilen bir denemedir. Bir küp problemi düşünülsün: bir küpün içinde iki tip küçük top, beyaz ve siyah, bulunduğu düşünülsün. Aynen bir binom dağılımı için yapılan deneme gibi, küpten bir beyaz top çekmeye başarı adı verilsin ve alternatif olan siyah top çekmek başarısızlık sayılsın. N küpte bulunan toplam top sayısı, m küpteki beyaz top sayısı ve böylece N − m ise küpteki siyah top sayısı olsun. Şimdi küpün içinde 5 beyaz ve 45 siyah top olduğu varsayılsın. Gözleri kapalı olarak küpten birer birer 10 tane top çekilsin ve her çekilen top küpe geri konulmasın. Bu deneme geri koyulmadan örnekleme olur.

Araştırmayı ilgilendiren soru: Bu çekişte küpten tam 4 tane beyaz top çekme (yani ima ile 6 tane de siyah top çekme) olasılığı nedir? Buna binom dağılım modeli uygulanamaz; çünkü her çekilişte başarı olasılığı değişmektedir. Bu problem iki kategorik değişkeni sınıflandıran olumsallık tablosunda şöyle özetlenebilir:

Çekilmiş Çekilmemiş Toplam
Beyaz toplar 4 (k) 1 = 5 − 4 (mk) 5 (m)
Siyah toplar 6 = 10 − 4 (nk) 39 = 50 + 4 − 10 − 5 (N + k − n − m) 45 (N − m)
Toplam 10 (n) 40 (N − n) 50 (N)

Küpten tam olarak k tane beyaz top çekmenin olasılığı şu formül kullanılarak hesaplanir:

Pr ( K = k ) = f ( k ; N , m , n ) = ( m k ) ( N m n k ) ( N n ) . {\displaystyle \Pr(K=k)=f(k;N,m,n)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}.}

Bu problem için k = 4 olduğundan 4 tane beyaz top (ve 6 tane siyah top) çekme olasılığı

Pr ( K = 4 ) = f ( 4 ; 50 , 5 , 10 ) = ( 5 4 ) ( 45 6 ) ( 50 10 ) = 0.003964583 . {\displaystyle \Pr(K=4)=f(4;50,5,10)={{{5 \choose 4}{{45} \choose {6}}} \over {50 \choose 10}}=0.003964583\dots .}

çok düşük bir değerde (yaklaşık 0,004) olup, olabilirliği nerede ise sıfıra eşittir. Bu bir değişik ifade ile açıklanırsa bu rassal deneme (yani içinde 50 top bulunan bir küpten 10 tane top çekip hiçbirini geri koyulmamasi denemesini) 1000 defa tekrarlanırsa 4 beyaz (ve 7 siyah) top elde etmek ancak 4 defa ortaya çıkan bir sonuç olacaktır.

Bu sefer küpten 5 tane beyaz (ve 5 tane siyah) top çekme olasılığına göz atılsın. İki kategorik değişkeni sınıflandıran olumsallık tablosu şöyle kurulur:

Çekilmiş Çekilmemiş Toplam
Beyaz toplar 5 (k) 0 = 5 − 5 (m − k) 5 (m)
Siyah toplar 5 = 10 − 5 (n − k) 40 = 50 + 5 − 10 − 5 (N + k − n − D) 45 (N − m)
Toplam 10 (n) 40 (N − n) 50 (N)

Olasılık şöyle hesaplanabilir (Dikkat edilirse paydalar hep aynıdır):

Pr [ K = 5 ] = f ( 5 ; 50 , 5 , 10 ) = ( 5 5 ) ( 45 5 ) ( 50 10 ) = 0.0001189375 , {\displaystyle \Pr[K=5]=f(5;50,5,10)={{{5 \choose 5}{{45} \choose {5}}} \over {50 \choose 10}}=0.0001189375\dots ,}

Beklendiği gibi 5 beyaz top çekme olasılığı, 4 beyaz top çekme olasılığının çok daha altındadır.

Simetriler

Hipergeometrik dağılımda n ve m parametreleri arasında çok önemli simetriler vardır. Bu simetriler verilen küp problemi için önemli değil gibi görünmektedirler. Gerçekten verilen bazı hipergeometrik dağılım gösteren problemlerde n ve m parametreleri hiçbir problem olmadan birbiriyle değiştirilebilir. Ancak hayat/ölüm sorunlarına hipergeometrik dağılım uygulanmaya başlayınca önemleri anlaşılabilir.

Parametreler olan n ve m arasındaki simetriler şöyle sıralanabilirler:

  • Bu halde siyah ve beyaz en basitçe rol değiştirmektedirler.
f(k;N,m,n) = f(n − k;N,N − m,n)

Bunu daha kolay anlamak için siyah toplar beyaza; beyaz toplar siyaha boyanınca neyin değiştiğini düşünmek gerektir.

  • Bu halde çekilmiş ve çekilmemiş toplar rol değiştirmektedirler.
f(k;N,m,n) = f(m − k;N,m,N − n)
  • Bu simetriyi anlamak için topları çekme hareketini unutup, zaten çekilmiş olan toplara dikkat

çekilmektedir ve zaten çekilmiş olan toplara etiket yapıştırma işlemine benzer:

f(k;N,m,n) = f(k;N,n,m)

İlişkili dağılımlar

X ~ Hypergeometrik( m {\displaystyle m} , N {\displaystyle N} , n {\displaystyle n} ) ve p = m / N {\displaystyle p=m/N} olsun.

  • Eğer n = 1 {\displaystyle n=1} ise X {\displaystyle X} rassal değişkeni p {\displaystyle p} parametreli bir Bernoulli dağılımı gösterir.
  • Eğer 0 veya 1 e eşit olmayan n {\displaystyle n} ve p {\displaystyle p} ile karşılaştırılınca N {\displaystyle N} ve m {\displaystyle m} büyük değerlerde iseler, o halde
P [ X x ] P [ Y x ] {\displaystyle P[X\leq x]\approx P[Y\leq x]}

Burada Y {\displaystyle Y} rassal değişkeni parametreleri n {\displaystyle n} ve p {\displaystyle p} olan bir binom dağılım gösterir.

  • Eğer 0 veya 1 e eşit olmayan n {\displaystyle n} ve p {\displaystyle p} ile karşılaştırılınca N {\displaystyle N} ve m {\displaystyle m} büyük değerlerde iseler, o halde
P [ X x ] Φ ( x n p n p ( 1 p ) ) {\displaystyle P[X\leq x]\approx \Phi \left({\frac {x-np}{\sqrt {np(1-p)}}}\right)}

Burada Φ {\displaystyle \Phi } bir standart normal dağılım gösterir.

Ayrıca bakınız

Kaynakça

Dış bağlantılar

  • Hipergeometrik dağılım hesaplayıcısı16 Şubat 2008 tarihinde Wayback Machine sitesinde arşivlendi.
  • Yazılım (C++ ve Ruby) kaynakları ile hipergeometrik dağılım hesaplayıcısı24 Şubat 2008 tarihinde Wayback Machine sitesinde arşivlendi.
  • g
  • t
  • d
Ayrık tek değişkenli ve sonlu destekli

Ayrık tekdüze · Benford · Bernoulli · Binom · Kategorik · Hipergeometrik · Rademacher · Zipf · Zipf-Mandelbrot

Ayrık tek değişkenli ve sonsuzluk
destekli

Boltzmann · Conway-Maxwell-Poisson · Bileşik Poisson · Ayrık faz tipi · Genişletilmiş negatif binom · Gauss-Kuzmin · Geometrik · Logaritmalı · Negatif binom · Parabolik fraktal · Poisson · Skellam · Yule-Simon · Zeta

Sürekli tek değişkenli ve
[0,1] gibi bir sınırlı aralıkta destekli

Beta · Irwin-Hall · Kumaraswamy · Kabartılmış kosinus · Üçgensel · U-kuadratik · Sürekli tekdüze · Wigner yarımdaire

Sürekli tek değişkenli ve
genellikle (0,∞) yarı-sonsuz aralığında
destekli

Beta prime · Bose–Einstein · Burr · Ki-kare · Coxian · Erlang · Üstel · F-dağılımı · Fermi-Dirac · Katlanmış normal · Fréchet · Gamma · Genelleştirilmiş uçsal değer · Genelleştirilmiş ters Gauss-tipi · Yarı-logistik · Yarı-normal · Hotelling'in T-kare · Hiper-üstel · Hipo-üstel · Ters ki-kare (Ölçeklenmiş ters ki-kare) · Ters Gauss-tipi · Ters gamma · Lévy · Log-normal · Log-logistik · Maxwell-Boltzmann · Maxwell hız · Nakagami · Merkezsel olmayan ki-kare · Pareto · Faz-tipi · Rayleigh · Relativistik Breit–Wigner · Rice · Rosin–Rammler · Kaydırılmış Gompertz · Kesilmiş normal · 2.tip Gumbel · Weibull · Wilks'in lambda

Sürekli tek değişkenli ve
(-∞,∞) arasındaki tüm reel doğru
üzerinde destekli

Cauchy · Uçsal değer · Üstel güç · Fisher'in z  · Genelleştirilmiş hiperbolik  · Gumbel · Hiperbolik sekant · Landau · Laplace · Lévy çarpık alfa-durağan · Logistik · Normal (Gauss tipi) · Normal ters Gauss-tipi · Çarpık normal · Student'in t · 1.tip Gumbel · Varyans-Gamma · Voigt

Çok değişkenli (birleşik)

Ayrık: Ewens · Beta-binom · Multinom · Çokdeğişirli Polya
Sürekli: Dirichlet · Genelleştirilmiş Dirichlet · Çokdeğişirli normal · Çokdeğişirli Student  · normal-ölçeklenmiş ters gamma  · Normal-gamma
Matris-değerli: Ters-Wishart · Matris normal · Wishart

Yönsel, Bozulmuş ve singuler

Yönsel: Kent  · von Mises · von Mises–Fisher
Bozulmuş: Ayrık bozulmuş ·
Dirac delta fonksiyonu
Singuler: Cantor ·

Aileler

Üstel · Doğasal üstel · Konum-ölçekli · Maksimum entropi · Pearson · Tweedie