Rozkład geometryczny

Rozkład geometryczny
Funkcja rozkładu prawdopodobieństwa
Ilustracja
Dystrybuanta
Ilustracja
Parametry

0 < p 1 {\displaystyle 0<p\leqslant 1}
prawdopodobieństwo sukcesu (liczba rzeczywista)

Nośnik

k { 1 , 2 , 3 , } {\displaystyle k\in \{1,2,3,\dots \}}

Funkcja rozkładu prawdopodobieństwa

( 1 p ) k 1 p {\displaystyle (1-p)^{k-1}\,p}

Dystrybuanta

1 ( 1 p ) k {\displaystyle 1-(1-p)^{k}}

Wartość oczekiwana (średnia)

1 p {\displaystyle {\frac {1}{p}}}

Mediana

log ( 2 ) log ( 1 p ) {\displaystyle \left\lceil {\frac {-\log(2)}{\log(1-p)}}\right\rceil }
niejednoznaczna gdy
log ( 2 ) / log ( 1 p ) Z {\displaystyle -\log(2)/\log(1-p)\in \mathbb {Z} }

Moda

1 {\displaystyle 1}

Wariancja

1 p p 2 {\displaystyle {\frac {1-p}{p^{2}}}}

Współczynnik skośności

2 p 1 p {\displaystyle {\frac {2-p}{\sqrt {1-p}}}}

Kurtoza

6 + p 2 1 p {\displaystyle 6+{\frac {p^{2}}{1-p}}}

Entropia

1 p p log 2 ( 1 p ) log 2 p {\displaystyle -{\frac {1-p}{p}}\log _{2}(1-p)-\log _{2}p}

Funkcja tworząca momenty

p e t 1 ( 1 p ) e t {\displaystyle {\frac {pe^{t}}{1-(1-p)e^{t}}}}

Funkcja charakterystyczna

p e i t 1 ( 1 p ) e i t {\displaystyle {\frac {pe^{it}}{1-(1-p)\,e^{it}}}}

Odkrywca

William Feller (1950)

Rozkład geometrycznydyskretny rozkład prawdopodobieństwa opisujący prawdopodobieństwo zdarzenia, że proces Bernoulliego odniesie pierwszy sukces dokładnie w k {\displaystyle k} -tej próbie. k {\displaystyle k} musi być liczbą naturalną dodatnią. Rozkład ten oznacza się zwykle symbolem Geo(p).

Zmienna losowa X ma więc rozkład Geo(p) jeśli

P ( X = k ) = ( 1 p ) k 1 p {\displaystyle P(X=k)=(1-p)^{k-1}p}

Zauważmy, że jeśli X ma rozkład Geo(p), to P ( X > k ) = ( 1 p ) k . {\displaystyle P(X>k)=(1-p)^{k}.} Zatem jej dystrybuanta jest zadana wzorem F X ( k ) = P ( X k ) = 1 ( 1 p ) k {\displaystyle F_{X}(k)=P(X\leqslant k)=1-(1-p)^{k}} dla liczb naturalnych k.

Uwaga: Niekiedy zamiast badać w której próbie odniesiemy pierwszy sukces, badamy ile prób z rzędu kończy się porażką. Wówczas tak zdefiniowane k {\displaystyle k} jest o jeden mniejsze, więc we wszystkich wzorach należy dodać do niego 1.

Rozkład geometryczny to szczególny przypadek ujemnego rozkładu dwumianowego dla r = 1. {\displaystyle r=1.}

Ciągłym odpowiednikiem rozkładu geometrycznego jest rozkład wykładniczy.

Momenty

Funkcja tworząca prawdopodobieństwo zmiennej losowej X o rozkładzie Geo(p) jest zadana wzorem

f ( t ) = k = 1 t k ( 1 p ) k 1 p = p t 1 ( 1 p ) t {\displaystyle f(t)=\sum _{k=1}^{\infty }t^{k}(1-p)^{k-1}p={\frac {pt}{1-(1-p)t}}}

Z tego otrzymujemy

E ( X ) = f ( 1 ) = p ( 1 ( 1 p ) t ) 2 | t = 1 = 1 p {\displaystyle \mathrm {E} (X)=f'(1)={\frac {p}{(1-(1-p)t)^{2}}}|_{t=1}={\frac {1}{p}}}

oraz

E ( X ( X 1 ) ) = f ( 1 ) = 2 ( 1 p ) p 2 {\displaystyle \mathrm {E} (X(X-1))=f''(1)={\frac {2(1-p)}{p^{2}}}}

z czego otrzymujemy

v a r ( X ) = f ( 1 ) + f ( 1 ) ( f ( 1 ) ) 2 = 2 ( 1 p ) p 2 + 1 p 1 p 2 = 1 p p 2 {\displaystyle \mathrm {var} (X)=f''(1)+f'(1)-(f'(1))^{2}={\frac {2(1-p)}{p^{2}}}+{\frac {1}{p}}-{\frac {1}{p^{2}}}={\frac {1-p}{p^{2}}}}

Wyższe momenty główne m k {\displaystyle m_{k}} rozkładów Geo(p) mogą być wyznaczone za pomocą funkcji generującej momenty. Spełniają one następującą zależność rekurencyjną:

m k + 1 = ( 1 p ) ( ( 1 p + 1 1 p ) m k d m k d p ) {\displaystyle m_{k+1}=(1-p)\left(\left({\frac {1}{p}}+{\frac {1}{1-p}}\right)m_{k}-{\frac {dm_{k}}{dp}}\right)}

Momenty centalne μ a {\displaystyle \mu _{a}} rozkładów Geo(p) mogą być wyznaczone za pomocą funkcji generującej momenty centralne. Spełniają one następującą zależność rekurencyjną:

μ a + 1 = ( 1 p ) ( a p 2 μ a 1 d μ a d p ) {\displaystyle \mu _{a+1}=(1-p)\left({\frac {a}{p^{2}}}\mu _{a-1}-{\frac {d\mu _{a}}{dp}}\right)}

Inne własności

Rozkład geometryczny jest bezpamięciowym: jeśli X {\displaystyle X} ma rozkład Geo(p) i k , l {\displaystyle k,l} są liczbami naturalnymi, to

P ( X > k + l | X > k ) = P ( X > k + l , X > k ) P ( X > k ) = P ( X > k + l ) P ( X > k ) = {\displaystyle P(X>k+l|X>k)={\frac {P(X>k+l,X>k)}{P(X>k)}}={\frac {P(X>k+l)}{P(X>k)}}=}
( 1 p ) k + l ( 1 p ) k = ( 1 p ) l = P ( X > l ) . {\displaystyle {\frac {(1-p)^{k+l}}{(1-p)^{k}}}=(1-p)^{l}=P(X>l).}

Związki z innymi rozkładami

  1. Jeśli X 1 , , X r {\displaystyle X_{1},\dots ,X_{r}} są niezależne i mają rozkład Geo(p), to ich suma X 1 + + X r {\displaystyle X_{1}+\ldots +X_{r}} ma ujemny rozkład dwumianowy NB(r,p)
  2. Jeśli X 1 , , X r {\displaystyle X_{1},\dots ,X_{r}} są niezależne i mają rozkład Geo(p) to zmienna losowa Y = min ( X 1 , , X r ) {\displaystyle Y=\min(X_{1},\dots ,X_{r})} ma rozkład geometryczny z parametrem 1 ( 1 p ) r {\displaystyle 1-(1-p)^{r}}

Zobacz też