Dystrybuanta

Dystrybuanta (fr. distribuer „rozdzielać, rozdawać” z łac. distribuo zob. dystrybucja) – funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa, ponieważ są obiektami prostszymi niż rozkłady prawdopodobieństwa. W statystyce dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną i jest blisko związana z pojęciem rangi.

Definicja formalna

Niech P {\displaystyle \mathbb {P} } będzie rozkładem prawdopodobieństwa na prostej. Funkcję F : R R {\displaystyle F\colon \mathbb {R} \to \mathbb {R} } daną wzorem

F ( t ) = P ( ( , t ] ) , {\displaystyle F(t)=\mathbb {P} ((-\infty ,t]),}

nazywamy dystrybuantą rozkładu P . {\displaystyle \mathbb {P} .}

Własności

Funkcja F : R R {\displaystyle F\colon \mathbb {R} \to \mathbb {R} } jest dystrybuantą (pewnego rozkładu prawdopodobieństwa) wtedy i tylko wtedy, gdy jest ona niemalejąca, prawostronnie ciągła oraz

  • lim t   F ( t ) = 0 , {\displaystyle \lim _{t\to -\infty }~F(t)=0,}
  • lim t   F ( t ) = 1. {\displaystyle \lim _{t\to \infty }~F(t)=1.}
Uwaga 1
Powyższa charakteryzacja dostarcza warunek konieczny i wystarczający na to, by funkcja dana funkcja F : R R {\displaystyle F\colon \mathbb {R} \to \mathbb {R} } była dystrybuantą pewnego rozkładu, dlatego czasami to właśnie je przyjmuje się jako definicję. Podejście takie może być korzystniejsze z tego względu, że nie trzeba odwoływać się do pojęcia rozkładu pochodzącego z teorii miary. Wówczas taka definicja zawiera ciche założenie, że istnieje rozkład, którego ta funkcja jest dystrybuantą.
Uwaga 2
Dystrybuanta F {\displaystyle F} wyznacza pewien rozkład P {\displaystyle \mathbb {P} } jednoznacznie i na odwrót, więc gdy zachodzi potrzeba całkowania pewnej funkcji borelowskiej g {\displaystyle g} względem rozkładu P , {\displaystyle \mathbb {P} ,} to można mówić, że całkujemy ją względem dystrybuanty F , {\displaystyle F,} co zapisuje się:
g d P = g d F . {\displaystyle \int {g}\,\mathrm {d} \mathbb {P} =\int {g}\,\mathrm {d} F.}
Uwaga 3
Niekiedy[2] w definicji dystrybuanty stosuje się przedział otwarty:
F ( t ) = P ( ( , t ) ) . {\displaystyle F(t)=\mathbb {P} ((-\infty ,t)).}
Dystrybuanta jest wówczas funkcją lewostronnie ciągłą (w przeciwieństwie do przypadku gdy w definicji stosuje się przedział prawostronnie domknięty i dystrybuanta jest funkcją prawostronnie ciągłą).

Punkty skokowe

Punkt skokowy dystrybuanty to punkt y , {\displaystyle y,} dla którego dystrybuanta F ( x ) {\displaystyle F(x)} spełnia warunek:

F ( y ) lim x y F ( x ) > 0 , {\displaystyle F(y)-\lim _{x\to y^{-}}{F(x)}>0,}

tzn. jest to jej punkt nieciągłości.

W przypadku dyskretnego rozkładu prawdopodobieństwa punkty skokowe występują dla każdej wartości zmiennej losowej, dla której ma ona dodatnie prawdopodobieństwo i tylko tam. W przypadku bezwzględnie ciągłego rozkładu prawdopodobieństwa nie ma punktów skokowych dystrybuanty. Zbiór punktów skokowych dystrybuanty jest co najwyżej zbiorem przeliczalnym.

Przykłady

Wykresy dystrybuant rozkładów normalnych o różnych parametrach.
F ( x ) = { 0 dla     x a x a b a dla     a < x b 1 dla     x > b {\displaystyle F(x)={\begin{cases}0&{\textrm {dla}}\ \ x\leqslant a\\[2pt]{\frac {x-a}{b-a}}&{\textrm {dla}}\ \ a<x\leqslant b\\[2pt]1&{\textrm {dla}}\ \ x>b\end{cases}}}
  • Dystrybuanta rozkładu normalnego o parametrach μ {\displaystyle \mu } i σ 2 : {\displaystyle \sigma ^{2}{:}}
F ( x ) = x 1 σ 2 π e ( t μ ) 2 ( 2 σ 2 ) d t {\displaystyle F(x)=\int \limits _{-\infty }^{x}{\frac {1}{\sigma {\sqrt {2\pi }}}}e^{\frac {-(t-\mu )^{2}}{(2\sigma ^{2})}}\,\mathrm {d} t}
F ( x ) = { 1 e λ x , x 0 , 0 , x < 0. {\displaystyle F(x)={\begin{cases}1-e^{-\lambda x},&x\geqslant 0,\\[2pt]0,&x<0.\end{cases}}}

Gęstość

Mierzalną w sensie Lebesgue’a funkcję f : R [ 0 , ) {\displaystyle f\colon \mathbb {R} \to [0,\infty )} nazywamy gęstością dystrybuanty F {\displaystyle F} wtedy i tylko wtedy, gdy:

F ( x ) = x f ( t ) d t ( x R ) . {\displaystyle F(x)=\int \limits _{-\infty }^{x}{f}(t)\,\mathrm {d} t\quad (x\in \mathbb {R} ).}

Własności

  • Jeżeli f {\displaystyle f} jest gęstością pewnej dystrybuanty, to całka z f {\displaystyle f} po całej prostej wynosi 1. {\displaystyle 1.}
  • Jeżeli f 1 {\displaystyle f_{1}} i f 2 {\displaystyle f_{2}} są gęstościami pewnej dystrybuanty, to są one równe prawie wszędzie.
  • Jeżeli dystrybuanta ma gęstość, to jest funkcją ciągłą.
  • Każda dystrybuanta, jako funkcja monotoniczna jest prawie wszędzie różniczkowalna.
  • Jeśli dystrybuanta F {\displaystyle F} ma gęstość, to dla x R : {\displaystyle x\in \mathbb {R} {:}}
F ( x ) = x F ( t ) d t . {\displaystyle F(x)=\int \limits _{-\infty }^{x}F'(t)\,\mathrm {d} t.}

Gęstość dystrybuanty ma praktyczne zastosowanie: jeśli F {\displaystyle F} jest dystrybuantą rozkładu P , {\displaystyle \mathbb {P} ,} to często zachodzi konieczność całkowania względem miary P . {\displaystyle \mathbb {P} .} Całkowanie względem abstrakcyjnych miar jest dość trudne (brak konkretnych narzędzi do obliczania całek), jednak jeśli f {\displaystyle f} jest gęstością dystrybuanty F , {\displaystyle F,} to

B g ( x ) d P ( x ) = B g ( x ) f ( x ) d x , {\displaystyle \int \limits _{B}g(x)\,\mathrm {d} \mathbb {P} (x)=\int \limits _{B}g(x)f(x)\,\mathrm {d} x,}

dla każdego zbioru borelowskiego B R {\displaystyle B\subseteq \mathbb {R} } i dla każdej funkcji borelowskiej g {\displaystyle g} przyjmującej wartości w R , R ¯ , C , R M {\displaystyle \mathbb {R} ,{\overline {\mathbb {R} }},\mathbb {C} ,\mathbb {R} ^{M}} dla pewnej liczby naturalnej M . {\displaystyle M.}

Ciągłość dystrybuanty a istnienie gęstości

Istnieją ciągłe dystrybuanty niemające gęstości. Klasycznym przykładem jest:

F ( x ) = { 0 , x < 0 C ( x ) , x [ 0 , 1 ] , 1 , x > 1 , {\displaystyle F(x)=\left\{{\begin{array}{l}0,&x<0\\C(x),&x\in [0,1],\\1,&x>1,\end{array}}\right.}

gdzie C ( x ) {\displaystyle C(x)} oznacza funkcję Cantora. C ( x ) {\displaystyle C(x)} jest prawie wszędzie stała, monotoniczna, ciągła i przyjmuje wszystkie wartości z przedziału [ 0 , 1 ] . {\displaystyle [0,1].} Dystrybuanta F {\displaystyle F} nie może mieć zatem gęstości ponieważ F = 0 {\displaystyle F'=0} prawie wszędzie.

Funkcja charakterystyczna

 Osobny artykuł: Funkcja charakterystyczna (teoria prawdopodobieństwa).

Jeżeli F {\displaystyle F} jest dystrybuantą, to funkcję φ : R C {\displaystyle \varphi \colon \mathbb {R} \to \mathbb {C} } określoną wzorem

φ ( t ) = +   e i t x d F ( x ) {\displaystyle \varphi (t)=\int \limits _{-\infty }^{+\infty }~e^{itx}dF(x)}

nazywamy funkcją charakterystyczną dystrybuanty F . {\displaystyle F.}

Jeżeli φ {\displaystyle \varphi } jest funkcją charakterystyczną pewnej dystrybuanty, to jest ona funkcją jednostajnie ciągłą oraz

  1. φ ( 0 ) = 1 , {\displaystyle \varphi (0)=1,}
  2. φ ( t ) = φ ( t ) ¯ {\displaystyle \varphi (-t)={\overline {\varphi (t)}}} dla t R , {\displaystyle t\in \mathbb {R} ,}
  3. | φ ( t ) | 1 {\displaystyle |\varphi (t)|\leqslant 1} dla t R . {\displaystyle t\in \mathbb {R} .}

Jednym z praktycznych zastosowań funkcji charakterystycznej jest tzw. wzór na odwrócenie, dokładniej, jeśli φ {\displaystyle \varphi } jest funkcją charakterystyczną dystrybuanty F , {\displaystyle F,} a x , y {\displaystyle x,y} są punktami ciągłości tej dystrybuanty, to

F ( x ) F ( y ) = lim a 1 2 π a a e i t y e i t x i t φ ( t ) d t . {\displaystyle F(x)-F(y)=\lim _{a\to \infty }{\tfrac {1}{2\pi }}\int \limits _{-a}^{a}{\frac {e^{-ity}-e^{-itx}}{it}}\varphi (t)dt.}

Dowód tego faktu przeprowadza się w oparciu o twierdzenie Fubiniego.

Funkcje charakterystyczne wyznaczają jednoznacznie dystrybuanty, tzn. jeśli dystrybuanty mają te same funkcje charakterystyczne, to są równe. Funkcje charakterystyczne mówią także o własnościach dystrybuanty, związanych z gładkością – dokładniej, jeśli funkcja charakterystyczna jest całkowalna, to dystrybuanta jest klasy C 1 . {\displaystyle C^{1}.}

Zbieżność a ciągłość

Słaba zbieżność

Dla ciągów dystrybuant wprowadza się dodatkowy rodzaj zbieżności. Ciąg dystrybuant ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest słabo zbieżny do dystrybuanty F {\displaystyle F} wtedy i tylko wtedy, gdy

lim n   F n ( x ) = F ( x ) {\displaystyle \lim _{n\to \infty }~F_{n}(x)=F(x)}

dla każdego x R , {\displaystyle x\in \mathbb {R} ,} będącego punktem ciągłości dystrybuanty F . {\displaystyle F.}

  • W powyższej definicji istotne jest założenie „do dystrybuanty”. Jest tak, ponieważ ciąg dystrybuant może być zbieżny do funkcji, która nie jest dystrybuantą.
Przykład
Niech dany będzie ciąg dystrybuant:
F k ( x ) = { 0 , x k x + k 2 k , k < x k 1 , x > k {\displaystyle F_{k}(x)={\begin{cases}0,&x\leqslant -k\\[2pt]{\frac {x+k}{2k}},&-k<x\leqslant k\\[2pt]1,&x>k\end{cases}}}
Wówczas dla każdego x R , {\displaystyle x\in \mathbb {R} ,} F k ( x ) k F ( x ) = 1 2 , {\displaystyle F_{k}(x){\xrightarrow[{k\to \infty }]{}}F(x)={\frac {1}{2}},} ale funkcja F ( x ) = 1 2 {\displaystyle F(x)={\frac {1}{2}}} nie jest dystrybuantą.
  • Jeżeli ciąg dystrybuant jest słabo zbieżny do dystrybuanty, to do dokładnie jednej dystrybuanty. Ważnym twierdzeniem dotyczącym słabej zbieżności jest poniższe twierdzenie Helly’ego.

Twierdzenie Helly’ego

Jeżeli ciąg dystrybuant ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest słabo zbieżny do dystrybuanty F , {\displaystyle F,} a g : R R {\displaystyle g\colon \mathbb {R} \to \mathbb {R} } jest ograniczoną funkcją ciągłą, to

lim n   R   g ( x ) d F n ( x ) = R   g ( x ) d F ( x ) . {\displaystyle \lim _{n\to \infty }~\int \limits _{\mathbb {R} }~g(x)dF_{n}(x)=\int \limits _{\mathbb {R} }~g(x)dF(x).}

Wnioskiem z twierdzenia Helly’ego jest fakt, że jeśli ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest ciągiem dystrybuant, a ( φ n ) n N {\displaystyle (\varphi _{n})_{n\in \mathbb {N} }} ciągiem odpowiadająych im funkcji charakterystycznych oraz ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest punktowo zbieżny do dystrybuanty F , {\displaystyle F,} to ciąg ( φ n ) n N {\displaystyle (\varphi _{n})_{n\in \mathbb {N} }} jest punktowo zbieżny do funkcji charakterystycznej funkcji F . {\displaystyle F.}

Twierdzenie Lévy’ego-Craméra

Niech ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} będzie ciągiem dystrybuant, a ( φ n ) n N {\displaystyle (\varphi _{n})_{n\in \mathbb {N} }} będzie ciągiem odpowiadających im funkcji charakterystycznych. Ciąg ( φ n ) n N {\displaystyle (\varphi _{n})_{n\in \mathbb {N} }} jest punktowo zbieżny do ciągłej w zerze funkcji φ : R C {\displaystyle \varphi \colon \mathbb {R} \to \mathbb {C} } wtedy i tylko wtedy, gdy ciąg ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest słabo zbieżny do pewnej dystrybuanty F . {\displaystyle F.} φ {\displaystyle \varphi } jest wówczas funkcją charakterystyczną dystrybuanty F . {\displaystyle F.}

Na mocy powyższego twierdzenia można sformułować wniosek, że ciąg dystrybuant ( F n ) n N {\displaystyle (F_{n})_{n\in \mathbb {N} }} jest słabo zbieżny do dystrybuanty F {\displaystyle F} wtedy i tylko wtedy, gdy

lim n   R   g ( x ) d F n ( x ) = R   g ( x ) d F ( x ) {\displaystyle \lim _{n\to \infty }~\int \limits _{\mathbb {R} }~g(x)dF_{n}(x)=\int \limits _{\mathbb {R} }~g(x)dF(x)}

dla każdej ograniczonej funkcji ciągłej g . {\displaystyle g.}

Zbieżność jednostajna

Każdy ciąg dystrybuant zbieżny punktowo do dystrybuanty ciągłej jest zbieżny do niej jednostajnie. Fakt ten można udowodnić, korzystając z jednostajnej ciągłości dystrybuanty ciągłej.

Dystrybuanta zmiennej i wektora losowego

Niech ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},\mathbb {P} )} będzie ustaloną przestrzenią probabilistyczną.

Jeśli X : Ω R {\displaystyle X\colon \Omega \to \mathbb {R} } jest zmienną losową, to funkcja F X : R R {\displaystyle F_{X}\colon \mathbb {R} \to \mathbb {R} } dana wzorem:

F X ( x ) = P ( { ω Ω : X ( ω ) x } ) {\displaystyle F_{X}(x)=\mathbb {P} (\{\omega \in \Omega \colon \,X(\omega )\leqslant x\})} [3], x R {\displaystyle x\in \mathbb {R} }

jest dystrybuantą, którą nazywamy dystrybuantą zmiennej X . {\displaystyle X.}

F X ( x ) = P ( X 1 ( ( , x 1 ] × × ( , x n ] ) ) = P ( k = 1 n { ω Ω : X k ( ω ) x k } ) , x = ( x 1 , , x n ) R n {\displaystyle {\begin{aligned}F_{X}(\mathbf {x} )&=\mathbb {P} \left(X^{-1}((-\infty ,x_{1}]\times \ldots \times (-\infty ,x_{n}])\right)\\&=\mathbb {P} \left(\bigcap \limits _{k=1}^{n}\{\omega \in \Omega \colon X_{k}(\omega )\leqslant x_{k}\}\right),\quad \mathbf {x} =(x_{1},\dots ,x_{n})\in \mathbb {R} ^{n}\end{aligned}}}

jest dystrybuantą, którą nazywamy dystrybuantą wektora X . {\displaystyle X.}

Każda zmienna losowa (wektor losowy) wyznacza pewną dystrybuantę oraz każda dystrybuanta jest dystrybuantą pewnej zmiennej losowej (wektora losowego).

Przypisy

  1. Można także rozważać dystrybuanty rozkładów prawdopodobieństwa w przestrzeni R M {\displaystyle \mathbb {R} ^{M}} dla pewnego M N . {\displaystyle M\in \mathbb {N} .}
  2. Mieczysław Sobczyk: Statystyka: aspekty praktyczne i teoretyczne. Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, 2006, s. 74, 75. ISBN 83-227-2423-3.
  3. W praktyce stosuje się zapis P ( { ω Ω : X ( ω ) x } ) = P ( X ( ω ) x ) {\displaystyle \mathbb {\mathbb {P} } (\{\omega \in \Omega \colon \,X(\omega )\leqslant x\})=\mathbb {P} (X(\omega )\leqslant x)} albo nawet P ( X x ) . {\displaystyle \mathbb {P} (X\leqslant x).}

Bibliografia

  • Patrick Billingsley: Prawdopodobieństwo i miara. Warszawa: Państwowe Wydawnictwo Naukowe, 1987.
  • Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: SCRIPT, 2004.
  • Andrzej Pacut: Prawdopodobieństwo. Teoria, modelowanie probabilistyczne w technice. Warszawa: Wydawnictwa Naukowo-Techniczne, 1985, s. 484, 485. ISBN 83-204-0524-6.
  • Jarosław Bartoszewicz: Wykłady ze statystyki matematycznej. Warszawa: Państwowe Wydawnictwo Naukowe, 1989, s. 12. ISBN 83-01-09054-5.
Kontrola autorytatywna (rodzaj funkcji matematycznej):
  • GND: 4192219-0
Encyklopedia internetowa:
  • PWN: 3895571
  • Catalana: 0227259
  • DSDE: fordelingsfunktion