Beta-jakauma

Beta-jakauma
Tiheysfunktio
Beta-jakauman todennäköisyysfunktio
Kertymäfunktio
Beta-jakauman kertymäfunktio
Merkintä B e t a ( α , β ) {\displaystyle Beta(\alpha ,\beta )}
Parametrit α , β [ 0 , ) {\displaystyle \alpha ,\beta \in [0,\infty )}
Määrittelyjoukko x [ 0 , 1 ] {\displaystyle x\in [0,1]}
Tiheysfunktio 1 B ( α , β ) x α 1 ( 1 x ) β 1 {\displaystyle {\frac {1}{B(\alpha ,\beta )}}x^{\alpha -1}(1-x)^{\beta -1}}
Kertymäfunktio I x ( α , β ) ) {\displaystyle I_{x}(\alpha ,\beta ))}
Odotusarvo α α + β {\displaystyle {\frac {\alpha }{\alpha +\beta }}}
Moodi α 1 α + β 2 {\displaystyle {\frac {\alpha -1}{\alpha +\beta -2}}}
Varianssi α β ( α + β ) 2 ( α + β + 1 ) {\displaystyle {\frac {\alpha \beta }{(\alpha +\beta )^{2}(\alpha +\beta +1)}}}
Vinous 2 ( β α ) α + β + 1 ( α + β + 2 ) α β {\displaystyle {\frac {2(\beta -\alpha ){\sqrt {\alpha +\beta +1}}}{(\alpha +\beta +2){\sqrt {\alpha \beta }}}}}
Huipukkuus 6 [ α 3 + α 2 ( 1 2 β ) + β 2 ( β + 1 ) 2 α β ( β + 2 ) ] α β ( α + β + 2 ) ( α + β + 3 ) {\displaystyle {\frac {6[\alpha ^{3}+\alpha ^{2}(1-2\beta )+\beta ^{2}(\beta +1)-2\alpha \beta (\beta +2)]}{\alpha \beta (\alpha +\beta +2)(\alpha +\beta +3)}}}
Entropia ln B ( α , β ) ( α 1 ) ψ ( α ) ( β 1 ) ψ ( β ) + ( α + β 2 ) ψ ( α + β ) {\displaystyle {\begin{matrix}\ln \mathrm {B} (\alpha ,\beta )-(\alpha -1)\psi (\alpha )-(\beta -1)\psi (\beta )\\[0.5em]+(\alpha +\beta -2)\psi (\alpha +\beta )\end{matrix}}}
Momentit generoiva funktio 1 + k = 1 ( r = 0 k 1 α + r α + β + r ) t k k ! {\displaystyle 1+\sum _{k=1}^{\infty }\left(\prod _{r=0}^{k-1}{\frac {\alpha +r}{\alpha +\beta +r}}\right){\frac {t^{k}}{k!}}}
Karakteristinen funktio 1 F 1 ( α ; α + β ; i t ) {\displaystyle {}_{1}F_{1}(\alpha ;\alpha +\beta ;i\,t)\!} (katso hypergeometrinen funktio)
Fisherin informaatiomatriisi var [ ln X ] cov [ ln X , ln ( 1 X ) ] cov [ ln X , ln ( 1 X ) ] var [ ln ( 1 X ) ] {\displaystyle {\begin{matrix}\\\operatorname {var} [\ln X]&\operatorname {cov} [\ln X,\ln(1-X)]\\\operatorname {cov} [\ln X,\ln(1-X)]&\operatorname {var} [\ln(1-X)]\end{matrix}}}

Beta-jakauma[1] eli β {\displaystyle \beta -} jakauma[2] on todennäköisyyslaskennassa ja tilastotieteessä jatkuvan satunnaismuuttujan todennäköisyysjakauma, jota käytetään bayesilaisessa todennäköisyyslaskennassa. Koska Beta-jakaumaa voi parametrisoida monella eri tavalla, sitä voidaan kutsua jakaumaperheeksi. Sen avulla voidaan esittää lähes kaikki äärelliselle välille konsentroituneet jakaumat.[1][2]

Jos satunnaismuuttuja X {\displaystyle X} on Beta-jakautunut parametreillä α {\displaystyle \alpha } ja β {\displaystyle \beta } , merkitään se yleensä

X B e t a ( α , β ) {\displaystyle X\sim Beta(\alpha ,\beta )} [1] B e ( α , β ) {\displaystyle \sim Be(\alpha ,\beta )} β α , β . {\displaystyle \sim \beta _{\alpha ,\beta }.}

Todennäköisyysjakauma

Satunnaismuuttujalla X {\displaystyle X} , joka on Beta-jakautunut ja jolla perusjoukko on Ω = {\displaystyle \Omega =} [0,1], on kaksi positiivista parametria α {\displaystyle \alpha } ja β {\displaystyle \beta } . Niiden avulla Beta-jakauman tiheysfunktio määritellään

f X ( x ) = 1 B ( α , β ) x α 1 ( 1 x ) β 1 , {\displaystyle f_{X}(x)={\frac {1}{B(\alpha ,\beta )}}x^{\alpha -1}(1-x)^{\beta -1},} [1]

missä niin sanottu beta-funktio on

B ( α , β ) = 0 1 t α 1 ( 1 t ) β 1 d t = Γ ( α ) Γ ( β ) Γ ( α + β ) , {\displaystyle B(\alpha ,\beta )=\int _{0}^{1}t^{\alpha -1}(1-t)^{\beta -1}dt={\frac {\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}},} [1]

jossa Γ ( t ) {\displaystyle \Gamma (t)} taas on gammafunktio. Beta-funktion tarkoituksena on "normalisoida" beta-jakauma niin, että sen tiheysfunktion määrätty integraali koko reaalialueen yli on tasan yksi.[3]

Toisinaan joskus parametrien arvoista vähennetään yksi ( α = α 1 {\displaystyle \scriptstyle \alpha '=\alpha -1} ja β = β 1 {\displaystyle \scriptstyle \beta '=\beta -1} ), jotta tiheysfunktion ja momenttifunktion kaavat yksinkertaistuisivat hieman.[4]

Beta-jakauman tiheysfunktiolla on seuraavanlaisia ominaisuuksia:[1]

  • f X ( x ) > 0 {\displaystyle f_{X}(x)>0} kaikilla x [ 0 , 1 ] {\displaystyle x\in [0,1]}
  • Jos α > 1 {\displaystyle \alpha >1} ja β = 1 {\displaystyle \beta =1} , niin f X ( x ) {\displaystyle f_{X}(x)} on aidosti kasvava ja sen maksimikohta on välin päätepisteessä x = 1. {\displaystyle x=1.}
  • Jos α = 1 {\displaystyle \alpha =1} ja β > 1 {\displaystyle \beta >1} , niin f X ( x ) {\displaystyle f_{X}(x)} on aidosti vähenevä ja sen maksimikohta on välin päätepisteessä x = 0. {\displaystyle x=0.}
  • Jos α > 1 {\displaystyle \alpha >1} ja β > 1 {\displaystyle \beta >1} , niin f X ( x ) {\displaystyle f_{X}(x)} on yksihuippuinen ja sen maksimikohta on välin sisäpisteessä x = α 1 α + β 2 . {\displaystyle x={\frac {\alpha -1}{\alpha +\beta -2}}.}
  • Jos α < 1 {\displaystyle \alpha <1} ja β < 1 {\displaystyle \beta <1} , niin f X ( x ) {\displaystyle f_{X}(x)} on U:n muotoinen ja sillä on lokaalit maksimikohdat on välin päätepisteissä x = 0 {\displaystyle x=0} ja x = 1. {\displaystyle x=1.}
  • f X ( x ) {\displaystyle f_{X}(x)} on symmetrinen, jos α = β . {\displaystyle \alpha =\beta .}

Beta-jakauman kertymäfunktion lauseketta ei ole mahdollista kirjoittaa eksplisiittiseen muotoon, koska sen tiheysfunktion integraalifunktiota ei voi kirjoittaa lausekkeeksi alkeisfunktioiden avulla. Ne onkin tapana esittää vain numeerisessa muodossa aivan kuten toimitaan normaalijakaumassakin.[1]

Tunnusluvut ja momentit

Momenttifunktio

Momenttifunktio eli momentit generoiva funktio saadaan määritelmästä

M ( t ) = E ( e t X ) = 1 B ( α , β ) 0 1 e t x x α 1 ( 1 x ) β 1 d x . {\displaystyle M(t)=E(e^{tX})={\frac {1}{B(\alpha ,\beta )}}\int _{0}^{1}e^{tx}x^{\alpha -1}(1-x)^{\beta -1}\,dx.}

Sen avulla voidaan määritellä origomomentit ja keskusmomentit. Origomomenttien yleinen muoto on

μ n = E ( X n ) = Γ ( α + β ) Γ ( α + n ) Γ ( α + β + n ) Γ ( α ) , {\displaystyle \mu _{n}=E(X^{n})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +n)}{\Gamma (\alpha +\beta +n)\Gamma (\alpha )}},} [4]

ja koska gammafunktiolla on Γ ( α + 1 ) = α Γ ( α ) {\displaystyle \Gamma (\alpha +1)=\alpha \Gamma (\alpha )} , siitä saadaan ensimmäiset momentit

E ( X ) = E ( X 1 ) = Γ ( α + β ) Γ ( α + 1 ) Γ ( α + β + 1 ) Γ ( α ) = Γ ( α + β ) α Γ ( α ) ( α + β ) Γ ( α + β ) Γ ( α ) = α α + β {\displaystyle E(X)=E(X^{1})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +1)}{\Gamma (\alpha +\beta +1)\Gamma (\alpha )}}={\frac {\Gamma (\alpha +\beta )\alpha \Gamma (\alpha )}{(\alpha +\beta )\Gamma (\alpha +\beta )\Gamma (\alpha )}}={\frac {\alpha }{\alpha +\beta }}}

ja

E ( X 2 ) = Γ ( α + β ) Γ ( α + 2 ) Γ ( α + β + 2 ) Γ ( α ) = Γ ( α + β ) ( α + 1 ) α Γ ( α ) ( α + β + 1 ) ( α + β ) Γ ( α + β ) Γ ( α ) = α ( α + 1 ) ( α + β ) ( α + β + 1 ) . {\displaystyle E(X^{2})={\frac {\Gamma (\alpha +\beta )\Gamma (\alpha +2)}{\Gamma (\alpha +\beta +2)\Gamma (\alpha )}}={\frac {\Gamma (\alpha +\beta )(\alpha +1)\alpha \Gamma (\alpha )}{(\alpha +\beta +1)(\alpha +\beta )\Gamma (\alpha +\beta )\Gamma (\alpha )}}={\frac {\alpha (\alpha +1)}{(\alpha +\beta )(\alpha +\beta +1)}}.}

Keskusmomenttien yleinen muoto on

μ n = E ( ( X μ ) n ) = ( α α + β ) n 2 F 1 ( α , n ; α + β ; α + β α ) , {\displaystyle \mu '_{n}=E((X-\mu )^{n})=\left(-{\frac {\alpha }{\alpha +\beta }}\right)^{n}\cdot {}_{2}F_{1}\left(\alpha ,-n;\alpha +\beta ;{\frac {\alpha +\beta }{\alpha }}\right),}

missä 2 F 1 {\displaystyle {}_{2}\!F_{1}} on hypergeometrinen funktio.[4]

Ensimmäinen origomomentti voidaan laskea myös suoraan

μ = E ( X ) = 0 1 x f X ( x ) d x = 0 1 x 1 B ( α , β ) x α 1 ( 1 x ) β 1 d x {\displaystyle \mu =E(X)=\int _{0}^{1}xf_{X}(x)\,dx=\int _{0}^{1}x{\frac {1}{B(\alpha ,\beta )}}x^{\alpha -1}(1-x)^{\beta -1}\,dx}
= 1 B ( α , β ) 0 1 x α ( 1 x ) β 1 d x = 1 B ( α , β ) B ( α + 1 , β ) {\displaystyle ={\frac {1}{B(\alpha ,\beta )}}\int _{0}^{1}x^{\alpha }(1-x)^{\beta -1}\,dx={\frac {1}{B(\alpha ,\beta )}}B(\alpha +1,\beta )}
= Γ ( α + 1 ) Γ ( β ) Γ ( α + β + 1 ) Γ ( α + β ) Γ ( α ) Γ ( β ) = α Γ ( α ) Γ ( β ) ( α + β ) Γ ( α + β ) Γ ( α + β ) Γ ( α ) Γ ( β ) = α α + β . {\displaystyle ={\frac {\Gamma (\alpha +1)\Gamma (\beta )}{\Gamma (\alpha +\beta +1)}}\cdot {\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}={\frac {\alpha \Gamma (\alpha )\Gamma (\beta )}{(\alpha +\beta )\Gamma (\alpha +\beta )}}\cdot {\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}={\frac {\alpha }{\alpha +\beta }}.} [1]

Tunnuslukuja

Jakauman odotusarvo saadaan ensimmäisestä origomomentista

μ = E ( X ) = α α + β . {\displaystyle \mu =\operatorname {E} (X)={\frac {\alpha }{\alpha +\beta }}.} [4]

Sen varianssi on taas suoraan toinen keskusmomentti

μ 2 = Var ( X ) = σ 2 = α β ( α + β ) 2 ( α + β + 1 ) . {\displaystyle \mu '_{2}=\operatorname {Var} (X)=\sigma ^{2}={\frac {\alpha \beta }{(\alpha +\beta )^{2}(\alpha +\beta +1)}}.} [3][4]

Jakauman tiheysfunktion vinous määritetään kahden keskumomentin avulla

g 1 = μ 3 μ 2 3 / 2 = 2 ( β α ) α + β + 1 ( α + β + 2 ) α β . {\displaystyle g_{1}={\frac {\mu '_{3}}{{\mu '}_{2}^{3/2}}}={\frac {2(\beta -\alpha ){\sqrt {\alpha +\beta +1}}}{(\alpha +\beta +2){\sqrt {\alpha \beta }}}}.} [3][5][4]

Vinous on nolla, mikä näkyy tasajakauman tiheysfunktion kuvaajasta, joka on täysin symmetrinen.

Jakauman huipukkuus määritetään kahden keskusmomentin avulla

γ 2 = μ 4 μ 2 2 3 = 6 [ α 3 + α 2 ( 1 2 β ) + β 2 ( β + 1 ) 2 α β ( β + 2 ) ] α β ( α + β + 2 ) ( α + β + 3 ) . {\displaystyle \gamma _{2}={\frac {{\mu '}_{4}}{{\mu '}_{2}^{2}}}-3={\frac {6[\alpha ^{3}+\alpha ^{2}(1-2\beta )+\beta ^{2}(\beta +1)-2\alpha \beta (\beta +2)]}{\alpha \beta (\alpha +\beta +2)(\alpha +\beta +3)}}.} [3][6][4]

Negativinen huipukkuus näkyy tiheysfunktion kuvaajassa siten, että kuvaaja on "tasa- ja litteäpäinen" eikä terävää kärkeä esiinny ollenkaan.

Jakauman moodi sijaitsee välin [0,1] sisäpisteessä, kun α > 1 {\displaystyle \alpha >1} ja β > 1 {\displaystyle \beta >1}

M o = α 1 α + β 2 . {\displaystyle Mo={\frac {\alpha -1}{\alpha +\beta -2}}.}

Jos α < 1 {\displaystyle \alpha <1} tai β < 1 {\displaystyle \beta <1} voi moodi sijaita välin päätepisteessä. Kun α = β = 1 {\displaystyle \alpha =\beta =1} on jakauma tasajakauma ja kaikki pisteet ovat moodi.[3]

Esimerkkejä

Tarkastellaan toistokoetta, jonka yksittäisen kolikonheiton arvoksi voi tulla vain "kruuna" tai "klaava" todennäköisyyksillä p {\displaystyle p} ja 1 p {\displaystyle 1-p} . Heittojen kokonaismäärän ollessa n = 100 {\displaystyle n=100} , noudattaa saatujen kruunujen yhteismäärät X {\displaystyle X} binomijakaumaa X B i n ( 100 , p ) {\displaystyle X\sim Bin(100,p)} . Jos halutaan selvittää "kruunan" todennäköisyyttä p {\displaystyle p} , kun saadaan k = 60 {\displaystyle k=60} "kruunaa", on se Beta-jakautunut p B e t a ( 61 , 41 ) {\displaystyle p\sim Beta(61,41)} .[7]

Edellinen ongelma on perinteisesti ratkaistu käyttäen normaalijakaumaa, mutta Beta-jakauma antaa silloin oikean tuloksen, kun se määritellään

p B e t a ( k + 1 , n k + 1 ) . {\displaystyle p\sim Beta(k+1,n-k+1).}

Normaalijakauma antaa harhaisen tuloksen, mikäli toistojen lukumäärä n {\displaystyle n} on pieni ja suhde k / n {\displaystyle k/n} on lähellä arvoa 0 tai 1.[7]

Beta-jakaumaa tulisi käyttää normaalijakauman sijasta approksimoitaessa binomijakaumaa epäsymmetrisissä tiheysjakauman tilanteissa. Esimerkiksi epäsymmetrisessä ja kahta arvoa antavassa satunnaistapauhtumassa kannattaa käyttää diskreetin binomijakauman approksimoimiseksi jatkuvaa Beetta-jakaumaa. Yleensä binomijakaumaa approksimoidaan normaalijakaumalla, mutta se ei toimi kunnolla, kun toista arvoa esiintyy tuntuvasti enemmän kuin toista.[7]

Beta-jakaumaa voidaan käyttää arvioitaessa tasajakaumien U i U ( 0 , 1 ) {\displaystyle U_{i}\sim U(0,1)} arvoja. Arvotaan n satunnaismuuttujalle U i {\displaystyle U_{i}} arvot U 1 , {\displaystyle U_{1},} U 2 {\displaystyle U_{2}} , . . . , {\displaystyle ,...,} U n {\displaystyle U_{n}} . Arvot lajitellaan suuruusjärjestykseen, jolloin arvo merkitään uudella tavalla U ( i ) , {\displaystyle U_{(i)},} kun se on järjestyksessä i:nnes. (eli U ( 1 ) {\displaystyle U_{(1)}} < U ( 2 ) {\displaystyle U_{(2)}} < ... < U ( n ) {\displaystyle U_{(n)}} ). Silloin arvo U ( k ) B e t a ( k , n + 1 k ) {\displaystyle U_{(k)}\sim Beta(k,n+1-k)} kun k = 1 , 2 , . . . , n {\displaystyle k=1,2,...,n} .[8]

Muut jakaumat

Beta-jakaumasta saadaan tasajakauma, mikäli parametrit ovat molemmat yksi

X B e t a ( 1 , 1 ) U ( 0 , 1 ) . {\displaystyle X\sim Beta(1,1)\sim U(0,1).} [2]

Lähteet

  1. a b c d e f g h Mellin, Ilkka: Todennäköisyysjakaumat, s. 407−410, luentomonisteesta Todennäköisyyslaskenta, Aalto-yliopisto, 2006
  2. a b c Rahiala, Markku: Satunnaismallien teoria (Arkistoitu – Internet Archive), s. 21−22, Oulun yliopisto, 2002
  3. a b c d e Johnson, Paul & Beverlin, Matt: Beta Distribution, 2013
  4. a b c d e f g Weisstein, Eric W.: Beta Distribution (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. Weisstein, Eric W.: Skewness (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  6. Weisstein, Eric W.: Kurtosis (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  7. a b c Stich, Slater: Use the Beta Distribution
  8. Laurent, Stéphane: The Beta distribution also appears as an order statistic...

Aiheesta muualla

Commons
Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Beta-jakauma.
  • https://noppa.aalto.fi/noppa/kurssi/mat-1.3621/luennot/Mat-1_3621_todennakoisyyslaskennan_kertausta_.pdf[vanhentunut linkki]
  • http://doingbayesiandataanalysis.blogspot.fi/2012/06/beta-distribution-parameterized-by-mode.html
  • http://users.iems.northwestern.edu/~ajit/beta.pdf
  • http://www.epixanalytics.com/modelassist/CrystalBall/Model_Assist.htm#Distributions/Continuous_distributions/Beta.htm (Arkistoitu – Internet Archive)
Diskreettejä jakaumia
Jatkuvia jakaumia
Moniulotteisia jakaumia
  • Dirichlet-jakauma
  • Moniulotteinen Studentin t-jakauma
  • Multinomijakauma
  • Multinormaalijakauma