Distribuição gama

Gama
Plotagem da função densidade de probabilidade de distribuições gama
Plotagem da função de distribuição acumulada de distribuições gama
Parâmetros k > 0 {\displaystyle k>0}
θ > 0 {\displaystyle \theta >0}
Suporte x ( 0 , ) {\displaystyle x\in (0,\infty )}
f.d.p. 1 Γ ( k ) θ k x k 1 e x θ {\displaystyle {\frac {1}{\Gamma (k)\theta ^{k}}}x^{k\,-\,1}e^{-{\frac {x}{\theta }}}}
f.d.a. 1 Γ ( k ) γ ( k , x θ ) {\displaystyle {\frac {1}{\Gamma (k)}}\gamma \left(k,\,{\frac {x}{\theta }}\right)}
Média E [ X ] = k θ {\displaystyle \mathbf {E} [X]=k\theta }
E [ ln X ] = ψ ( k ) + ln ( θ ) {\displaystyle \mathbf {E} [\ln X]=\psi (k)+\ln(\theta )}
(veja função digama)
Moda ( k 1 ) θ {\displaystyle (k-1)\theta } para k 1 {\displaystyle k\geq 1}
Variância Var [ X ] = k θ 2 {\displaystyle \operatorname {Var} [X]=k\theta ^{2}}
Var [ ln X ] = ψ 1 ( k ) {\displaystyle \operatorname {Var} [\ln X]=\psi _{1}(k)}
(veja função trigama)
Obliquidade 2 k {\displaystyle {\frac {2}{\sqrt {k}}}}
Curtose 6 k {\displaystyle {\frac {6}{k}}}
Entropia k + ln θ + ln [ Γ ( k ) ] + ( 1 k ) ψ ( k ) {\displaystyle {\begin{aligned}k&+\ln \theta +\ln[\Gamma (k)]\\&+(1-k)\psi (k)\end{aligned}}}
Função Geradora de Momentos ( 1 θ t ) k {\displaystyle (1-\theta t)^{-k}} para t < 1 θ {\displaystyle t<{\frac {1}{\theta }}}
Função Característica ( 1 θ i t ) k {\displaystyle (1-\theta it)^{-k}}

Em teoria das probabilidades e estatística, a distribuição gama é uma família de distribuições contínuas de probabilidade de dois parâmetros. Diversos tipos de distribuições são dependentes, ou são casos específicos da distribuição gama, como a distribuição exponencial e a distribuição qui-quadrado. A distribuição gama é usada para modelar valores de dados positivos que são assimétricos à direita e maiores que 0. Ela é comumente usada em estudos de sobrevivência de confiabilidade. 

Existem três diferentes parametrizações no uso comum:

  1. Com um parâmetro de forma k {\displaystyle k} e um parâmetro de escala θ {\displaystyle \theta } .
  2. Com um parâmetro de forma α = k {\displaystyle \alpha =k} e um parâmetro de escala inversa β = 1 θ {\displaystyle \beta ={\frac {1}{\theta }}} , chamado parâmetro de taxa.
  3. Com um parâmetro de forma k {\displaystyle k} e um parâmetro média μ = k β {\displaystyle \mu ={\frac {k}{\beta }}} .

Em cada uma dessas formas, ambos os parâmetros são números reais positivos.

ra a qual E [ X ] = k θ = α β {\displaystyle E[X]=k\theta ={\frac {\alpha }{\beta }}} é fixada e maior que zero, e E [ l n ( X ) ] = ψ ( k ) + l n ( θ ) = ψ ( α ) l n ( β ) {\displaystyle E[ln(X)]=\psi (k)+ln(\theta )=\psi (\alpha )-ln(\beta )} é fixado ( ψ {\displaystyle \psi } é a função digama).[1]

Dentro da distribuição gama uma importante propriedade é o fato de que à medida que θ {\displaystyle \theta } aumenta, essa distribuição se aproxima de uma Normal com média µ e variância θ {\displaystyle \theta } µ²= µ²/v

Por exemplo, a distribuição gama pode descrever o tempo de um componente elétrico de falhar. A maioria dos componentes elétricos de um determinado tipo falharão na mesma época, mas alguns vão demorar muito tempo para falhar.

Parametrização

A parametrização com k {\displaystyle k} e θ {\displaystyle \theta } parece ser mais comum em econometria e em outros campos de aplicação, onde por exemplo, a distribuição gama é frequentemente usada para modelar tempos de espera. A parametrização com α {\displaystyle \alpha } e β {\displaystyle \beta } é mais comum em estatística bayesiana, onde a distribuição gama é usada como uma distribuição conjugada a priori para vários tipos de parâmetros de escala inversa (também conhecido como parâmetros de taxa), assim como o λ {\displaystyle \lambda } de uma distribuição exponencial ou uma distribuição de Poisson[2].

Se k {\displaystyle k} é um inteiro positivo, então a distribuição representa uma distribuição Erlang, isto é, a soma de k {\displaystyle k} variáveis aleatórias exponencialmente distribuídas, cada uma das quais tem média θ {\displaystyle \theta }

Caracterização usando α {\displaystyle \alpha } e taxa β {\displaystyle \beta }

A distribuição gama pode ser parametrizadas em termos de um parâmetro de forma α = k {\displaystyle \alpha =k} e o parâmetro de escala inversa β = 1 θ {\displaystyle \beta ={\frac {1}{\theta }}} , chamado parâmetro de taxa. Uma variável aleatória X {\displaystyle X} que é distribuída sob gama com forma α {\displaystyle \alpha } e taxa β {\displaystyle \beta } é denotada

X Γ ( α , β ) Gama ( α , β ) {\displaystyle X\sim \Gamma (\alpha ,\beta )\equiv {\textrm {Gama}}(\alpha ,\beta )}

A função densidade de probabilidade correspondente na parametrização forma-taxa é

f ( x ; α , β ) = β α x α 1 e β x Γ ( α )  para  x > 0  e  α , β > 0 {\displaystyle f(x;\alpha ,\beta )={\frac {\beta ^{\alpha }x^{\alpha -1}e^{-\beta x}}{\Gamma (\alpha )}}\quad {\text{ para }}x>0{\text{ e }}\alpha ,\beta >0} ,

onde Γ ( α ) {\displaystyle {\Gamma (\alpha )}} é uma função gama completa. Para todos os inteiros positivos Γ ( α ) = ( α 1 ) ! {\displaystyle \Gamma (\alpha )=(\alpha -1)!}

A função de distribuição acumulada é a função gama regularizada:

F ( x ; α , β ) = 0 x f ( u ; α , β ) d u = γ ( α , β x ) Γ ( α ) {\displaystyle F(x;\alpha ,\beta )=\int _{0}^{x}f(u;\alpha ,\beta )\,du={\frac {\gamma (\alpha ,\beta x)}{\Gamma (\alpha )}}}

onde γ ( α , β x ) {\displaystyle \gamma (\alpha ,\beta x)} é a função gama incompleta inferior.

Se α {\displaystyle \alpha } é um inteiro positivo (isto é, a distribuição é uma Distribuição Erlang), a função de distribuição acumulada tem a seguinte expansão em séries:[3]

F ( x ; α , β ) = 1 i = 0 α 1 ( β x ) i i ! e β x = e β x i = α ( β x ) i i ! {\displaystyle F(x;\alpha ,\beta )=1-\sum _{i=0}^{\alpha -1}{\frac {(\beta x)^{i}}{i!}}e^{-\beta x}=e^{-\beta x}\sum _{i=\alpha }^{\infty }{\frac {(\beta x)^{i}}{i!}}}

Caracterização usando a forma k {\displaystyle k} e escala θ {\displaystyle \theta }

Uma variável aleatória X {\displaystyle X} que é distribuída sob gama com parâmetro de forma k {\displaystyle k} e escala θ {\displaystyle \theta } é denotada por

X Γ ( k , θ ) Gama ( k , θ ) {\displaystyle X\sim \Gamma (k,\theta )\equiv {\textrm {Gama}}(k,\theta )}
Ilustração de uma função densidade de probabilidade para valores de parâmetros k {\displaystyle k} e x {\displaystyle x} com θ {\displaystyle \theta } ajustado para 1, 2,3,4,5 e 6.

A função densidade de probabilidade usando a parametrização forma-escala é

f ( x ; k , θ ) = x k 1 e x θ θ k Γ ( k )  para  x > 0  e  k , θ > 0. {\displaystyle f(x;k,\theta )={\frac {x^{k-1}e^{-{\frac {x}{\theta }}}}{\theta ^{k}\Gamma (k)}}\quad {\text{ para }}x>0{\text{ e }}k,\theta >0.}

Aqui Γ ( k ) {\displaystyle \Gamma (k)} é a função gama avaliada em k {\displaystyle k} .

A função de distribuição acumulada é a função gama regularizada:

F ( x ; k , θ ) = 0 x f ( u ; k , θ ) d u = γ ( k , x θ ) Γ ( k ) {\displaystyle F(x;k,\theta )=\int _{0}^{x}f(u;k,\theta )\,du={\frac {\gamma \left(k,{\frac {x}{\theta }}\right)}{\Gamma (k)}}}

onde γ ( k , x θ ) {\displaystyle \gamma \left(k,{\frac {x}{\theta }}\right)} é a função gama incompleta inferior.

Também pode ser expressa como segue, se k {\displaystyle k} é um inteiro positivo (isto é, a distribuição é uma distribuição Erlang):[3]

F ( x ; k , θ ) = 1 i = 0 k 1 1 i ! ( x θ ) i e x / θ = e x / θ i = k 1 i ! ( x θ ) i {\displaystyle F(x;k,\theta )=1-\sum _{i=0}^{k-1}{\frac {1}{i!}}\left({\frac {x}{\theta }}\right)^{i}e^{-x/\theta }=e^{-x/\theta }\sum _{i=k}^{\infty }{\frac {1}{i!}}\left({\frac {x}{\theta }}\right)^{i}}
Aplicações
Este tipo de distribuição geralmente é aplicada quando se quer fazer algum tipo de analise ligada ao tempo de vida de algum tipo de produto. Por exemplo em um painel elétrico, os mesmo componentes elétricos tem a sua duração (vida útil) aproximadamente igual, ou seja vão durar o mesmo período de tempo, porem alguns podem durar muito mais.

Referências

  1. Park, Sung Y.; Bera, Anil K. (2009). «Maximum entropy autoregressive conditional heteroskedasticity model» (PDF). Elsevier. Journal of Econometrics: 219-230. doi:10.1016/j.jeconom.2008.12.014. Consultado em 29 de junho de 2017 
  2. Scalable Recommendation with Poisson Factorization, Prem Gopalan, Jake M. Hofman, David Blei, arXiv.org 2014
  3. a b Papoulis, Pillai, Probability, Random Variables, and Stochastic Processes, Fourth Edition
  • v
  • d
  • e
Estatística descritiva
Gráficos estatísticos
Inferência estatística
Estatística não-paramétrica
Análise de sobrevivência
  • Função de sobrevivência
  • Kaplan-Meier
  • Teste log-rank
  • Taxa de falha
  • Proportional hazards models
Amostragem
Distribuição de probabilidade
Correlação
Regressão
Análise multivariada
Séries temporais
  • Modelos para séries temporais
  • Tendência e sazonalidade
  • Modelos de suavização exponencial
  • ARIMA
  • Modelos sazonais
  • Portal de probabilidade e estatística
  • Portal da matemática