Processo empírico

Em teoria das probabilidades, um processo empírico é um processo estocástico que descreve a proporção de objetos em um sistema em um dado estado. Para um processo em um espaço de estados discreto, uma cadeia de Markov populacional de tempo contínuo[1][2] ou modelo populacional de Markov[3] é um processo que conta o número de objetos em um dado estado (sem reescalonamento). Na teoria de campo médio, teoremas do limite (conforme o número de objetos se torna grande) são considerados e generalizam o teorema central do limite para medidas empíricas.[4] Aplicações da teoria dos processos empíricos surgem na estatística não paramétrica.[5]

Definição

Para variáveis aleatórias independentes e identicamente distribuídas X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\cdots ,X_{n}} em R {\displaystyle \mathbb {R} } com função distribuição acumulada comum F ( x ) {\displaystyle F(x)} , a função distribuição empírica é definida por:

F n ( x ) = 1 n i = 1 n I ( , x ] ( X i ) , {\displaystyle F_{n}(x)={\frac {1}{n}}\sum _{i=1}^{n}I_{(-\infty ,x]}(X_{i}),}

em que I C {\displaystyle I_{C}} é a função indicadora do conjunto C {\displaystyle C} .[6]

Para todo x {\displaystyle x} fixo, F n ( x ) {\displaystyle F_{n}(x)} é uma sequência de variáveis aleatórias que converge a F ( x ) {\displaystyle F(x)} quase certamente pela lei forte dos grandes números, isto é, F n {\displaystyle F_{n}} converge pontualmente a F {\displaystyle F} . O matemático ucraniano Valery Glivenko e o matemático italiano Francesco Paolo Cantelli fortaleceram este resultado ao provar a convergência uniforme de F n {\displaystyle F_{n}} a F {\displaystyle F} pelo teorema de Glivenko–Cantelli.[7]

Uma versão centralizada e escalonada da medida empírica é a medida sinalizada:

G n ( A ) = n ( P n ( A ) P ( A ) ) . {\displaystyle G_{n}(A)={\sqrt {n}}(P_{n}(A)-P(A)).}

Isto induz um mapa sobre as funções mensuráveis f {\displaystyle f} dado por:

f G n f = n ( P n P ) f = n ( 1 n i = 1 n f ( X i ) E f ) . {\displaystyle f\mapsto G_{n}f={\sqrt {n}}(P_{n}-P)f={\sqrt {n}}\left({\frac {1}{n}}\sum _{i=1}^{n}f(X_{i})-\mathbb {E} f\right).}

Pelo teorema central do limite, G n ( A ) {\displaystyle G_{n}(A)} converge em distribuição a uma variável aleatória normal N ( 0 , P ( A ) ( 1 P ( A ) ) ) {\displaystyle N(0,P(A)(1-P(A)))} para um conjunto mensurável fixo A {\displaystyle A} .[8] De forma semelhante, para uma função fixa f {\displaystyle f} , G n f {\displaystyle G_{n}f} converge em distribuição a uma variável aleatória normal N ( 0 , E ( f E f ) 2 ) {\displaystyle N(0,\mathbb {E} (f-\mathbb {E} f)^{2})} , desde que E f {\displaystyle \mathbb {E} f} e E f 2 {\displaystyle \mathbb {E} f^{2}} .[9]

( G n ( c ) ) c C {\displaystyle {\bigl (}G_{n}(c){\bigr )}_{c\in {\mathcal {C}}}} é um processo empírico indexado por C {\displaystyle {\mathcal {C}}} , uma coleção de subconjuntos mensuráveis de S {\displaystyle S} .[10]

( G n f ) f F {\displaystyle {\bigl (}G_{n}f{\bigr )}_{f\in {\mathcal {F}}}} é um processo empírico indexado por F {\displaystyle {\mathcal {F}}} , uma coleção de funções mensuráveis de S {\displaystyle S} a R {\displaystyle \mathbb {R} } .[11]

Um resultado significante na área dos processos empíricos é o teorema de Donsker. Isto levou a um estudo das classes de Donsker: conjuntos de funções com a útil propriedade de processo empíricos indexados por estas classes que convergem fracamente a um certo processo gaussiano.[12] Ainda que se possa mostrar que classes de Donsker são classes de Glivenko–Cantelli, o contrário não é verdadeiro em geral.

Exemplo

Como um exemplo, considere funções distribuição empírica. Para variáveis aleatórias independentes e identicamente distribuídas de valores reais X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\cdots ,X_{n}} , elas são dadas por:

F n ( x ) = P n ( ( , x ] ) = P n I ( , x ] . {\displaystyle F_{n}(x)=P_{n}((-\infty ,x])=P_{n}I_{(-\infty ,x]}.}

Neste caso, processos empíricos são indexados por uma classe C = { ( , x ] : x R } . {\displaystyle {\mathcal {C}}=\{(-\infty ,x]:x\in \mathbb {R} \}.} . Mostrou-se que C {\displaystyle {\mathcal {C}}} é uma classe de Donsker em particular.[13]

n ( F n ( x ) F ( x ) ) {\displaystyle {\sqrt {n}}(F_{n}(x)-F(x))} converge fracamente em ( R ) {\displaystyle \ell ^{\infty }(\mathbb {R} )} a uma ponte browniana B ( F ( x ) ) {\displaystyle B(F(x))} .

Referências

  1. Bortolussi, Luca; Hillston, Jane; Latella, Diego; Massink, Mieke. «Continuous approximation of collective system behaviour: A tutorial». Performance Evaluation. 70 (5): 317–349. doi:10.1016/j.peva.2013.01.001 
  2. Stefanek, Anton; Hayden, Richard A.; Gonagle, Mark Mac; Bradley, Jeremy T. (4 de junho de 2012). «Mean-Field Analysis of Markov Models with Reward Feedback». Springer, Berlin, Heidelberg. Analytical and Stochastic Modeling Techniques and Applications. Lecture Notes in Computer Science (em inglês): 193–211. ISBN 9783642307812. doi:10.1007/978-3-642-30782-9_14 
  3. Dayar, Tuǧrul; Hermanns, Holger; Spieler, David; Wolf, Verena (1 de novembro de 2011). «Bounding the equilibrium distribution of Markov population models». Numerical Linear Algebra with Applications (em inglês). 18 (6): 931–946. ISSN 1099-1506. doi:10.1002/nla.795 
  4. Dudley, R. M. (1978). «Central Limit Theorems for Empirical Measures». The Annals of Probability (em inglês). 6 (6): 899–929. ISSN 0091-1798. doi:10.1214/aop/1176995384 
  5. Mojirsheibani, Majid. «Nonparametric curve estimation with missing data: A general empirical process approach». Journal of Statistical Planning and Inference. 137 (9): 2733–2758. doi:10.1016/j.jspi.2006.02.016 
  6. Billingsley, Patrick (20 de janeiro de 2012). Probability and Measure (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118341919 
  7. Wolfowitz, J. (1954). «Generalization of the Theorem of Glivenko-Cantelli». The Annals of Mathematical Statistics (em inglês). 25 (1): 131–138. ISSN 0003-4851. doi:10.1214/aoms/1177728852 
  8. Dudley, R. M. (28 de julho de 1999). Uniform Central Limit Theorems (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521461023 
  9. Dzhaparidze, K. O.; Nikulin, M. S. (1 de outubro de 1982). «Probability distributions of the Kolmogorov and omega-square statistics for continuous distributions with shift and scale parameters». Journal of Soviet Mathematics (em inglês). 20 (3): 2147–2164. ISSN 0090-4104. doi:10.1007/BF01239992 
  10. R., Kosorok, Michael (2008). Introduction to empirical processes and semiparametric inference. New York, N.Y.: Springer. ISBN 9780387749785. OCLC 233972325 
  11. Shorack, G.; Wellner, J. (1 de janeiro de 2009). Empirical Processes with Applications to Statistics. Col: Classics in Applied Mathematics. [S.l.]: Society for Industrial and Applied Mathematics. ISBN 9780898716849. doi:10.1137/1.9780898719017 
  12. vaart, Aad van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452 
  13. Donsker, Monroe D. (1952). «Justification and Extension of Doob's Heuristic Approach to the Kolmogorov- Smirnov Theorems». The Annals of Mathematical Statistics (em inglês). 23 (2): 277–281. ISSN 0003-4851. doi:10.1214/aoms/1177729445 
  • v
  • d
  • e
Tempo discreto
Tempo contínuo
Ambos
Campos e outros
Modelos de série temporal
Modelos financeiros
  • Black–Derman–Toy
  • Black–Karasinski
  • Chen
  • Cox–Ingersoll–Ross (CIR)
  • Garman–Kohlhagen
  • Heath–Jarrow–Morton (HJM)
  • Heston
  • Ho–Lee
  • Hull–White
  • LIBOR market
  • Rendleman–Bartter
  • SABR volatility
  • Vašíček
  • Wilkie
Modelos atuariais
  • Bühlmann
  • Cramér–Lundberg
  • Sparre–Anderson
Modelos de filas
Propriedades
Teoremas limites
Desigualdades
Ferramentas
Disciplinas
  • Categoria:Processos estocásticos