Intervallo di previsione

Niente fonti!
Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.

In statistica, un intervallo di previsione si rapporta ad una osservazione futura allo stesso modo in cui un intervallo di confidenza si rapporta ad un parametro inosservabile della popolazione. Gli intervalli di predizione predicono la distribuzione di punti individuali, mentre gli intervalli di confidenza stimano la vera media della popolazione o altre qualità di interesse che non possono essere osservate.

Esempio

Supponiamo di aver estratto un campione da una popolazione distribuita normalmente. La media e la deviazione standard della popolazione sono conosciute solo in quanto possono essere stimate basandosi sul campione.

Sia X1, ..., Xn, il campione e quindi sia n la sua numerosità; siano inoltre μ e σ rispettivamente la media e la deviazione standard della popolazione impossibili da osservare. Si desideri predire la successiva grandezza osservabile che denotiamo con Xn+1. Introduciamo le grandezze

X ¯ n := ( X 1 + + X n ) n {\displaystyle {\overline {X}}_{n}:={\frac {(X_{1}+\cdots +X_{n})}{n}}}

e

S n 2 := 1 n 1 i = 1 n ( X i X ¯ n ) 2   . {\displaystyle S_{n}^{2}:={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}~.}

È facile mostrare che la grandezza

X n + 1 X ¯ n S n 2 + S n 2 n = X n + 1 X ¯ n S n 1 + 1 n {\displaystyle {X_{n+1}-{\overline {X}}_{n} \over {\sqrt {S_{n}^{2}+{\frac {S_{n}^{2}}{n}}}}}={X_{n+1}-{\overline {X}}_{n} \over S_{n}{\sqrt {1+{\frac {1}{n}}}}}}

possiede una distribuzione t di Student con n − 1 gradi di libertà. Conseguentemente abbiamo:

Pr ( X ¯ n T a S n 1 + 1 n X n + 1 X ¯ n + T a S n 1 + 1 n ) = p {\displaystyle \Pr \left({\overline {X}}_{n}-T_{a}S_{n}{\sqrt {1+{\frac {1}{n}}}}\leq X_{n+1}\leq {\overline {X}}_{n}+T_{a}S_{n}{\sqrt {1+{\frac {1}{n}}}}\,\right)=p}

dove Ta è il 100 ( 1 + p 2 ) {\displaystyle 100({\frac {1+p}{2}})} -esimo percentile della variabile casuale t di Student con n − 1 gradi di libertà. Dunque i numeri

X ¯ n ± T a S n 1 + 1 n {\displaystyle {\overline {X}}_{n}\pm T_{a}{S}_{n}{\sqrt {1+{\frac {1}{n}}}}}

sono gli estremi di un intervallo di previsione al (100 · p)% per l'osservazione Xn+1

Voci correlate

  • Intervallo di confidenza
  • Estrapolazione
  • Previsione
  • Analisi della regressione
  • Seymour Geisser
  • Stima della tendenza

Bibliografia

  • Chatfield, C. (1993) "Calculating Interval Forecasts," Journal of Business and Economic Statistics, 11 121-135.
  • Meade, N.; T. Islam (1995) "Prediction Intervals for Growth Curve Forecasts," Journal of Forecasting, 14 413-430.
  Portale Economia
  Portale Matematica