Axiomes des probabilités

En théorie des probabilités, les axiomes de probabilités, également appelés axiomes de Kolmogorov du nom d'Andreï Nikolaievitch Kolmogorov qui les a développés, désignent les propriétés que doit vérifier une application P {\displaystyle \mathbb {P} } afin de formaliser l'idée de probabilité.

Ces propriétés peuvent être résumées ainsi : si P {\displaystyle \mathbb {P} } est une mesure sur un espace mesurable ( Ω , A ) {\displaystyle \left(\Omega ,{\mathcal {A}}\right)} , alors ( Ω , A , P ) {\displaystyle \left(\Omega ,{\mathcal {A}},\mathbb {P} \right)} doit être un espace de probabilité.

Le théorème de Cox fournit une autre approche pour formaliser les probabilités, privilégiée par certains bayésiens.

Dans ce qui suit, on considère un ensemble non vide Ω {\displaystyle \Omega } muni d'une tribu A {\displaystyle {\mathcal {A}}} .

Premier axiome

On appelle évènements les éléments de A {\displaystyle {\mathcal {A}}} .

Pour tout événement   A {\displaystyle \ A}  :

0 P ( A ) 1. {\displaystyle 0\leq \mathbb {P} (A)\leq 1.}

C'est-à-dire que la probabilité d'un événement est représentée par un nombre réel compris entre 0 et 1.

Deuxième axiome

  Ω {\displaystyle \ \Omega } désignant l'univers associé à l'expérience aléatoire considérée,

P ( Ω ) = 1 {\displaystyle \mathbb {P} (\Omega )=1} ,

C'est-à-dire que la probabilité de l'événement certain, ou d'obtenir un quelconque résultat de l'univers, est égale à 1. Autrement dit, la probabilité de réaliser l'un ou l'autre des événements élémentaires est égale à 1.

Troisième axiome

Toute famille dénombrable d'événements deux à deux disjoints (on dit aussi : deux à deux incompatibles), A 1 , A 2 , {\displaystyle A_{1},\,A_{2},\dots } satisfait :

P ( A 1 A 2 ) = i = 1 + P ( A i ) {\displaystyle \mathbb {P} (A_{1}\cup A_{2}\cup \cdots )=\sum _{i=1}^{+\infty }\mathbb {P} (A_{i})} .

C'est-à-dire que la probabilité d'un événement qui est la réunion (dénombrable) disjointe d'événements est égale à la somme des probabilités de ces événements. Ceci s'appelle la σ-additivité, ou additivité dénombrable (si les événements ne sont pas deux à deux disjoints, cette relation n'est plus vraie en général).

Conséquences

À partir des axiomes, se démontrent un certain nombre de propriétés utiles pour le calcul des probabilités, par exemple :

  • P ( ) = 0. {\displaystyle \mathbb {P} (\emptyset )=0.}
Démonstration

Utilisons le 3e axiome avec A k =   {\displaystyle A_{k}=\emptyset \ } pour tout k .   {\displaystyle k.\ } On obtient

P ( ) = k 1 P ( ) , {\displaystyle \mathbb {P} (\emptyset )=\sum _{k\geq 1}\mathbb {P} (\emptyset ),}

relation qui n'est pas satisfaite si P ( ) ] 0 , 1 ] ,   {\displaystyle \mathbb {P} (\emptyset )\in ]0,1],\ } puisqu'alors le terme de droite vaut + .   {\displaystyle +\infty .\ } Donc il ne reste que P ( ) = 0 ,   {\displaystyle \mathbb {P} (\emptyset )=0,\ } qui d'ailleurs convient.

Remarque : en particulier, cela interdit à l'univers d'être vide, le deuxième axiome exigeant que sa mesure vaille 1 (et ne soit donc pas nulle a fortiori).

  • Si A {\displaystyle A} , B {\displaystyle B} sont deux événements incompatibles (ou disjoints), alors
P ( A B ) = P ( A ) + P ( B ) . {\displaystyle \mathbb {P} (A\cup B)=\mathbb {P} (A)+\mathbb {P} (B).}
  • Plus généralement, si ( A k ) 1 k n {\displaystyle (A_{k})_{1\leq k\leq n}} est une famille d'événements 2 à 2 incompatibles, alors
P ( 1 k n A k ) = 1 k n P ( A k ) . {\displaystyle \mathbb {P} \left(\bigcup _{1\leq k\leq n}A_{k}\right)=\sum _{1\leq k\leq n}\mathbb {P} (A_{k}).}
Démonstration

Utilisons le 3e axiome avec A k =   {\displaystyle A_{k}=\emptyset \ } pour tout k n + 1.   {\displaystyle k\geq n+1.\ } On obtient bien une suite d'événements incompatibles 2 à 2 tels que

1 k n A k = k 1 A k , {\displaystyle \bigcup _{1\leq k\leq n}A_{k}=\bigcup _{k\geq 1}A_{k},}

donc

P ( 1 k n A k ) = P ( k 1 A k ) , {\displaystyle \mathbb {P} \left(\bigcup _{1\leq k\leq n}A_{k}\right)=\mathbb {P} \left(\bigcup _{k\geq 1}A_{k}\right),}

mais en vertu du troisième axiome

P ( k 1 A k ) = k 1 P ( A k ) {\displaystyle \mathbb {P} \left(\bigcup _{k\geq 1}A_{k}\right)=\sum _{k\geq 1}\mathbb {P} \left(A_{k}\right)}

et finalement, puisque pour tout k n + 1 ,   {\displaystyle k\geq n+1,\ } P ( A k ) = P ( ) = 0 ,   {\displaystyle \mathbb {P} \left(A_{k}\right)=\mathbb {P} \left(\emptyset \right)=0,\ } on obtient le résultat désiré.

  • P ( B A ) = P ( B ) P ( A B ) {\displaystyle \mathbb {P} (B\setminus A)=\mathbb {P} (B)-\mathbb {P} (A\cap B)} ;

Cette relation signifie que la probabilité que B se réalise, mais pas A, est égale à la différence P ( B ) P ( A B ) {\displaystyle \mathbb {P} (B)-\mathbb {P} (A\cap B)} . Cette relation découle de ce que B est réunion disjointe de B A {\displaystyle B\setminus A} et de A B . {\displaystyle A\cap B.}

  • En particulier, si A B {\displaystyle A\subset B} , alors
P ( A ) P ( B ) {\displaystyle \mathbb {P} (A)\leq \mathbb {P} (B)}

C'est la propriété de croissance de la probabilité. En effet, dans le cas particulier où A B {\displaystyle A\subset B} , la propriété précédente s'écrit

P ( B A ) = P ( B ) P ( A ) ,   {\displaystyle \mathbb {P} (B\setminus A)=\mathbb {P} (B)-\mathbb {P} (A),\ } où le premier terme est clairement positif ou nul.
  • Dans le cas particulier où B = Ω , {\displaystyle B=\Omega ,} cela donne que, pour tout événement A {\displaystyle A} ,
P ( Ω A ) = 1 P ( A ) {\displaystyle \mathbb {P} (\Omega \setminus A)=1-\mathbb {P} (A)}

Ceci signifie que la probabilité pour qu'un événement ne se produise pas est égale à 1 moins la probabilité pour qu'il se réalise ; cette propriété s'utilise lorsqu'il est plus simple de déterminer la probabilité de l'événement contraire que celle de l'événement lui-même.

  • Pour tous événements A {\displaystyle A} , B {\displaystyle B} ,
P ( A B ) = P ( A ) + P ( B ) P ( A B )     P ( A ) + P ( B ) . {\displaystyle \mathbb {P} (A\cup B)=\mathbb {P} (A)+\mathbb {P} (B)-\mathbb {P} (A\cap B)\ \leq \ \mathbb {P} (A)+\mathbb {P} (B).}

Ceci signifie que la probabilité pour que l'un au moins des événements A {\displaystyle A} ou B {\displaystyle B} se réalise est égale à la somme des probabilités pour que A {\displaystyle A} se réalise, et pour que B {\displaystyle B} se réalise, moins la probabilité pour que A {\displaystyle A} et B {\displaystyle B} se réalisent simultanément. De même,

P ( A B C ) = P ( A ) + P ( B ) + P ( C ) P ( B C ) P ( C A ) P ( A B ) + P ( A B C ) . {\displaystyle \mathbb {P} (A\cup B\cup C)=\mathbb {P} (A)+\mathbb {P} (B)+\mathbb {P} (C)-\mathbb {P} (B\cap C)-\mathbb {P} (C\cap A)-\mathbb {P} (A\cap B)+\mathbb {P} (A\cap B\cap C).}
P ( i = 1 n A i ) = k = 1 n ( ( 1 ) k 1 1 i 1 < i 2 < < i k n P ( A i 1 A i 2 A i k ) ) , {\displaystyle \mathbb {P} \left(\,\bigcup _{i=1}^{n}A_{i}\,\right)=\sum _{k=1}^{n}\left((-1)^{k-1}\sum _{1\leq i_{1}<i_{2}<\ldots <i_{k}\leq n}\mathbb {P} \left(A_{i_{1}}\cap A_{i_{2}}\cap \ldots \cap A_{i_{k}}\right)\right),}

qui donne la probabilité de la réunion de n ensembles non nécessairement disjoints.

  • Par récurrence, l'inégalité obtenue pour n=2 se généralise :
P ( i = 1 n A i ) k = 1 n P ( A k ) . {\displaystyle \mathbb {P} \left(\,\bigcup _{i=1}^{n}A_{i}\,\right)\leq \sum _{k=1}^{n}\mathbb {P} \left(A_{k}\right).}

Limites croissantes et décroissantes ou Propriété de la continuité monotone

  • Toute suite croissante d'événements A 1 A 2 A 3 {\displaystyle A_{1}\,\subset \,A_{2}\,\subset \,A_{3}\,\subset \,\dots } satisfait :
P ( A 1 A 2 ) = lim n P ( A n ) . {\displaystyle \mathbb {P} (A_{1}\cup A_{2}\cup \cdots )=\lim _{n}\mathbb {P} (A_{n}).}

C'est-à-dire que la probabilité de la limite d'une suite croissante d'événements (qui est dans ce cas la réunion - dénombrable - de tous les événements de cette suite) est égale à la limite de la suite numérique des probabilités de ces événements.

Démonstration

On pose

B 1 = A 1 et n 2 ,   B n = A n A n 1 . {\displaystyle B_{1}=A_{1}\quad {\text{et}}\quad \forall n\geq 2,\ B_{n}=A_{n}\backslash A_{n-1}.}

Alors les B i {\displaystyle B_{i}} sont disjoints et vérifient

n 1 B n = n 1 A n et n 1 ,   k = 1 n B k = A n . {\displaystyle \bigcup _{n\geq 1}B_{n}=\bigcup _{n\geq 1}A_{n}\quad {\text{et}}\quad \forall n\geq 1,\ \bigcup _{k=1}^{n}B_{k}=A_{n}.}

Les propriétés de σ-additivité et d'additivité, respectivement, entrainent alors que

n 1 P ( B n ) = P ( n 1 A n ) et n 1 ,   k = 1 n P ( B k ) = P ( A n ) . {\displaystyle \sum _{n\geq 1}\mathbb {P} (B_{n})=\mathbb {P} \left(\bigcup _{n\geq 1}A_{n}\right)\quad {\text{et}}\quad \forall n\geq 1,\ \sum _{k=1}^{n}\mathbb {P} (B_{k})=\mathbb {P} (A_{n}).}

Alors P ( A 1 A 2 ) = lim n P ( A n ) {\displaystyle \mathbb {P} (A_{1}\cup A_{2}\cup \cdots )=\lim _{n}\mathbb {P} (A_{n})} n'est autre que la définition de la somme d'une série comme limite de ses sommes partielles.

  • Toute suite décroissante d'événements A 1 A 2 A 3 {\displaystyle A_{1}\,\supset \,A_{2}\,\supset \,A_{3}\,\supset \,\dots } satisfait :
P ( A 1 A 2 ) = lim n P ( A n ) . {\displaystyle \mathbb {P} (A_{1}\cap A_{2}\cap \cdots )=\lim _{n}\mathbb {P} (A_{n}).}

C'est-à-dire que la probabilité de la limite d'une suite décroissante d'événements (qui est dans ce cas l'intersection - dénombrable - de tous les événements de cette suite) est égale à la limite de la suite numérique des probabilités de ces événements.

  • Inégalité de Boole. Toute suite d'événements B 1 , B 2 , B 3 , {\displaystyle B_{1},B_{2},B_{3},\dots } satisfait :
P ( B 1 B 2 ) n P ( B n ) . {\displaystyle \mathbb {P} (B_{1}\cup B_{2}\cup \cdots )\leq \sum _{n}\mathbb {P} (B_{n}).}
Démonstration

On pose

A n = B 1 B 2 B n = k = 1 n B k . {\displaystyle A_{n}=B_{1}\cup B_{2}\cup \dots \cup B_{n}=\bigcup _{k=1}^{n}B_{k}.}

Alors les A i {\displaystyle A_{i}} forment une suite croissante et

n 1 A n = n 1 B n . {\displaystyle \bigcup _{n\geq 1}A_{n}=\bigcup _{n\geq 1}B_{n}.}

Par ailleurs, on a vu plus haut que

P ( A n ) k = 1 n P ( B k ) , {\displaystyle \mathbb {P} (A_{n})\leq \sum _{k=1}^{n}\mathbb {P} (B_{k}),}

donc

P ( n 1 B n ) = P ( n 1 A n ) = lim n P ( A n ) lim n k = 1 n P ( B k ) = n 1 P ( B n ) . {\displaystyle {\begin{aligned}\mathbb {P} \left(\bigcup _{n\geq 1}B_{n}\right)=\mathbb {P} \left(\bigcup _{n\geq 1}A_{n}\right)&=\lim _{n}\mathbb {P} (A_{n})\\&\leq \lim _{n}\sum _{k=1}^{n}\mathbb {P} (B_{k})\\&=\sum _{n\geq 1}\mathbb {P} (B_{n}).\end{aligned}}}
  • Signalons deux conséquences importantes de l'inégalité de Boole :

Formulation à partir de la théorie de la mesure

Article détaillé : Théorie de la mesure.

De manière équivalente, on définit plus simplement le triplet ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},\mathbb {P} )} représentant un espace probabilisé, comme un espace mesuré dont la mesure, P {\displaystyle \mathbb {P} } , a la particularité d'avoir une masse totale égale à 1 :

P ( Ω ) = 1. {\displaystyle \mathbb {P} (\Omega )=1.}
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
v · m
  • icône décorative Portail des probabilités et de la statistique