Fonction de répartition - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Fonctions de répartition d'une variable discrète, d'une variable diffuse et d'une variable avec atome, mais non discrète.

En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle. La fonction de répartition de la variable aléatoire réelle \ \scriptstyle X\ est la fonction \ \scriptstyle F_X qui à tout réel \scriptstyle x associe

 F_X(x) = \mathbb{P}(X\leq x),

où le membre de droite réprésente la probabilité que la variable aléatoire réelle \ \scriptstyle X\ prenne une valeur inférieure ou égale à \ \scriptstyle x.\ La probabilité que \ \scriptstyle X\ se trouve dans l'intervalle \ \scriptstyle ]a, b]\ est donc, si \ \scriptstyle a<b,\

 \mathbb{P}(a<X\le b)\ =\ F_X(b)-F_X(a).

La fonction de répartition d'une mesure de probabilité \ \scriptstyle \mathbb{P}\ définie sur la tribu borélienne \scriptstyle\ \mathcal{B}(\mathbb{R}) est la fonction \ \scriptstyle F qui à tout réel \scriptstyle x associe

 F(x) = \mathbb{P}(]-\infty, x]).

Exemples de calculs de la fonction de répartition

Variables à densité

Fonction de répartition de la loi normale centrée réduite

La fonction de répartition \scriptstyle \ F_X\ d'une variable aléatoire \scriptstyle \ X\ de densité de probabilité \scriptstyle \ f_X est une des primitives (en un sens un peu relaché, voir ci-dessous) de cette densité \scriptstyle \ f_X. Plus précisément, \scriptstyle \ F_X\ est définie, pour tout nombre réel x, par:

 F_X(x)=\int_{-\infty}^{x} f_X(t)\, dt.

Toutefois, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut seulement affirmer

  • qu'une fonction de répartition \scriptstyle \ F_X est dérivable presque partout (pour la mesure de Lebesgue),
  • que si la variable \scriptstyle \ X\ est à densité, alors la dérivée de \scriptstyle \ F_X est presque partout (pour la mesure de Lebesgue) égale à \scriptstyle \ f_X.

Mais il y a beaucoup de "contre-exemples" : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout \scriptstyle \ \mathbb{R}, et ne sont donc pas, au sens strict, des primitives de densités de probabilités.

Notons que, contrairement aux variables discrètes, une variable à densité X vérifie \scriptstyle \ P(X=a)=0\ pour tout nombre réel a : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle X possède une densité de probabilité si et seulement si sa fonction de répartition est absolument continue sur chaque intervalle borné.

Variables discrètes

Fonction de répartition de la loi uniforme sur {0.2,0.4,0.6,0.8,1} (pour laquelle \ \scriptstyle p_i=0.2,\ 1\le i\le 5\ , en bleu) et de la loi uniforme sur l'intervalle [0,1] (en rouge)

Une variable aléatoire \ \scriptstyle X\ est dite discrète s'il existe un ensemble \ \scriptstyle S\ fini ou dénombrable tel que

P(X\in S)=1.

La loi de \ \scriptstyle X\ est déterminée sans ambiguité par la donnée de \scriptstyle (p_s)_{s\in S}\ , où

ps = P(X = s).

Si, par exemple, \ \scriptstyle X\ est une variable aléatoire réelle, on a

 F_X(x)=\sum_{s\in S}\ p_s\ 1_{[s;+\infty[}(x).

\scriptstyle \ 1_E\ est la fonction indicatrice de l'ensemble E.

Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson) \ \scriptstyle S\ est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e. \scriptstyle s_1\le s_2\le s_3\le\dots et numéroter les probabilités \scriptstyle \ p_s\ en conséquence, p.e. en posant \scriptstyle \ p_i=p_{s_i},\ i\ge 1. On a alors, si \scriptstyle \ s_i\le x < s_{i+1},

F_X(x)= \sum_{1\le j\le i}p_j.

Soit encore, plus généralement :

 \begin{align} F_X(x)&=\sum_{i\ge 1}\ q_i\ 1_{[s_i,s_{i+1}[}(x), \\ q_i&=\sum_{1\le j\le i}p_j. \end{align}

La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses \ \scriptstyle s_i\ , et l'amplitude du saut d'abscisse \ \scriptstyle s\ est \ \scriptstyle p_s=F_X(s)-F_X(s_-). En particulier la fonction de répartition d'une variable discrète X est discontinue exactement aux points s tels que \ \scriptstyle P(X=s)>0.\ Voir la section Propriétés de la fonction de répartition pour une démonstration.

Miscellanées

L'escalier de Cantor F est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, les formules précédentes ne valent pas pour l'escalier de Cantor : pour x>0, on n'a pas

 F(x)=\int_{-\infty}^{x} F^{\prime}(t)\, dt,

car l'escalier de Cantor F prend des valeurs strictement positives sur \scriptstyle\ ]0, +\infty[,\  alors que l'intégrale constituant le membre de droite est identiquement nulle. En effet, l'ensemble

 \{t\in\mathbb{R}\ |\ F^{\prime}(t)\neq 0\}

est de mesure de Lebesgue nulle. Par ailleurs, la loi de probabilité associée à l'escalier de Cantor est diffuse (sans atome), puisque F est une fonction continue sur \scriptstyle\ \mathbb{R}.\ L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle.

Page générée en 2.480 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise