La somme de deux variables gaussiennes indépendantes est elle-même une variable gaussienne. Plus explicitement :
Soient
Alors, la variable aléatoire
Cette propriété se démontre directement (par convolution), ou indirectement (au moyen des fonctions caractéristiques).
On prend ici le gramme comme unité de masse. Si la masse du contenu d'une boîte de conserve suit la loi normale d'espérance 400 et de variance 25, et si celle du contenant suit la loi normale d'espérance 60 et de variance 4, alors (avec l'hypothèse, naturelle, d'indépendance) la masse totale de la boîte de conserve suit la loi normale d'espérance 460 et de variance 29 ; son écart type est environ 5,4 grammes.
Le recours à une distribution gaussienne est si fréquent qu'il peut finir par être abusif. Il faut alors rechercher des critères de normalité.
Le premier critère, le plus simple, consiste à tracer l'histogramme ou le diagramme en bâtons de la distribution et à vérifier si le diagramme est en forme de « cloche ». Ce critère, subjectif, permet cependant d'éliminer une partie des distributions jugées alors non gaussiennes.
Le critère suivant consiste à utiliser les plages de normalité ou intervalles de confiance. On a vu que si une distribution est gaussienne :
Lorsque ces pourcentages ne sont pas respectés, il y a fort à parier que la distribution n'est pas gaussienne.
On peut aussi utiliser la droite de Henry, en particulier quand on possède peu de renseignements sur la distribution. La droite de Henry va permettre de porter un diagnostic sur la nature non gaussienne de la distribution, et, dans le cas où celle-ci a des chances d'être gaussienne, elle permet d'en déterminer la moyenne et l'écart type.
Il existe également un grand nombre de tests de normalité:
Soient
La moyenne
Il est possible de simuler, par exemple par ordinateur, un tirage aléatoire dont la loi est normale.
Les logiciels ou les langages de programmation possèdent en général un générateur de nombres pseudo-aléatoires ayant une distribution uniforme sur ]0,1[. On cherche donc une fonction transformant ces nombres. De manière générale, on peut prendre la fonction réciproque de la fonction de répartition : en l'occurrence, si la variable aléatoire U suit la loi uniforme sur ]0,1[, alors la variable aléatoire
Pour simuler la loi normale à une dimension (celle qui a été étudiée jusqu'ici), on peut utiliser la méthode de Box-Muller dont voici le principe :
Si U1 et U2 sont des variables aléatoires indépendantes qui suivent la loi uniforme sur ]0,1[, alors on démontre assez aisément que les variables aléatoires :
suivent toutes deux la loi normale centrée réduite (et sont indépendantes).
Les variables aléatoires
#define DEUX_PI ( 2.0 * 3.141592653589793238462643383279502884197169399375 ) // PI x 2 // [ ... ] /** * Retourne un nombre pseudo-aléatoire selon une loi normale de paramètres mu et sigma * @param mu moyenne (espérance mathématique) de la distribution * @param sigma écart-type de la distribution (doit être strictement positif) */ double genererNombreLoiNormale(double mu, double sigma) { // On récupère deux nombres pseudo-aléatoires indépendants selon une loi uniforme sur l'intervalle [0;1] double randNumUni = ((double) rand())/((double) RAND_MAX); double randNumBi = ((double) rand())/((double) RAND_MAX); // On récupère un nombre pseudo-aléatoire selon une loi normale centrée réduite // (Paramètres: moyenne = 0, écart-type = 1) // Utilisation de l'algorithme de Box-Muller double randNumNorm = sqrt(-2.0*log(randNumUni))*cos(DEUX_PI*randNumBi); return (mu + sigma * randNumNorm); }
La loi multinormale ou loi normale sur
Elle est caractérisée par deux paramètres : un vecteur m de moyennes, et une matrice de variance-covariance V (carrée d'ordre n).
Pour simuler une loi multinormale non dégénérée de paramètres m et V, on utilise la méthode suivante :