Le principe des moindres carrés consiste à rechercher les valeurs des paramètres qui minimisent la somme des carrés des résidus.
.
Ce qui revient à rechercher les solutions de
. Nous avons j =p + 1 équations, dites équations normales, à résoudre.
La solution obtenue est l'estimateur des moindres carrés ordinaires, il s'écrit :
Théorème — est l'estimateur qui minimise la somme des carrés des résidus.
avec X' la transposée de X
En passant l'opérateur de dérivation dans la somme, on a
:
Il suffit alors d'écrire cette dernière relation sous forme vectorielle :
Remarques:
Pourquoi minimiser la somme des carrés plutôt que la simple somme? Cela tient au fait que la moyenne de ces résidus sera 0, et donc que nous disposerons de résidus positifs et négatifs. Une simple somme les annulerait, ce qui n'est pas le cas avec les carrés.
L'estimateur MCO correspond à une matrice inverse généralisée du système Y = Xa pour mettre a en évidence. En effet, si on prémultiplie par l'inverse généraliseé (X'X) − 1X' on a: (X'X) − 1X'Y = (X'X) − 1X'Xa = a
L'estimateur MCO est identique à l'estimateur obtenu par le principe du maximum de vraisemblance.
Propriétés des estimateurs
Si les hypothèses initiales sont respectées, l'estimateur des MCO (Moindres Carrés Ordinaires) possède d'excellentes propriétés.
Propriétés en échantillons finis
Propriété — L'estimateur MCO est sans biais, c.-à-d.
, sous les hypothèses H1,H2, et H5
Cette propriété se base seulement sur les hypothèses d'espérance nulle des résidus. La présence d'autocorrélation ou d'hétéroscédasticité n'affecte pas ce résultat.
Propriété — L'estimateur MCO est le meilleur estimateur linéaire sans biais, sous les hypothèses H1 à H5
C.-à.-d. qu'il n'existe pas d'estimateur linéaire sans biais de a qui ait une variance plus petite. Cette propriété en anglais est désignée par BLUE, pour best linear unbiased estimator. La preuve est donnée par le Théorème de Gauss-Markov.
Propriété — L'estimateur MCO est distribué selon une loi normale sous les hypothèses H1,H2, et H6
Propriétés asymptotiques
Propriété — L'estimateur MCO est convergent en probabilité, c.-à-d.
, sous les hypothèses H6, et H8
Récrivons:
Prenons la limite en probabilité:
Comme on a fait l'hypothèse H8 que
tend vers une matrice Q définie positive, la limite devient:
Il reste alors à étudier le comportement de
. Sous l'hypothèse H6, (ou plutôt sur une forme plus restrictive
) on peut montrer que son espérance est nulle, et que sa variance tend asymptotiquement vers 0, ce qui implique qu'il converge en moyenne quadratique vers 0, et donc qu'il converge en probabilité vers 0.
On a donc finalement:
Propriété — L'estimateur MCO suit asymptotiquement une loi normale
sous les hypothèses H1 à H5 et H8
Ce résultat est obtenu sans l'hypothèse de normalité des résidus (H6).