Théorème des facteurs invariants - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

En mathématiques, le théorème des facteurs invariants porte sur les modules de type fini sur les anneaux principaux. Les facteurs invariants sont des obstructions à l'inversibilité des matrices qui n'apparaissent pas dans la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance spéculative,...) des espaces vectoriels. Leur calcul a de nombreuses applications : par exemple trouver la classe d'isomorphie d'un groupe abélien de type fini à partir d'une présentation de celui-ci. Dans un cadre précis, le théorème des facteurs invariants (En mathématiques, le théorème des facteurs invariants porte sur les modules de type fini sur les anneaux principaux. Les facteurs invariants sont des obstructions...) se particularise en théorèmes de réduction d'endomorphisme. Il permet alors notamment de calculer les invariants de similitude d'un endomorphisme sur un espace vectoriel (En algèbre linéaire, un espace vectoriel est un ensemble muni d'une structure permettant d'effectuer des combinaisons linéaires.). Le résultat du théorème (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une assertion qui peut être établie comme vraie au travers d'un raisonnement logique construit à partir d'axiomes. Un...) des facteurs invariants est aussi connu sous le nom de forme normale ( Forme normale (bases de données relationnelles) Forme normale (lambda-calcul) En calcul des propositions: formes normales conjonctives et formes...) de Smith.

L'approche présentée ici est effective dans le cadre d'un anneau euclidien (En mathématiques et plus précisément en algèbre, dans le cadre de la théorie des anneaux, un anneau euclidien est un type...). Le premier algorithme, dit d'échelonnement, est une généralisation (La généralisation est un procédé qui consiste à abstraire un ensemble de concepts ou d'objets en négligeant les détails...) du procédé d'élimination de Gauss-Jordan (En mathématiques, l'élimination de Gauss-Jordan, aussi appelée pivot de Gauss, nommée en hommage à Carl Friedrich Gauss et Wilhelm Jordan, est un...), de la décomposition (En biologie, la décomposition est le processus par lequel des corps organisés, qu'ils soient d'origine animale ou végétale dès l'instant qu'ils sont privés de vie,...) LU : il permet de calculer des rangs et déterminants de matrices, et des noyaux et des images de morphismes de modules, ainsi que de résoudre des systèmes linéaires dans ce cadre. Le second algorithme, qui permet d'obtenir les applications annoncées est essentiellement un algorithme d'échelonnement simultané en lignes et en colonnes.

Une autre approche classique consiste à passer (Le genre Passer a été créé par le zoologiste français Mathurin Jacques Brisson (1723-1806) en 1760.) par la décomposition de Frobenius.

Rappel sur la décomposition LU

Une matrice A étant donnée (Dans les technologies de l'information, une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un...), on souhaite la transformer en matrice triangulaire (En algèbre linéaire, les matrices triangulaires sont des matrices carrées dont une partie triangulaire des valeurs, délimitée par la diagonale principale, est nulle.) supérieure par opérations élémentaires sur les lignes (c'est-à-dire multiplication (La multiplication est l'une des quatre opérations de l'arithmétique élémentaire avec l'addition, la soustraction et la division .) à gauche par des matrices de transvection, et des matrices de permutation). Par exemple, pour la matrice :

A=\begin{pmatrix} 2 & 4 & 3\\ 1 & 5 & 0\\ 3 & 8 & 2\\ \end{pmatrix}=\begin{pmatrix}L_1\\L_2\\L_3\end{pmatrix}.

on multiplie à gauche successivement par les matrices :

T_1=\begin{pmatrix} 1 & 0 & 0\\ -1/2 & 1 & 0\\ 0 & 0 & 1\\ \end{pmatrix},T_2=\begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ -3/2 & 0 & 1\\ \end{pmatrix}.

La première multiplication matricielle revient à remplacer la deuxième ligne de la matrice A par L_2-\frac{1}{2}L_1 ; puis la seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La seconde est une...) multiplication revient à remplacer la troisième ligne par L_3-\frac{3}{2}L_1. On obtient ainsi une égalité matricielle :

T_2T_1A=\begin{pmatrix}&L_1&\\0&*&*\\0&*&*\\ \end{pmatrix}.

c'est-à-dire qu'on a annulé les coefficients sous-diagonaux de la première colonne de A, par multiplication par des matrices Ti de transvection, en se servant de la ligne L1 comme pivot. En itérant le procédé, on peut annuler tous les coefficients sous-diagonaux de A, sous réserve toutefois de ne jamais tomber sur un pivot nul.

Théorème des facteurs invariants

Pour obtenir les conséquences théoriques annoncées,il faut aller plus loin ; on veut essentiellement obtenir une matrice qui soit à la fois échelonnée en lignes et en colonnes. Le théorème s'énonce ainsi :

Théorème

Soit \mathcal{A} un anneau euclidien, et A\in M_{n,m}(\mathcal{A}). Alors, il existe des matrices T\in Sl_n(\mathcal{A}) et U\in Sl_m(\mathcal{A}), produits de matrices de transvection généralisées, telles que TAU soit échelonnée en lignes et en colonnes ; c'est-à-dire de la forme :

\begin{pmatrix}p_1&0&&\\0&\ddots&&\\&&p_r&\\&&&0\\ \end{pmatrix}

avec de plus la relation de divisibilité p_1\mid p_2\mid\dots\mid p_r Les coefficients pi forment un système de facteurs invariants pour la matrice A. Les facteurs invariants sont définis de façon unique, à multiplication par inversibles près. La suite des facteurs invariants caractérise les matrices à équivalence près.

Corollaire (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une assertion qui peut être établie comme vraie au travers d'un raisonnement logique construit à partir...) et remarque

Notons le résultat suivant, corollaire de l'existence d'une mise sous forme diagonale :

Les matrices de Sl_n(\mathcal{A}) peuvent s'écrire comme produit d'un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) fini de matrices de transvection généralisées.

L'algorithme concerne donc les classes d'équivalence pour la relation A\sim_1 B si et seulement s'il existe U,T\in Sl(\mathcal{A}) telles que A = TBU. Les facteurs invariants, définis à inversibles de \mathcal{A} près, caractérisent en fait les classes pour la relation d'équivalence moins précise A\sim_2 B si et seulement s'il existe U,T\in Gl(\mathcal{A}) telles que A = TBU. Pour trouver les invariants pour la relation \sim_1, il ne faut plus s'autoriser toutes les multiplications des facteurs invariants par des inversibles.

On rappelle que dans le cas d'un espace vectoriel, les classes d'équivalence de matrice étaient caractérisées par le rang ( Mathématiques En algèbre linéaire, le rang d'une famille de vecteurs est la dimension du sous-espace vectoriel engendré par cette famille. Le théorème...). La situation (En géographie, la situation est un concept spatial permettant la localisation relative d'un espace par rapport à son environnement proche ou non. Il inscrit un lieu dans...) est ici plus compliquée. Le rang apparaît notamment (comme le nombre de facteurs invariants), mais il ne suffit pas pour classifier ; en particulier, une matrice carrée de rang maximal peut ne pas être inversible : il suffit qu'un de ses facteurs invariants ne soit pas inversible.

Algorithme

Il ne suffit pas d'effectuer d'abord un échelonnement en lignes puis un échelonnement en colonnes. On peut procéder comme suit ; on va utiliser le stathme sur l'anneau \mathcal{A} :

  • On se ramène d'abord (si c'est possible! c'est-à-dire si A est non nulle) au cas où le coefficient (En mathématiques un coefficient est un facteur multiplicatif qui dépend d'un certain objet, comme une variable (par exemple, les coefficients d'un...) en position (1,1) est non nul, et ce par permutations sur les lignes et les colonnes.
  • On multiplie à gauche par des matrices de transvection (non généralisées), de façon à remplacer chaque coefficient a1,j, j\geq 2 par son reste par la division (La division est une loi de composition qui à deux nombres associe le produit du premier par l'inverse du second. Si un nombre est non nul, la fonction "division par ce nombre" est la réciproque de la fonction "multiplication par ce...) euclidienne par a1,1.
  • On multiplie à droite par des matrices de transvection (non généralisées), de façon à remplacer chaque coefficient ai,1 par son reste par la division euclidienne par a1,1.
  • Si jamais il y a un (et s'il y en a plusieurs, il est bon de choisir celui de stathme minimal, pour améliorer la vitesse (On distingue :) de l'algorithme) coefficient non nul sur la première ligne ou la première colonne ailleurs qu'en position (1,1), il est de stathme inférieur à celui du coefficient en position (1,1), d'après les deux étapes précédentes. On effectue une (anti)-transposition sur les lignes ou sur les colonnes suivant le cas pour le mettre en position (1,1).

On itère ces trois dernières étapes. A chaque passage, le stathme du coefficient a1,1 diminue ; et le seul cas de stagnation est celui où tous les restes obtenus sont nuls : c'est-à-dire qu'on obtient une matrice dont la première ligne et la première colonne sont nulles, excepté le coefficient (1,1). Puisque notre stathme est à valeurs dans les entiers naturels, on finit par tomber sur ce cas.

On a donc écrit T_1AU_1=\begin{pmatrix}a_{1,1}&0\\0&A_1\\ \end{pmatrix} ; par récurrence sur les dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce sont sa longueur, sa largeur et sa profondeur/son épaisseur, ou...) des matrices considérées, on obtient l'écriture souhaitée. Il reste à voir qu'on peut avoir la relation de divisibilité annoncée. Il suffit pour cela de faire la constatation suivante. A partir de la matrice \begin{pmatrix}p_1&0\\0&p_2\\ \end{pmatrix}, on fait les opérations :

  • Muliplier à droite par la matrice de transvection \begin{pmatrix}1&0\\1&1\\ \end{pmatrix} on obtient \begin{pmatrix}p_1&0\\p_2&p_2\\ \end{pmatrix}
  • Multiplier à gauche par la matrice de transvection généralisée \begin{pmatrix}\alpha&\beta\\-\frac{p_2}{p}&\frac{p_1}{p}\\ \end{pmatrix}, où p1α + p2β = p = pgcd(p1,p2) pour obtenir :\begin{pmatrix}p&\beta p_2\\0&\frac{p_1p_2}{p}\\ \end{pmatrix}.
  • Multiplier à droite par la matrice de transvection \begin{pmatrix}1&-\beta\frac{p_2}{p}\\0&1\\ \end{pmatrix}(\beta\frac{p_2}{p}\in\mathcal{A} car p\mid p_2), et on obtient :

\begin{pmatrix}p&0\\0&\frac{p_1p_2}{p}\\ \end{pmatrix}, et p\mid\frac{p_1p_2}{p}.

Ainsi, par multiplication à droite et à gauche par des transvections généralisées, on peut remplacer une matrice diagonale (En algèbre linéaire, une matrice diagonale est une matrice carrée dont les coefficients en dehors de la diagonale principale sont nuls. Les coefficients de la diagonale peuvent être ou ne pas être nuls. Ainsi, la matrice D = (di,j)...) par une matrice diagonale (On appelle diagonale d'un polygone tout segment reliant deux sommets non consécutifs (non reliés par un côté). Un polygone à n côtés possède diagonales.) avec relations de divisibilité. Dans le cas général de notre matrice doublement échelonnée, on se ramène successivement à p_1\mid p_2, puis p_1\mid p_3, en conservant la relation précédente, jusqu'à avoir p_1\mid p_i pour tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) i ; puis on s'occupe de p2, etc.

\mathcal{A}-modules de type fini

Soit \mathcal{A} un anneau euclidien, et M un \mathcal{A}-module de type fini ; alors, il existe un unique ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) \left\{(r,t),d_1,\dots,d_t\right\} tel que r\in\mathbb{N} soit le rang de la partie libre du module M, t soit le cardinal d'un système minimal de générateurs de la partie de torsion (La torsion est la déformation subie par un corps soumis à l'action de deux couples opposés agissant dans des plans parallèles.), et d_1\mid d_2\mid\dots\mid d_t soient des éléments de \mathcal{A} définis à inversibles près, et tel que :

M\simeq \mathcal{A}^r\oplus\mathcal{A}/d_1\mathcal{A}\oplus\dots\oplus\mathcal{A}/d_t\mathcal{A}

Ce théorème s'applique en particulier aux \mathbb{Z}-modules de type fini, c'est-à-dire aux groupes abéliens de type fini. On dispose d'une part d'un théorème de classification, et d'autre part d'un algorithme pour calculer la classe d'un groupe dont on connaît un système de générateurs ainsi qu'une famille de relations entre ces générateurs, qui engendre l'ensemble des relations.

Page générée en 0.132 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique