Différentes méthodes pour trouver les transformations
Pour la relativité restreinte, Einstein a initié une méthode :
À partir du principe de relativité et de l'invariance de la vitesse de la lumière par changement de référentiel, de l'homogénéité et de l'isotropie supposées de l'espace, et à l'aide d'une représentation géométrique d'une situation idéale où deux référentiels inertiels permettent de voir, mesurer les longueurs, et chronométrer le temps d'un référentiel à l'autre, on démontre les différentes formules par un système d'équations linéaires dont il faut trouver les coefficients. Les transformations non physiques sont parfois écartées sans détail par le choix de la solution positive dans une équation du second degré, choix dû à l'hypothèse physique de l'orientation des repères par une règle telle que celle de la main droite, illustrée par la représentation géométrique accompagnant le raisonnement.
En physique quantique relativiste, comme en Théorie quantique des champs, les transformations utilisées sont définies comme les symétries de l'espace de Minkowski qui laissent inchangées les équations (en l'absence de charge électrique). Cela revient à déterminer les transformations linéaires laissant inchangé l'intervalle d'espace-temps : c'est une définition mathématique pour laquelle les changements de référentiel pour des observateurs ne sont que certaines de ces transformations et qui permet de les trouver toutes. Cette méthode est aussi utilisée dans certains manuels de relativité restreinte, après avoir démontré que l'invariance de l'intervalle d'espace-temps par changement de référentiel découle directement des deux axiomes de la relativité restreinte, et en éliminant les transformations qui ne respectent pas la convention d'orientation pour les repères tridimensionnels (règle de la main droite, en général) et d'orientation de l'axe du temps vers le futur ; élimination faite de diverses manières, parfois marquées du sceau de l'évidence, et parfois plus justifiées.
La méthode géométrique
On suppose que l'espace-temps physique est un espace affine où les référentiels sont identifiés aux repères de cet espace affine. De plus on néglige les translations constantes entre les repères qui ne se manifestent que par des additions de nombres constants aux coordonnées. Donc, la transformation des coordonnées s'effectue au moyen d'un opérateur linéaire :
Soient deux référentiels
et
en translation rectiligne l'un par rapport à l'autre sur des axes parallèles, avec une vitesse relative v selon l'axe Ox. Soient
les coordonnées spatio-temporelles d'un événement dans le référentiel
, et
ses coordonnées dans le référentiel
. (Pour simplifier les notations, on ne tiendra pas compte dans ce paragraphe des deux autres composantes spatiales y et z).
Utilisation du principe de relativité :
Par le principe de relativité, les coefficients de la transformation linéaire ne dépendent que de la vitesse relative entre les référentiels, et d'aucune considération extérieure à ces deux référentiels. Pour plus de précision, on devrait dire des vitesses relatives des référentiels, le sujet est abordé un peu plus loin.
Première utilisation de la vitesse de la lumière :
Si dans le référentiel
on considère le déplacement d'un signal lumineux dans le sens des x positifs, donc à la vitesse de la lumière, alors
. Mais comme cette vitesse est la même dans le référentiel
, en considérant le déplacement de ce même signal vu depuis ce référentiel, comme l'axe des x' a la même orientation que celui des x, et de même pour les axes temporels, on doit avoir
. De même, en commençant par considérer le signal depuis
.
Donc :
Et comme x, t, x', t' sont liés par des relations linéaires à coefficients constants, on doit avoir
pour un certain λ constant.
Deuxième utilisation de la vitesse de la lumière :
En considérant le déplacement d'un signal lumineux dans le sens des x négatifs, et en faisant le même raisonnement, on obtient :
pour un certain μ constant.
Conclusion sur la vitesse de la lumière :
En additionnant et soustrayant les deux égalités précédentes, on obtient :
avec :
et
.
Première utilisation de la vitesse relative des référentiels :
Pour l'origine du référentiel
, on a x' = 0 et donc, d'après la première équation du système (2), on a :
En désignant par
la vitesse du référentiel
par rapport au référentiel
, on peut donc écrire
, ou
, avec
On peut donc écrire :
Deuxième utilisation de la vitesse relative des référentiels :
Pour l'origine du référentiel
, on a x = 0 et donc, d'après les équations du système (2), on a :
En désignant par
la vitesse du référentiel
par rapport au référentiel
, on peut donc écrire
.
Utilisation des hypothèses sur l'espace :
Quand t = 0, on a
. Le coefficient a permet donc de convertir la mesure d'une longueur faite dans le référentiel
, en la mesure faite dans
. Ce coefficient peut dépendre de la vitesse relative
entre les référentiels, mais pas de sa direction ni de son sens par l'hypothèse de l'isotropie de l'espace. De plus, comme expliqué en début de paragraphe, a est indépendant des coordonnées x, t, x', t'.
Donc a dépend de la norme de la vitesse
, c'est-à-dire de
.
Utilisation du principe de relativité :
En inversant les rôles des référentiels
et
, et ayant justifié que v' = − v, et que
ne dépend pas de la direction ni du sens de
, donc
, et on peut écrire :
En utilisant les deux équations du système (3) dans la première équation du système (4), on obtient
soit :
Le signe + est choisi, sinon il y a changement dans d'orientation entre l'axe des x et l'axe des x', ce qui n'est pas le cas par hypothèse.
Conclusion :
Les transformations de Lorentz s'écrivent :
Ce que l'on écrit souvent :
Avec
et
.
On trouvera une variante de cette démonstration où les principes de base (référentiels galiléens, vitesse de la lumière indépendante de celle de la source et principe de relativité) sont séparés sur Wikiversité
La méthode partant de l'invariance de la pseudo-norme
Les transformations de Galilée conservent le produit scalaire : :
Ce qui veut dire que l'on doit différencier les coordonnées covariantes, des coordonnées contravariantes. On définit la pseudo-norme : :ds2 = ηαβdxαdxβ = dxαdxα = c2dt2 − dx2 − dy2 − dz2
Les transformations de Lorentz doivent conserver la pseudo-norme : :dxαdxα = dx'αdx'α
Les transformations de Lorentz doivent être linéaire à coefficients constants. Dans toute la suite, les indices primés correspondent aux coordonnées dans le référentiel
, de plus les répétitions de lettres grecques voudront dire sommation de 0 à 3, et les répétitions de lettres latines de 1 à 3.
Les transformations s'écrivent sous la forme matricielle :
Les pseudo-produits scalaires sont invariants pas transformations de Lorentz :
soit donc :
où
est le symbole de Kronecker. L'inverse de la matrice
est sa transposée :
La transformation du tenseur métrique se retrouve en ayant à l'esprit l'invariance du pseudo-produit scalaire :
xμxμ = xλ'xλ'
On en déduit que (detL)2 = 1 donc detL = 1 ou detL = − 1.
Terminologie : les transformations vérifiant
sont appélées les transformations propres, elles forment un groupe appelé le groupe des Transformations Spéciales de Lorentz. Ce groupe a deux composantes connexes. Les autres transformations sont qualifiées d'impropres et ne forment pas un groupe.
Les transformations s'écrivent alors :
On considère un corps au repos dans le référentiel
, alors dx'k = 0, d'où :
soit :
Ensuite il y a ces relations à démontrer :
Pour les expressions (2), il suffit d'utiliser la relation :
avec ν = i, μ = 0 et μ' = ν' = 0' soit :
Pour les expressions (3) :
Pour les expressions (4), nous partons de
, avec ρ' = 0' et σ' = i'
Pour les expressions (5) les relations de transformations du tenseur métrique donnent :
, en prenant μ' = ν' = 0'
Pour les expressions (6) :
avec
et
en remarquant :
pour μ' = i' et ν' = j' on obtient :
or :
d'où :
On prend le déterminant :
Pour les expressions (7) : Nous avons L' = L− 1 (matrices orthogonales), on a donc :
, on a donc β2 = β'2.
En se plaçant dans le cadre de la relativité restreinte, les transformations de Lorentz représentent des changements de référentiels :
Il faut appliquer le principe de non retournement du temps, et donc écarter les valeurs négatives pour
On obtient alors :
Les transformation de Lorentz alors utilisées sont dites orthochrones.
Il faut appliquer le principe de non retournement de l'orientation spatiale (par la main droite en général), et donc écarter les cas où
On obtient alors :
Avec cette condition supplémentaire, les transformations de Lorentz utilisées sont de déterminant égal à 1 : elles sont dites propres.
Ainsi, les transformations de Lorentz utilisées en relativité restreinte sont celles qui sont propres et orthochrones.