Le langage Short Message Service est un sociolecte écrit qui modifie les caractéristiques orthographiques voire grammaticales d'une langue afin de réduire sa longueur, dans le but de ne pas dépasser le nombre de caractères autorisé par les messages SMS, ou dans le but d'accélérer la saisie de l'énoncé sur un clavier numérique d'un téléphone.
L'appellation « langage SMS » désigne ainsi, par extension, l'usage de ce type de langage lors d'échanges sur Internet par messagerie instantanée ou courrier électronique, sur les forums Internet et les blogs, ou encore dans les jeux en réseau. L'utilisation du langage SMS sur un autre médium qu'un clavier téléphonique est par ailleurs très controversée.
Le langage SMS, apparu avec la banalisation des technologies de l'information et de la communication au cours des années 1990, combine plusieurs procédés pour raccourcir les phrases et les mots :
Le langage SMS répond à la limitation à environ 160 caractères des messages SMS entre téléphones portables (le dépassement du nombre autorisé de caractères rend l'envoi du message plus cher) et de la limitation à 10 touches du clavier alphanumérique.
Le langage SMS est essentiellement dérivé de la communication verbale et a donc pour caractéristique de posséder une syntaxe et un vocabulaire propres, différents du langage écrit « standard ». L'exemple suivant illustre cependant les principes de formation du langage.
Soit le texte suivant :
« La linguistique par ordinateur pourrait tirer profit d'une langue abrégée à la fois dans sa syntaxe et ses matériaux - non seulement du point de vue de la mémoire - mais surtout du point de vue de l'analyse algorithmique du langage humain, la particularité d'une langue abrégée étant de supprimer ou de contourner les idiomatismes. » (331 caractères)
On supprime tous les espaces et on met une majuscule à chaque mot pour faciliter la lecture. Ce type de langage SMS est un des plus compressant tout en restant assez lisible pour une personne qui ne serait pas habituée. C'est aussi la façon de compresser les phrases de la plupart des étrangers écrivant un SMS en langage SMS français (mais elle se limite généralement à la suppression des espaces, ce qui donne déjà un bon taux de compression).
LaLinguistiqParOrdinateurPouraiTirerProfiDUneLangAbrégéÀLaFoiDanSaSyntaxEtSesMatériau -NonSeulmntDuPoinDVuDLaMémoir- MaiSurtouDuPoinDVuDLAnalyseAlgoritmiqDuLangageHumain,LaParticularitéDUneLangAbrégéÉtanDSuprimerOuDContournerLesIdiomatism. (239 caractères)
La phrase a ainsi été compressée de 28%.
On applique une étape de phonétisation qui remplace les phonèmes par des raccourcis :
La l1guistik par ordinateur pourè tiré profi d1 langaj abrégé a la foi ds sa sintax é c matério - non selman du po1 dvu dla mémoir - mè surtou du pt dvu dlanaliz algoritmik du langaj Um1, la partiQlarité d1 lang abrégé étan dsuprimé ou dcontourné lé idiomatism. (261 caractères)
Le texte final est plus court de 21%.
On remplace des sons par une seule lettre en fonction de sa prononciation lorsque l'on énumère l'alphabet. Par exemple, « té » est remplacé par « T » :
La l1g8stik / ordinateur pourè tiré profi d'1 lang abréG à la x ds sa s1tax é C maTrio - non slmt du . 2 vu 2 la mémoir - mè surtt du . 2 vu 2 l'analiz algoritmik du langaj um1, la partiQlariT d'1 lang abréG étan 2 supprimé ou 2 contourné léz idiomatism. (254 caractères)
La nouvelle phrase n'est pas beaucoup plus courte que la précédente. Plus courte que l'originale de 24%.
Autre exemple de phonétisation "À un de ces quatre" (18 caractères) peut devenir "à12C4" (5 caractères) ce qui donne une compression de 3,6 pour 1.
On peut compresser encore le texte grâce à des abréviations. Le texte devient nettement moins compréhensible. La manière d'abréger dépend des utilisateurs et du « style » SMS adopté. Des utilisateurs peuvent convenir de certains codes. Souvent, seuls les utilisateurs assez expérimentés comprennent.
Lngk pr ordi pov7 tir pft du lng abr al fs dn sn sytx e sn matr# - nn slmt ptdv mmr - ms srtt ptdv algo spc a lngg hm, 1prtk lng abr = 8:supr o ktrn idiom#. (156 caractères)
Écrite comme ça, le taux de compression atteint les 53% pour cette phrase.