Un codon est un triplet de nucléotides A, C, U ou G de l'ARN messager (ARNm).
En termes de combinatoire, un assemblage de 3 éléments, pris chacun parmi 4 possibles, conduit à 64 possibilités, le code génétique contient donc 64 codons différents.
Chacun des codons possibles peut désigner l'un des 20 acides aminés naturels (ou, dans de rares cas, la sélénocystéine). Plusieurs codons peuvent désigner le même acide aminé, on parle alors de codons synonymes. Les codons UAG, UGA et UAA ne désignent en général aucun acide aminé; ce sont les codon-stop ou codons non-sens (exceptionnellement, le codon UGA code parfois pour une sélénocystéine, indispensable à la fonction des sélénoprotéines). Quand un ribosome atteint un codon-stop sur l'ARN messager, lors du processus complexe de synthèse des protéines, il s'arrête, libère la protéine terminée et se détache de l'ARN messager.
On distingue aussi le codon d'initiation ou codon de démarrage qui signale le début de la phase ouverte de lecture : AUG (méthionine). Chez les procaryotes, parfois ce codon est GUG ou encore UUG (par exemple, chez E. coli, 77% des séquences codantes commencent par AUG, 14% par GUG et 8% par UUG). En règle générale, toute protéine commencera par une méthionine, quel que soit le codon d'initiation utilisé (ou une N-formyl-méthionine dans le cas des bactéries).
La table ci-dessous donne la traduction des codons en acides aminés dans le code génétique standard.
U | C | A | G | ||||||
U | UUU | phénylalanine | UCU | sérine | UAU | tyrosine | UGU | cystéine | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | leucine | UCA | UAA | stop | UGA | stop/sélénocystéine | A | ||
UUG | UCG | UAG | UGG | tryptophane | G | ||||
C | CUU | CCU | proline | CAU | histidine | CGU | arginine | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | glutamine | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | isoleucine | ACU | thréonine | AAU | asparagine | AGU | sérine | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | lysine | AGA | arginine | A | |||
AUG | méthionine/start | ACG | AAG | AGG | G | ||||
G | GUU | valine | GCU | alanine | GAU | acide aspartique | GGU | glycine | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | acide glutamique | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
Le terme "codon" a été inventé par le biologiste sud-africain Sydney Brenner en 1960. C'est lui qui, avec Francis Crick a démontré que le code génétique fonctionnait par triplets non-recouvrants, avant même que celui-ci ne soit déchiffré, grâce à une approche génétique extrêmement astucieuse. Le terme "codon" a ensuite été popularisé par ce même Francis Crick au début des années 60.
C'est le biochimiste américain Marshall Nirenberg qui a déchiffré le code génétique et identifié la traduction en acide aminé de chacun des codons dans la première moitié des années 60. Ce travail s'appuya sur son expérience princeps où il montra que l'acide poly-uridylique (ARN formé uniquement de U), permet de synthétiser du poly-phénylalanine, établissant ainsi la correspondance entre le codon UUU et la phénylalanine. Nirenberg fut récompensé par le Prix Nobel en 1968 pour cette découverte.