La première étape de la synthèse des protéines est la transcription d'un gène de l'ADN en une molécule d'ARN messager (ARNm ou acide ribonucléique messager). L'étape se déroule à l'intérieur même du noyau d'une cellule eucaryote et dans le cytoplasme des procaryotes. Cette différence va avoir des conséquences importantes sur le traitement de l'ARN synthétisé. L'ADN est une molécule constituée d'une succession de nucléotides. Aucune particularité physique ne différencie un gène d'une portion non codante de l'organisme. Le repérage des gènes le long de la molécule d'ADN (et d'une manière générale toute information de régulation le long de la chaîne d'ADN) va se faire de la même façon que celui du repérage des fichiers sur une bande magnétique : des marquages consistant en une séquence particulière de nucléotides vont indiquer le début du gène. Ces marques spéciales sont appelées séquences consensus, il ne s'agit en effet pas de séquences exactes mais de séquences approchées d'une séquence moyenne mais différant seulement par quelques paires de bases. Les deux utilisées pour repérer le début d'un gène sont les boîtes CAAT et TATA, du nom des nucléotides formant le cœur de la séquence moyenne et situées dans une zone précédant le gène appelée promoteur car elle initie la transcription du gène.
La transcription consiste à faire une «copie de travail» de l'ADN. L'ADN est une molécule unique dans la cellule. Outre le fait que la synthèse d'un ARN intermédiaire permet de limiter les dommages de l'ADN par suite de trop de manipulations, cela permet de multiplier les copies disponibles pour la phase de traduction et donc de synthétiser la protéine beaucoup plus rapidement.
La synthèse de l'ARN fait intervenir un ensemble protéique très complexe, l'ARN polymérase. La première étape de la transcription est la reconnaissance du gène à transcrire. Cette étape fait intervenir des mécanismes variés qui dépendent de la protéine à transcrire, mais qui reposent tous sur le principe d'une protéine spécifique du ou des gènes à transcrire, qui se fixe en un endroit précis de l'ADN, situé dans le promoteur. Cette protéine va servir de point d'ancrage au système ARN polymérase, cette phase n'ayant lieu naturellement que si les deux boîtes CAAT et TATA sont présentes. Ce complexe va parcourir la molécule d'ADN pour la lire. Elle va tout d'abord dérouler la molécule d'ADN, puis séparer les deux brins, puis assembler les bases azotées en se servant du brin complémentaire comme matrice pour aboutir à la molécule d'ARN. Derrière elle, les deux brins se réassemblent et l'ADN se réenroule. Quand l'ARN polymérase rencontre le site de terminaison de gène, elle se sépare de l'ADN, et l'ARN est libéré de la chaîne d'ADN.
L'ARN transcrit n'est pas toujours directement utilisable, il est d'ailleurs souvent appelé ARN pré-messager, il peut nécessiter différentes modifications avant de pouvoir être traduit. Les modifications les plus connues sont l'épissage, et chez les eucaryotes, l'ajout d'une coiffe et d'une queue poly (A).
L'ARNm va maintenant pouvoir passer par la phase suivante de la synthèse protéique : la traduction
Une molécule d'ADN est constituée de deux brins :
le brin d'ADN non transcrit (ou brin matrice): A T G G C G T T C A G A A C T G A T A C G T A A le brin d'ADN transcrit: T A C C G C A A G T C T T G A C T A T G C A T T le brin d'ARN: A U G G C G U U C A G A A C U G A U A C G U A A