Techno-Science.net

Mardi 22 Avril 2025

Rechercher 🔍

Codage de Huffman - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Principe - Limitations du codage de Huffman - Propriétés - Anecdote - Utilisations

Introduction

Le codage de Huffman est un algorithme de compression de données sans perte élaboré par David Albert Huffman, lors de sa thèse de doctorat au MIT. L'algorithme a été publié en 1952 dans l'article A Method for the Construction of Minimum-Redundancy Codes, dans les Proceedings of the Institute of Radio Engineers. Le codage de Huffman utilise un code à longueur variable pour représenter un symbole de la source (par exemple un caractère dans un fichier). Le code est déterminé à partir d'une estimation des probabilités d'apparition des symboles de source, un code court étant associé aux symboles de source les plus fréquents. Les codes de Huffman sont des codes optimaux, au sens de la plus courte longueur.

Un code de Huffman est optimal pour un codage par symbole, et une distribution de probabilité connue. Il ne permet cependant pas d'obtenir les meilleurs ratios de compression. Des méthodes plus complexes réalisant une modélisation probabiliste de la source et tirant profit de cette redondance supplémentaire permet d'améliorer les performances de compression de cet algorithme (voir Lempel-Ziv, prédiction par reconnaissance partielle, pondération de contextes).

Principe

Le principe du codage de Huffman repose sur la création d'un arbre composé de nœuds. Supposons que la phrase à coder est « wikipédia ». On recherche tout d'abord le nombre d'occurrences de chaque caractère (ici les caractères 'a', 'd', 'é', 'k', 'p' et 'w' sont représentés chacun une fois et le caractère 'i' trois fois). Chaque caractère constitue une des feuilles de l'arbre à laquelle on associe un poids valant son nombre d'occurrences. Puis l'arbre est créé suivant un principe simple : on associe à chaque fois les deux nœuds de plus faibles poids pour donner un nœud dont le poids équivaut à la somme des poids de ses fils jusqu'à n'en avoir plus qu'un, la racine. On associe ensuite par exemple le code 0 à la branche de gauche et le code 1 à la branche de droite.

Un exemple d'arbre de Huffman

Pour obtenir le code binaire de chaque caractère, on remonte l'arbre à partir de la racine jusqu'aux feuilles en rajoutant à chaque fois au code un 0 ou un 1 selon la branche suivie. Il est en effet nécessaire de partir de la racine pour obtenir les codes binaires car lors de la décompression, partir des feuilles entraînerait une confusion lors du décodage. Ici, pour coder 'Wikipédia', nous obtenons donc en binaire : 101 11 011 11 100 010 001 11 000, soit 24 bits au lieu de 63 (9 caractères x 7 bits par caractère) en utilisant les codes ASCII (7 bits).

Il existe trois variantes de l'algorithme de Huffman, chacune d'elle définissant une méthode pour la création de l'arbre :

statique : chaque octet a un code prédéfini par le logiciel. L'arbre n'a pas besoin d'être transmis, mais la compression ne peut s'effectuer que sur un seul type de fichier (ex: un texte en français, où les fréquences d'apparition du 'e' sont énormes; celui-ci aura donc un code très court, rappelant l'alphabet morse).
semi-adaptatif : le fichier est d'abord lu, de manière à calculer les occurrences de chaque octet, puis l'arbre est construit à partir des poids de chaque octet. Cet arbre restera le même jusqu'à la fin de la compression. Il sera nécessaire pour la décompression de transmettre l'arbre.
adaptatif : c'est la méthode qui offre a priori les meilleurs taux de compression car l'arbre est construit de manière dynamique au fur et à mesure de la compression du flux. Cette méthode représente cependant le gros désavantage de devoir modifier souvent l'arbre, ce qui implique un temps d'exécution plus long. Par contre la compression est toujours optimale et le fichier ne doit pas être connu avant de compresser. Il ne faut donc pas transmettre ou stocker la table des fréquences des symboles. De plus, l'algorithme est capable de travailler sur des flux de données (streaming), car il n'est pas nécessaire de connaitre les symboles à venir.

Limitations du codage de Huffman

- Introduction - Principe - Limitations du codage de Huffman - Propriétés - Anecdote - Utilisations

miniature

Pourrons-nous bientôt communiquer avec les dauphins grâce à l'IA ? 🐬

miniature

En déplaçant deux atomes, des chercheurs transforment le LSD en médicament surpuissant 💊

miniature

Des scientifiques parviennent à produire efficacement du carburant à partir de monoxyde de carbone 🛢️

miniature

Que nous apprend la découverte de cet insecte de 16 millions d'années ? 🐜

miniature

Avec 91km, l'accélérateur FCC fera passer le LHC pour un jouet ⚛️

miniature

Cette vitamine développe les fonctions cognitives du cerveau 🧠

miniature

Comment des impacts géants vaporisent les corps planétaires ☄️

miniature

Les Américains riches vivent moins longtemps que les Européens pauvres 💰

miniature

Attention à ce riz naturellement riche en arsenic 🍚

miniature

L'intelligence artificielle contre la mort subite 💀

miniature

L'inévitable formation d'un océan de magma basal sur Terre 🔥

miniature

Découverte d'une plante étrange sans chlorophylle 🌱

miniature

Existe-t-il des mélodies naturelles ? 🎶

miniature

Cette exoplanète présente une signature de vie bien plus forte que celle de la Terre 👽

miniature

L'origine énigmatique des rayons cosmiques les plus énergétiques ⚡

miniature

Le diagnostic de l'autisme remis en cause par l'intelligence artificielle 🩺

miniature

Imprimer en 3D avec la lumière du soleil ☀️

miniature

La pollution atmosphérique nuit gravement au cerveau 🧠

miniature

Le trou noir supermassif Ansky vient de se réveiller ⚫

miniature

Voici ce qui rend notre cerveau vraiment unique 🧠

miniature

Asymétrie matière-antimatière: une nouvelle pièce du puzzle dévoilée 🧩

miniature

Neige en inuit, goût en japonais... comment les langues décomposent la réalité ? 💬

miniature

La physique révèle les secrets d'un strike parfait au bowling 🎳

miniature

Le TDAH associé à la démence 🧠

miniature

Découverte d'une nouvelle forme d'intrication quantique, une première en 20 ans ⚛️

miniature

Le régime cétogène montre des surprises sur le cholestérol 🧐

miniature

Un tango observationnel révèle une Super-Terre 🔭

miniature

Cette expérience montre que la graisse brune augmente fortement la longévité 🕒

miniature

L'Univers comme jamais vu auparavant: les révélations du fond diffus cosmologique 🔭

miniature

C'est sérieux: de la bave pourrait révolutionner la conception de bioplastiques 🪱

miniature

Découverte: le trou noir central de notre galaxie pourrait anéantir la vie sur Terre 💥

miniature

Etude scientifique: ces aliments nous font vieillir 🍽️

miniature

Pourquoi notre visage est-il plus petit et délicat que celui des Néandertaliens ? 🤔

miniature

A 18 ans, il découvre 1,5 million d'objets célestes inconnus avec son algorithme d'IA 🌟

miniature

Que sont ces objets rouges et aplatis, qualifiés d'UFOs par les astronomes ? 🔭

miniature

Une méthode simple pour améliorer les performances en mathématiques 🧮

miniature

Que sont ces étranges éclairs rouges photographiés au-dessus de l'Himalaya ? ⚡

miniature

Nous descendons non pas d'un, mais d'au moins deux groupes anciens 🧬

miniature

Un nuage géant de 160 000 soleils découvert dans notre Voie lactée 🔭

miniature

Connaissez-vous le rat-kangourou musqué, ce marsupial à la démarche unique ? 🦘

miniature

Comment une poignée de traders a fait s'effondrer deux cryptomonnaies 📉

miniature

Première cartographie titanesque d'un cerveau, avec 500 millions de connexions neuronales 🧠

miniature

Cette double supernovae proche est inexorable, voici la date... qui va vous surprendre 💥

miniature

Un océan phosphorescent: comment s'explique ce phénomène rare et féerique ? 🌊

miniature

L'ELT pourrait-il découvrir une vie extraterrestre dès 2028 ? 🔭

miniature

Cet édulcorant tue les superbactéries résistantes 🍬

miniature

Les neutrinos, la clé de la gravité quantique ? 👀

miniature

En Italie, les éruptions explosives de ce volcan déjouent les pronostics 🌋

miniature

Que sont ces spaghettis au cœur de notre galaxie ? 🔭

miniature

Des scientifiques ont créé une "bombe intelligente" contre le cancer 🎯

Page générée en 0.091 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise