Pondération de contextes - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Algorithme - Performances - Propriétés - Implémentations

Introduction

Les algorithmes de pondération de contextes (ou CM pour Context Mixing) constituent une famille d'algorithmes de compression de données sans perte, statistiques et adaptatifs.

La pondération de contextes est encore aujourd'hui un domaine de recherche active en compression de données, en intelligence artificielle et en apprentissage automatique.

Algorithme

Principe

L'objectif de la pondération de contextes est d'apporter une solution au principal problème des algorithmes de prédiction par reconnaissance partielle, à savoir la difficulté de concevoir un modèle statistique capable de représenter n'importe quel type de données que l'on voudrait pouvoir compresser.

Un CM utilise plusieurs modélisations statistiques indépendantes (donc plus simples) pour évaluer la probabilité des différents symboles.

En regroupant ces différentes modélisations ayant chacune des avantages propres, la pondération de contexte est censée offrir une fiabilité supérieure dans la prédiction que chaque modélisation prise séparément.

Les différentes entrées d'un CM sont en général adaptées à des types de données différents. Par exemple un CM peut mixer les sorties d'un prédicteur spécialisé pour le texte et d'un autre spécialisé pour les images, chacun étant à priori plus performant sur le type de données pour lequel il est spécialisé ; il devrait ainsi approcher les performances du prédicteur spécialisé pour le texte sur le texte et celles du prédicteur spécialisé pour les images sur les images.

Prédicteur

Le rôle d'un prédicteur est d'estimer, dans un contexte donné, la probabilité d'apparition des différents symboles. La façon dont le prédicteur évalue cette probabilité est indépendante de l'algorithme de pondération de contextes ; en fait, chaque prédicteur pourrait être utilisé indépendamment en entrée d'un codage arithmétique, dans le cadre d'un algorithme de prédiction par reconnaissance partielle, par exemple.

L'apport de la pondération de contextes est de multiplier des prédicteurs dont les modèles statistiques se complètent : pour que la démarche ait un intérêt, il faut que chaque prédicteur soit meilleur que les autres dans au moins un domaine.

Mixeur

Le rôle d'un mixeur est de pondérer les estimations de probabilité des différents prédicteurs afin de donner le plus d'importance possible à la meilleure prédiction et de limiter au maximum les erreurs dues à des prédictions erronées. Le mixeur est donc le cœur de la pondération de contextes.

Le mixeur le plus simple possible effectue une moyenne des estimations des différents prédicteurs. En pratique, ce type de mixeur n'a qu'un intérêt très limité : cela revient à lisser les fluctuations dans la qualité des différentes prédictions.

Les mixeurs plus avancés ajustent leur pondération au cours de la compression. Cela peut être fait suivant le type de flux en entrée (le mixeur favorise alors certains prédicteurs de façon prédéfinie), ou suivant un algorithme d'optimisation par apprentissage automatique comme une descente de gradient ou un réseau de neurones (le mixeur favorise alors certains prédicteurs de façon intelligente). En pratique, les deux approches sont souvent combinées.

Estimation secondaire

Afin de rendre la prédiction finale la plus sûre possible, certaines implémentations intègrent une estimation secondaire (SSE pour Secondary Symbol Estimation).

Il s'agit d'utiliser un prédicteur supplémentaire (différent des prédicteurs déjà utilisés), associant un contexte et la prédiction pondérée telle qu'obtenue par le mixeur pour estimer une nouvelle fois la probabilité des différents symboles.

Il est bien évidemment possible de procéder à plusieurs SSE et d'utiliser plusieurs mixeurs ; la seule contrainte étant d'utiliser la même architecture à la compression et à la décompression. Il faut néanmoins compter avec les problèmes de performance inhérents à la multiplication des calculs.

À titre d'exemple, PAQAR utilise 7 types de prédicteurs, 99 contextes distincts (et autant d'instances de prédicteur), 12 mixeurs de premier niveau, chacun d'entre eux donne lieu à une estimation secondaire, ces 12 estimations secondaires sont suivies de 5 estimations tertiaires et un mixeur de second niveau délivre la prédiction finale.

Performances

- Introduction - Algorithme - Performances - Propriétés - Implémentations

Grande avancée sur la compréhension de l'origine des tumeurs

Il y a 9 heures

La malbouffe consommée à l'adolescence a des impacts irréversibles sur la mémoire

Il y a 9 heures

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Il y a 14 heures

La moelle épinière possède sa propre mémoire

Il y a 14 heures

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

Il y a 16 heures

Des humains ont vécu dans cet immense tube de lave il y a 7000 ans

Il y a 16 heures

L'anxiété et la dépression peuvent diminuer grâce à cette stimulation transcrânienne

Il y a 1 jour

Le bon ratio oméga-6/oméga-3 dans l'assiette pour lutter contre l'obésité

Il y a 1 jour

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Il y a 1 jour

Cette nouvelle approche permet de cibler les cellules cancéreuses pour les combattre

Il y a 1 jour

Intel dévoile le plus grand ordinateur neuromorphique au monde, imitant le cerveau humain

Il y a 1 jour

Cette créature expliquerait notre réaction instinctive de combat ou de fuite

Il y a 1 jour

Les traumatismes de l'enfance altèrent les fonctions musculaires en vieillissant

Il y a 2 jours

Pourquoi nous gratouillons-nous si souvent pour rien ?

Il y a 2 jours

Découverte d'un serpent géant, le plus grand de tous les temps ?

Il y a 2 jours

Découverte d'un nouveau principe de mouvement dans les cristaux liquides

Il y a 2 jours

Une concentration extrême de matière noire révélée par cet anneau d'Einstein

Il y a 2 jours

Comment les émissions des véhicules à essence se transforment en particules respirables

Il y a 2 jours

L'atmosphère de Vénus fuit dans l'espace

Il y a 3 jours

Quand la lutte contre la pollution de l'air contribue au réchauffement climatique: le paradoxe environnemental

Il y a 3 jours

Un trou noir dormant géant découvert dans notre voisinage cosmique

Il y a 3 jours

Grippe aviaire: le risque de propagation aux humains "extrêmement préoccupant" d'après l'OMS

Il y a 3 jours

Le secret des crânes coniques et des dents limées des Vikings

Il y a 3 jours

Les terres rares, loin d'être rares, affectent les plantes

Il y a 3 jours

La marine américaine développe sa première arme à micro-ondes contre les drones

Il y a 4 jours

Premier atlas de l'ovaire humain: un pas vers l'ovaire artificiel

Il y a 4 jours

La vision suffit pour produire les mouvements collectifs (vidéo)

Il y a 4 jours

Comment la Voie lactée a-t-elle influencé l'Egypte antique ?

Il y a 4 jours

Coopérer ou rivaliser: comment décide notre cerveau ?

Il y a 4 jours

S'inspirer des os de géants pour la construction

Il y a 5 jours

Rigidité artérielle: un nouvel indicateur pour prévenir les maladies cardiovasculaires

Il y a 5 jours

Pourquoi les femmes seules consomment-elles plus de sucreries ?

Il y a 5 jours

Que faut-il savoir sur les PFAS, ces "polluants éternels" ?

Il y a 5 jours

Découverte: ces substances courantes accélèrent le vieillissement

Il y a 6 jours

Des scientifiques identifient le meilleur moment de la journée pour faire du sport

Il y a 6 jours

Cette rupture technologique pourrait décupler la capacité des disques durs

Il y a 6 jours

Cycle menstruel: une étude scientifique établit un lien avec la Lune

Il y a 6 jours

Quand un trio d'étoiles devient un couple: une histoire cataclysmique retracée

Il y a 6 jours

Ce petit ver possède des yeux immenses: pourquoi ?

Il y a 6 jours

D'où vient cette structure fractale observée dans une bactérie ?

Il y a 7 jours

Découverte majeure dans les allergies respiratoires

Il y a 7 jours

Voici ce qui a produit la lumière la plus lumineuse jamais détectée dans l'Univers

Il y a 7 jours

Propagation inquiétante de la "mouche noire" suceuse de sang en Allemagne

Il y a 7 jours

Le hasard confère le prix Turing et 1 million de dollars au mathématicien Avi Wigderson

Il y a 7 jours

AI Act: comment encadrer l'intelligence artificielle en Europe ?

Il y a 7 jours

Quelle est cette forme étrange photographiée près de la Lune ?

Il y a 8 jours

Si vous avez déjà eu une entorse de la cheville, attention à ceci

Il y a 8 jours

Démonstration d'une nouvelle technologie de lévitation, stable et sans supraconductivité

Il y a 8 jours

Ces indices d'une rupture imminente de la faille de San Andreas

Il y a 8 jours

Cet effet inattendu de la musculation sur la mémoire

Il y a 8 jours

Populaires

Découverte d'un serpent géant, le plus grand de tous les temps ?

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Grande avancée sur la compréhension de l'origine des tumeurs

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

La malbouffe consommée à l'adolescence a des impacts irréversibles sur la mémoire

Toutes les ventes flash et Codes Promos Amazon

Cdiscount: les meilleures réductions actuelles

Page générée en 0.041 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise