Iconographie des corrélations - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Historique - Sélection des liens remarquables - Qu’est-ce qu’une corrélation « remarquable » ? - Algorithme de l’iconographie des corrélations - Instants remarquables de l’analyse - Choix du seuil - Position des points sur le papier - Retrait d’une influence évidente - Organisation des liens - Base de connaissance associée au schéma - Interactions logiques remarquables - Champs d’application de l’iconographie des corrélations

Introduction

En analyse des données, l'iconographie des corrélations est une méthode qui consiste à remplacer une matrice de corrélation par un schéma où les corrélations « remarquables » sont représentées par un trait plein (corrélation positive), ou un trait pointillé (corrélation négative).

Cette idée apparaît aussi dans les modèles graphiques gaussiens utilisés notamment en cartographie du génome. Mais l’iconographie des corrélations est plus générale en ce qu’elle ne fait pas d’hypothèse sur la distribution gaussienne, ou non, des variables, et repose uniquement sur l’aspect géométrique du coefficient de corrélation.

Représentation de la proximité des profils alimentaires en Europe.

Historique

L’idée première de l’iconographie des corrélations remonte à 1975. Appliquée d’abord à la géochimie marine, elle fit l’objet d’une thèse d’état en 1981, et d’un article dans les Cahiers de l’Analyse des Données en 1982. Après cela, l’application de la méthode dans de nombreuses branches de l’industrie aérospatiale pendant une quinzaine d’année, explique, paradoxalement, la relative confidentialité dans laquelle elle est restée longtemps, les entreprises ne souhaitant pas en général crier leurs solutions sur les toits. Depuis la création en 1997 d’une première société diffusant un logiciel basé sur l’iconographie des corrélations, et son enseignement dans certaines universités, la bibliographie s’est largement étendue, en particulier dans les secteurs médical et astrophysique (spectrométrie de masse).

Cette présentation, à visée pédagogique, s'inspire des documents cités en référence.

Sélection des liens remarquables

Illustrons-la sur un petit exemple : Lors d’un contrôle mathématique d'un niveau de classe de troisième, huit élèves de la sixième à la terminale, dont nous connaissons le poids, l'âge et l’assiduité, ont obtenu les notes suivantes :

Données originelles
Élève	Poids	Âge	Assiduité	Note
e1	52	12	12	5
e2	59	12,5	9	5
e3	55	13	15	9
e4	58	14,5	5	5
e5	66	15,5	11	13,5
e6	62	16	15	18
e7	63	17	12	18
e8	69	18	9	18

Matrice de corrélation
	Poids	Âge	Assiduité	Note
Poids	1
Âge	0,885	1
Assiduité	-0,160	-0,059	1
Note	0,774	0,893	0,383	1

Plaçons les quatre variables au hasard sur le papier, et traçons un trait entre deux d’entre elles chaque fois que leur corrélation est supérieure au seuil de 0,3 en valeur absolue.

Au vu de ce schéma, la corrélation (poids,note) = 0.774, relativement forte, donne à penser que le poids a plus d’influence sur la note que l’assiduité ! Mais, d’autre part, nous avons les corrélations (poids,âge) = 0,885, et (âge,note) = 0,893.

À partir de ces 3 coefficients de « corrélation totale », la formule de la « corrélation partielle » donne : Corrélation (poids,note) à âge constant : = -0,08

La corrélation entre note et poids, à âge constant a fortement baissé (elle est même légèrement négative). En d’autres termes, le poids n’a pas d’influence sur la note. Cela n’est guère surprenant. Effaçons le lien entre poids et note :

En définitive, un lien n’est pas tracé,

soit parce que sa corrélation totale est inférieure au seuil, en valeur absolue,
soit parce qu’il existe au moins une corrélation partielle inférieure au seuil, en valeur absolue, ou de signe contraire à la corrélation totale.

Il n’y a pas lieu, ici, d’effacer d’autres liens, comme on le vérifie à partir des valeurs des autres corrélations partielles :

Corrélation (poids,note) à assiduité constante : = 0,92

Corrélation (âge,poids) à note constante : = 0,68

Corrélation (âge,poids) à assiduité constante : = 0,89

Corrélation (âge,note) à poids constant : = 0,71

Corrélation (assiduité,poids) à note constante : = -0,78

Corrélation (assiduité,poids) à âge constant : = -0,23

Corrélation (assiduité,note) à poids constant : = 0,81

Corrélation (assiduité,note) à âge constant : = 0,97

Corrélation (assiduité,âge) à poids constant : = 0,18

Corrélation (assiduité,âge) à note constante : = -0,97

Puisque le nombre de variables est m = 4, il y a m.(m-1)/2 = 6 couples distincts de variables et, pour chaque couple, (m-2) = 2 coefficients de corrélation partielle.

Soulignons ici une différence importante entre l’Iconographie des Corrélations et le modèle graphique gaussien :

Nous venons de voir que l’iconographie des corrélations s’appuie sur (m-2).m.(m-1)/2 = 12 coefficients de corrélations partielles, calculés, chacun, par rapport à une seule variable, donc sans mélanger les effets de chacune d’elles. Au contraire le modèle graphique gaussien repose sur les seuls m.(m-1)/2 = 6 coefficients de corrélations partielles par rapport aux (m-2) autres variables. Il agrège donc une multiplicité de relations triangulaires et en retient une sorte de moyenne (matrice de corrélation partielle de chaque couple de variable par rapport à toutes les autres variables). Il perd la mise en évidence d’une variable particulière expliquant ou infirmant la relation entre deux variables.

L’iconographie des corrélations permet donc d’augmenter à la fois la quantité et la qualité de l’information utilisée.

Qu’est-ce qu’une corrélation « remarquable » ?

Grande avancée sur la compréhension de l'origine des tumeurs

Il y a 1 heure

La malbouffe consommée à l'adolescence a des impacts irréversibles sur la mémoire

Il y a 1 heure

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Il y a 6 heures

La moelle épinière possède sa propre mémoire

Il y a 6 heures

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

Il y a 8 heures

Des humains ont vécu dans cet immense tube de lave il y a 7000 ans

Il y a 8 heures

L'anxiété et la dépression peuvent diminuer grâce à cette stimulation transcrânienne

Il y a 1 jour

Le bon ratio oméga-6/oméga-3 dans l'assiette pour lutter contre l'obésité

Il y a 1 jour

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Il y a 1 jour

Cette nouvelle approche permet de cibler les cellules cancéreuses pour les combattre

Il y a 1 jour

Intel dévoile le plus grand ordinateur neuromorphique au monde, imitant le cerveau humain

Il y a 1 jour

Cette créature expliquerait notre réaction instinctive de combat ou de fuite

Il y a 1 jour

Les traumatismes de l'enfance altèrent les fonctions musculaires en vieillissant

Il y a 2 jours

Pourquoi nous gratouillons-nous si souvent pour rien ?

Il y a 2 jours

Découverte d'un serpent géant, le plus grand de tous les temps ?

Il y a 2 jours

Découverte d'un nouveau principe de mouvement dans les cristaux liquides

Il y a 2 jours

Une concentration extrême de matière noire révélée par cet anneau d'Einstein

Il y a 2 jours

Comment les émissions des véhicules à essence se transforment en particules respirables

Il y a 2 jours

L'atmosphère de Vénus fuit dans l'espace

Il y a 3 jours

Quand la lutte contre la pollution de l'air contribue au réchauffement climatique: le paradoxe environnemental

Il y a 3 jours

Un trou noir dormant géant découvert dans notre voisinage cosmique

Il y a 3 jours

Grippe aviaire: le risque de propagation aux humains "extrêmement préoccupant" d'après l'OMS

Il y a 3 jours

Le secret des crânes coniques et des dents limées des Vikings

Il y a 3 jours

Les terres rares, loin d'être rares, affectent les plantes

Il y a 3 jours

La marine américaine développe sa première arme à micro-ondes contre les drones

Il y a 4 jours

Premier atlas de l'ovaire humain: un pas vers l'ovaire artificiel

Il y a 4 jours

La vision suffit pour produire les mouvements collectifs (vidéo)

Il y a 4 jours

Comment la Voie lactée a-t-elle influencé l'Egypte antique ?

Il y a 4 jours

Coopérer ou rivaliser: comment décide notre cerveau ?

Il y a 4 jours

S'inspirer des os de géants pour la construction

Il y a 5 jours

Rigidité artérielle: un nouvel indicateur pour prévenir les maladies cardiovasculaires

Il y a 5 jours

Pourquoi les femmes seules consomment-elles plus de sucreries ?

Il y a 5 jours

Que faut-il savoir sur les PFAS, ces "polluants éternels" ?

Il y a 5 jours

Découverte: ces substances courantes accélèrent le vieillissement

Il y a 6 jours

Des scientifiques identifient le meilleur moment de la journée pour faire du sport

Il y a 6 jours

Cette rupture technologique pourrait décupler la capacité des disques durs

Il y a 6 jours

Cycle menstruel: une étude scientifique établit un lien avec la Lune

Il y a 6 jours

Quand un trio d'étoiles devient un couple: une histoire cataclysmique retracée

Il y a 6 jours

Ce petit ver possède des yeux immenses: pourquoi ?

Il y a 6 jours

D'où vient cette structure fractale observée dans une bactérie ?

Il y a 7 jours

Découverte majeure dans les allergies respiratoires

Il y a 7 jours

Voici ce qui a produit la lumière la plus lumineuse jamais détectée dans l'Univers

Il y a 7 jours

Propagation inquiétante de la "mouche noire" suceuse de sang en Allemagne

Il y a 7 jours

Le hasard confère le prix Turing et 1 million de dollars au mathématicien Avi Wigderson

Il y a 7 jours

AI Act: comment encadrer l'intelligence artificielle en Europe ?

Il y a 7 jours

Quelle est cette forme étrange photographiée près de la Lune ?

Il y a 8 jours

Si vous avez déjà eu une entorse de la cheville, attention à ceci

Il y a 8 jours

Démonstration d'une nouvelle technologie de lévitation, stable et sans supraconductivité

Il y a 8 jours

Ces indices d'une rupture imminente de la faille de San Andreas

Il y a 8 jours

Cet effet inattendu de la musculation sur la mémoire

Il y a 8 jours

Populaires

Découverte d'un serpent géant, le plus grand de tous les temps ?

Grande avancée sur la compréhension de l'origine des tumeurs

La malbouffe consommée à l'adolescence a des impacts irréversibles sur la mémoire

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

Toutes les ventes flash et Codes Promos Amazon

Cdiscount: les meilleures réductions actuelles

Page générée en 0.207 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise