[News] Théorie des "petits mondes": quel est le centre de Wikipedia ?

Pour parler math...

Modérateur : Modérateurs

Répondre
Adrien
Site Admin
Messages : 23522
Inscription : 02/06/2004 - 18:58:53
Activité : Ingénieur
Localisation : 78
Contact :

[News] Théorie des "petits mondes": quel est le centre de Wikipedia ?

Message par Adrien » 26/06/2008 - 1:21:28

Quel est le centre de Wikipedia ? Et quel est son diamètre ? Voila par exemple quelques-unes des questions étranges qu’on peut se poser lorsqu’on étudie la théorie des “petits mondes”, ce champ des mathématiques qui analyse la configuration des relations au sein d’un réseau.

L’exemple le plus connu dans ce domaine est la notion des “six degrés de proximité” existant entre tous les êtres humains. Dès les années 60, Stanley Milgram (également connu pour ses expériences sur l’autorité) a montré qu’il était possible de relier tous les habitants de cette planète en passant environ par six intermédiaires. Depuis, l’idée a été reproduite dans de nombreux domaines, par exemple dans le cas du “jeu de Kevin Bacon“, qui consiste à se demander combien de connexions permettent de relier Kevin Bacon à n’importe quel autre acteur (il existe d’ailleurs une version avancée de ce jeu qui ne se limite pas à Kevin Bacon mais examine les relations entre deux comédiens pris au hasard).

Cette théorie des petits mondes est en train de devenir la nouvelle révolution scientifique à la mode, et on l’applique aujourd’hui tant à la physique qu’à la biologie ou à la sociologie, et bien sûr au web, la distance entre deux sites s’exprimant par le nombre de clics de souris nécessaires pour se rendre de la page de départ à celle d’arrivée. On ne s’étonnera donc pas qu’un certain Stephen Dohan l’ait appliqué aussi à Wikipedia, afin d’examiner les connexions reliant les différents articles.

L’idée en soi est excellente et prolonge les nombreux outils qui permettent déjà de documenter les évolutions de la plateforme. Elle pourrait permettre d’établir une cartographie des différents domaines de connaissance, de repérer des associations restées enfouies… Malheureusement, certaines idiosyncrasies de Wikipedia rendent ce projet difficile.

En théorie des réseaux, on appelle le “diamètre” la plus longue chaîne de connexions nécessaire pour unir deux éléments du réseau. Si le “diamètre” des relations humaines est d’environ 6, celui de Wikipedia, lui, tend à créer de la confusion : il est de 70 ! Mais ce chiffre ne signifie pas grand-chose, parce qu’il est le produit d’une série de 70 listes particulières, celles des astéroïdes du système solaire, organisées dans Wikipedia de telle manière qu’il faut parfois 70 clics pour aller d’une liste à une autre ! Si on corrige ce type d’aberration, en réalité, la “moyenne” des clics nécessaires pour se rendre d’un article à un autre est de 4,75.

L’autre question que s’est posée Stephen Dohan était la nature du “centre” de Wikipedia : c’est-à-dire l’article qui proposait le trajet le plus court vers tous les autres. Le vainqueur est “2007” qui est à 3,65 clics de n’importe quelle entrée de l’encyclopédie. Mais “2007″ est surtout une liste, ce qui le rend peu intéressant à analyser. Bizarrement le “vrai” centre de Wikipedia est “United Kingdom” avec une moyenne de 3,67 clics. Plus étrange encore, le second est Billie Jean King, une ancienne joueuse de tennis !

Sur la page de Dohan, on peut trouver un jeu “à la Kevin Bacon” qui permet de voir par soi même les connexions existantes entre deux articles. Ainsi nous apprenons qu’il n’existe que deux clics de distance entre Britney Spears et le philosophe Hegel, l’intermédiaire étant… la date du 14 novembre (mort du second, et vague référence à un article pour la première) !

Il semble donc qu’il reste du temps avant d’envisager une cartographie de Wikipedia comme un descriptif de la connaissance humaine. Pour ce faire, il faudrait exclure des calculs l’ensemble des articles qui pointent sur de trop nombreuses entrées sans apporter une contribution notable à leur signification (les dates, les pays, les lieux, sauf dans les articles spécifiquement historiques ou géographiques, bien sûr…).

Source: internetactu.net sous Licence Creative Commons by-nc

Avatar de l’utilisateur
Maulus
Messages : 4582
Inscription : 13/02/2007 - 12:07:12
Localisation : Epinal

Message par Maulus » 26/06/2008 - 10:00:24

utiliser ce genre de méthode d'analyse statistique c'est typiquement exagérer l'impact du spam de lien hypertext et de mots clés.

pour définir le centre d'un réseau de connaissance, il faut analyser le parcours de l'utilisateur et ce même parcours et influencé par le contenu de la page qu'il regarde, d'ou la subjectivité humaine de se genre de méthode.

définir un centre sur un tel réseau signifie pour moi, un recensement des occurences les plus recherchées/visitées puis dans un top 10 ou 100 de ces occurences, un classement par pays/langue/religion etc...

Chercher le sens caché derrière le fait que Britney soit à 3 click d'un philosophe n'amène un peu pret nul part :D
Par contre c'est un bon exemple du genre d'incohérence qu'entraine ce genre de méthode wahaha :D
Ce n'est pas le moindre charme d'une théorie que d'être réfutable, F. Nietzsche.

http://www.cieletespaceradio.fr

Oswald_le_fort
Messages : 1073
Inscription : 24/05/2007 - 7:52:01
Activité : Enseignant ou Chercheur
Localisation : Meyrin / CERN

Message par Oswald_le_fort » 26/06/2008 - 10:04:21

Maulus,
En fait, dans l'article il est fait mention du fait que les pages genre tout les evenements ce produisant a une date donnée ne sont pas utiles... Et le lien entre Britney et le philosophe se fait via une de ces pages... En plus, ici on parle de théorie mathématique des reseaux... C'est vachement spécifique, et la définition du centre du reseau c'est le point qui possede le plus de connexion et qui est relié a tous les autres par le minimum de correspondance. C'est la définition mathématique...

Victor
Messages : 17306
Inscription : 05/06/2006 - 21:30:44
Activité : Retraité
Contact :

Message par Victor » 26/06/2008 - 10:36:40

Pour Oswald je te propose de faire une expérience... Tu prends des concepts pas vraiment au hasard... Puis tu les mets sur un moteur de recherche... Tu verras qu'avec 6 mots différents, tu trouves toujours des réponses.... Ceci c'est grâce à ces génial moteurs de recherches

Avatar de l’utilisateur
buck
Messages : 5088
Inscription : 02/12/2006 - 13:22:55
Activité : Ingénieur
Localisation : Graz

Message par buck » 26/06/2008 - 10:47:34

??? victor arrete de parler a cote de la plaque stp ...
"Le soleil, avec toutes ces planetes qui gravitent sous sa gouverne, prend encore le temps de murir une grappe de raisin, comme s'il n'y avait rien de plus important. " Galilee

Victor
Messages : 17306
Inscription : 05/06/2006 - 21:30:44
Activité : Retraité
Contact :

Message par Victor » 26/06/2008 - 10:54:34

Mon petit monde est limité mais les informations que je reçois sont vite vidé de sens...Mon expérience vaut pour toutes les recherches... Si je cherche des liens, je trouve peu de corrélations.... je suppose que je suis pas plus mauvais observateur que toi Buck

Avatar de l’utilisateur
buck
Messages : 5088
Inscription : 02/12/2006 - 13:22:55
Activité : Ingénieur
Localisation : Graz

Message par buck » 26/06/2008 - 11:04:16

il y a une difference entre une recherche volotaire (ou tu defini toi meme tes criteres), et une correlation entre des choses qui a priori n'ont rien a avoir.
Si tes criteres sont bien definis , tes resultats seront a peu pres bon. (qui cherche trouve en general ..)
"Le soleil, avec toutes ces planetes qui gravitent sous sa gouverne, prend encore le temps de murir une grappe de raisin, comme s'il n'y avait rien de plus important. " Galilee

Avatar de l’utilisateur
melo
Messages : 222
Inscription : 02/10/2007 - 17:23:01

Message par melo » 26/06/2008 - 11:23:13

Perso je ne comprends pas l'intérêt de cette analyse, à la limite, le parcours de la chaine et le nombre de sous-chaines qu'il comporte soit, mais le centre ???? c'est abhérant, de plus ce centre sera toujours orienté en fonction de l'utilisateur et de sa recherche aussi je rejoins Maulus sur son analyse qui me parait pertinente, ayant fait quelques algorithmes de parcours de chaines (afin de déterminer le chemin le plus court, le nombre de connexions etc...) je ne vois pas ici in fine ce que cela apporte.

Oswald_le_fort
Messages : 1073
Inscription : 24/05/2007 - 7:52:01
Activité : Enseignant ou Chercheur
Localisation : Meyrin / CERN

Message par Oswald_le_fort » 26/06/2008 - 13:30:40

melo,
L'idée c'est de considere le reseau dans son ensemble, pas seulement le parcours d'un utilisateur... Si tu prends toutes les connexions et que tu cherche le noeud qui est relié à tout les autres avec un mlinimum de connexions (et / ou au plus grand nombre d'autres noeuds), tu peux définir le centre de ton reseau.

Avatar de l’utilisateur
melo
Messages : 222
Inscription : 02/10/2007 - 17:23:01

Message par melo » 26/06/2008 - 14:13:09

Oswald_le_fort a écrit :melo,
L'idée c'est de considere le reseau dans son ensemble, pas seulement le parcours d'un utilisateur... Si tu prends toutes les connexions et que tu cherche le noeud qui est relié à tout les autres avec un minimum de connexions (et / ou au plus grand nombre d'autres noeuds), tu peux définir le centre de ton reseau.


ok Oswald_le_fort,
mais puisque le centre peut très bien être un article sans aucun intérêt quel est le but de cette recherche ?
Ca ne permet pas d'accélerer une recherche, ni d'obtenir l'information recherché, je m'interroge juste sur son intérêt, merci tout de même pour ton explication.

Oswald_le_fort
Messages : 1073
Inscription : 24/05/2007 - 7:52:01
Activité : Enseignant ou Chercheur
Localisation : Meyrin / CERN

Message par Oswald_le_fort » 26/06/2008 - 14:37:47

Si j'ai bien compris, ils se sont rendu compte que pas mal d'articles étaient reliés par des pages qui ne sont pas utiles... Donc je dirais que l'idée c'est de retirer ces pages de l'analyse (comment faire est une autre question). Enfin, l'idée générale c'est de vérifier que la théorie mathématique fonctionne aussi bien dans des reseaux réels tels que ceux qui font que toi et moi sommes reliés physiquement, fonctionne aussi bien pour des reseaux purement virtuels tels que wikipedia...

yeti
Messages : 172
Inscription : 28/03/2008 - 9:42:42
Localisation : Moselle

Message par yeti » 26/06/2008 - 14:46:13

Je viens d'essayer... :sol:
Je suis partie du film "la soupe au choux" et j'ai essayé d'arrivé au violon (l'instrument de musique) sans passer par les dates... Même pas j'ai réussi ! :(

Avatar de l’utilisateur
Maulus
Messages : 4582
Inscription : 13/02/2007 - 12:07:12
Localisation : Epinal

Message par Maulus » 26/06/2008 - 14:56:51

merci pour les précisions Oswald.
Je suis d'accord que c'est purement arbitraire comme teste et que l'intéret c'est justement d'en arrivé à ces droleries afin d'affiner la loi mathématiques à son sujet d'expérimentation.

personnellement, c'est juste que dans le cas d'internet, à la vue de son fonctionnement et de son principe, je ne vois pas comment utiliser cette méthode de manière efficace et utilisable.

le principe de mot clé et de lien hypertext entraine à coup sûr des disproportion dans les résultats.
Ce n'est pas le moindre charme d'une théorie que d'être réfutable, F. Nietzsche.

http://www.cieletespaceradio.fr

Répondre