Ce moteur de recherche d'un nouveau genre bouscule nos habitudes 🔍

Publié par Cédric,
Auteur de l'article: Cédric DEPOND
Source: MIT Technology Review
Autres langues: EN, DE, ES, PT
2
Restez toujours informé: suivez-nous sur Google Actualités (icone ☆)

Et si le web devenait une base de données, lisible comme un livre ouvert ? Une startup technologique, Exa, s'est fixé cet objectif ambitieux avec son moteur de recherche, Websets. Promettant de transcender la logique des mots-clés, cette innovation pourrait remodeler notre manière de naviguer en ligne.


La recherche sur le Web: Avant / Après ?

Alors que près de deux milliards de sites Web se disputent notre attention, trouver une information précise relève parfois de la quête impossible. Les outils classiques, comme Google, s'appuient sur des classements basés sur des mots-clés. Mais ces systèmes, bien qu'efficaces pour des recherches simples, peinent à satisfaire les demandes complexes. C'est ici qu'Exa Websets fait son entrée.

Ce moteur de recherche, encore en phase de lancement, exploite une approche totalement nouvelle: les embeddings. Contrairement aux méthodes traditionnelles, cette technologie encode les informations en les regroupant par sens et contexte, plutôt qu'en associant des termes spécifiques. Résultat ? Des réponses qui vont droit au but.

Will Bryk, PDG d'Exa, explique que la méthode utilisée par Websets excelle dans le traitement de requêtes particulièrement complexes. Lors d'une démonstration, le moteur a répondu à une recherche détaillée portant sur "tous les doctorants ayant travaillé sur des produits pour développeurs, diplômés d'universités renommées, et tenant un blog". Websets a généré une liste exhaustive de noms, accompagnés de liens pointant vers leurs profils LinkedIn. Cette précision, inaccessible avec les moteurs traditionnels, illustre sa capacité à combiner une recherche sémantique fine avec une contextualisation poussée des résultats.

Mais cette précision a un coût. Exa a dû encoder des milliards de pages web, une tâche titanesque, bien qu'encore modeste comparée aux indexes colossaux de Google. Chaque recherche exige une puissance de calcul impressionnante, allongeant parfois le temps d'attente à plusieurs minutes. Un compromis que les utilisateurs acceptent volontiers pour obtenir des résultats sur mesure.

Démonstration de Exa Websets

En intégrant des techniques issues des modèles de langage avancés, Websets va au-delà des simples prédictions de mots pour anticiper les liens les plus pertinents. Selon Andrew Gao, étudiant en informatique, cet outil est particulièrement utile lorsque les termes précis manquent. Cependant, pour des questions directes, comme un fait isolé ou une définition, les moteurs traditionnels restent plus rapides.

Certains experts restent sceptiques. La technologie des embeddings, bien que puissante, peut entraîner des pertes d'information. Bryk en est conscient, mais affirme que son équipe travaille activement pour surmonter ces limites. L'objectif ultime: transformer l'expérience de recherche en une navigation aussi structurée qu'efficace.

Si le chemin vers un web organisé reste long, Exa offre un aperçu de ce que pourrait être l'avenir. Un moteur qui ne cherche pas seulement, mais comprend. Une révolution lente, mais prometteuse.

Qu'est-ce que la méthode des embeddings utilisée par Exa Websets ?


La méthode des embeddings repose sur un principe d'encodage numérique des informations textuelles pour en saisir le sens contextuel. Chaque mot, phrase ou document est transformé en une série de valeurs mathématiques qui traduisent leurs relations sémantiques.

Par exemple, des termes proches comme "chercheur" et "scientifique" sont représentés par des valeurs similaires, facilitant leur association. Cette représentation permet à l'algorithme de comprendre non seulement les mots eux-mêmes, mais aussi leur signification dans un contexte donné.

En pratique, cela signifie que le moteur de recherche peut établir des connexions pertinentes entre des requêtes complexes et des données du web, même en l'absence de mots-clés exacts.

Enfin, cette méthode est particulièrement utile dans les cas où les relations thématiques et les requêtes à plusieurs niveaux doivent être explorées, surpassant les limites des simples correspondances de mots-clés.
Page générée en 0.137 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise