Abonnez-vous à Universalis pour 1 euro

MOTEURS DE RECHERCHE

Moteurs spécialisés

Recherche multimédia

Les premiers moteurs ont été développés pour la recherche de textes. Les documents publiés sous forme d'images, de sons ou de vidéos ont nécessité d'autres principes de repérage et d'indexation. En effet, en dehors du nom des fichiers, ces documents ne comportent pas de chaînes de caractères pour en caractériser le contenu. Les moteurs spécialisés dans la recherche d'images, de vidéos ou de fichiers son s'appuient principalement sur les mots qui environnent le média dans la page Web où il est présenté et sur les textes alternatifs fournis par les concepteurs de page. Pour les images, la recherche à partir de reconnaissance automatique de formes commence à être expérimentée. Par exemple, Google Images propose une option pour détecter les images correspondant à des visages. Dans le domaine du son ou de la vidéo, la reconnaissance automatique de la parole permet de retranscrire les dialogues pour en extraire des termes d'indexation. Ces technologies ne sont mises en œuvre pour l'instant que dans des applications très ciblées.

Métamoteurs

Un métamoteur est une application qui ne dispose pas de son propre index. Il ne collecte donc pas les documents de manière autonome mais permet d'interroger simultanément un ou plusieurs moteurs existants. Sa valeur ajoutée tient soit à sa portée – il bénéficie de la couverture des différents moteurs interrogés (par exemple, dogpile.com) –, soit au traitement spécifique des résultats (Copernic Agent) ou encore à leur présentation originale (search-cube.com). Les métamoteurs ont été les premiers à proposer les résultats classés par catégories (clustering, comme le fait Clusty), et à fournir une aide à la reformulation de requêtes. Certains se sont spécialisés dans la préservation de la vie privée en masquant l'adresse IP de l'ordinateur qui interroge le moteur (Ixquick, Duckduckgo).

Moteurs verticaux

Un moteur vertical n'indexe que certains sites spécialisés, de manière plus approfondie que ne le ferait un moteur généraliste. L'index est restreint aux documents concernant certains sujets (par exemple, la santé, la médecine, les jeux ou les compagnies aériennes), à un ensemble prédéterminé de sites. Certains moteurs verticaux reposent sur une base spécifique de données, comme Legifrance pour les textes législatifs français.

Moteurs de recherche et Web sémantique

Les documents de première génération publiés sur le Web étaient peu structurés. Des informations importantes – faciles à trouver sur les éditions imprimées – comme le nom de l'auteur, la date de publication ou encore le type de document n'y sont pas forcément repérables de manière automatique. Ainsi, la requête « livres Victor Hugo » sur un moteur de recherche actuel fournit en résultats des pages Web présentant les œuvres de l'écrivain, d'autres évoquant des ouvrages parlant de lui, qu'il s'agisse de biographies ou d'analyses de ses œuvres. Les travaux de recherche sur le Web sémantique visent à doter les documents de données plus précises, celles-ci pouvant être liées entre elles. On parle de métadonnées pour désigner ces qualifications complémentaires qui apportent des informations à propos des documents. À l'heure actuelle, les langages XML (extensible markup language) et RDF (resource description framework) permettent de représenter de telles métadonnées. En exploitant ces informations, les moteurs devraient gagner en précision. Dans le domaine de l'information scientifique et technique, la plate-forme de recherche Isidore met en œuvre de tels traitements.

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

Classification

Pour citer cet article

Brigitte SIMONNOT. MOTEURS DE RECHERCHE [en ligne]. In Encyclopædia Universalis. Disponible sur : (consulté le )

Médias

Fonctionnement d'un moteur de recherche - crédits : Encyclopædia Universalis France

Fonctionnement d'un moteur de recherche

Infrastructure matérielle des moteurs de recherche - crédits : wavebreakmedia/ Shutterstock

Infrastructure matérielle des moteurs de recherche

Autres références

  • BIBLIOTHÈQUES NUMÉRIQUES

    • Écrit par Yannick MAIGNIEN
    • 5 198 mots
    • 1 média
    ...compression graphique et d'image – MPEG –, encapsulant des métadonnées complexes, va dans le sens de cette intégration des documents textuels scannérisés. Actuellement, si l'OCR reste parfois approximative, elle s'avère suffisante pour des moteurs de recherchestatistique qui localiseront ensuite...
  • CONSOMMATION - Comportement du consommateur

    • Écrit par Bernard DUBOIS, Marc VANHUELE
    • 9 030 mots
    • 1 média
    ...emprise. Mais, dans tous les cas, savoir qui sont les consommateurs ayant considéré qu’ils ont un besoin plus ou moins urgent est évidemment très utile. Les moteurs de recherche sur Internet ont révolutionné le marketing parce que c’est là que les consommateurs signalent de plus en plus souvent leurs besoins....
  • INTERNET - Les applications

    • Écrit par Danièle DROMARD, Dominique SERET
    • 5 030 mots
    Les moteurs de recherche ( Google, Yahoo!, AltaVista...) sont des serveurs spécialisés dans la recherche d'informations sur le Web. Leurs banques de données textuelles sont alimentées en permanence par des programmes automatiques d'indexation qui regroupent par thèmes les informations recueillies....
  • MÉDECINE ET INTERNET

    • Écrit par Philippe MARREL, Elisabeth PARIZEL, René WALLSTEIN
    • 5 396 mots
    • 3 médias
    ...les recherches. En ce qui concerne Internet, véritable bibliothèque planétaire – on parlerait plutôt de base de données aujourd’hui –, c’est le rôle des moteurs de recherche d’établir le catalogue et d’attribuer les mots clés. Pour cela, le moteur passe systématiquement en revue les millions de sites de...

Voir aussi