INDEXATION

Carte mentale

Élargissez votre recherche dans Universalis

Indexation et intelligence artificielle

L'indexation est une pratique ancienne indispensable pour retrouver rapidement les documents voulus. Jusqu'à une époque récente, elle semblait réservée à l'intelligence humaine. Car indexer ne consiste pas à créer des index (tâche facilement automatisable) mais à affecter aux documents des indices, des marques significatives de leur contenu, à la suite d'une série d'opérations mentales complexes et encore mal connues.

Pourtant, l'indexation est atteinte à son tour par l'irrésistible progression des « machines à penser ».

Genèse des recherches en indexation automatique

Plusieurs facteurs ont incité les chercheurs en informatique documentaire à tenter de concurrencer l'indexation humaine. D'abord, les contraintes et les insuffisances inhérentes à celle-ci : elle est coûteuse (il faut entre un quart d'heure et une heure pour indexer un document) ; elle est tributaire de la subjectivité de l'indexeur (deux analystes différents indexent rarement un document de manière rigoureusement identique).

À l'inverse, les coûts de traitement informatique ne cessent de baisser, et la machine est exempte de subjectivité.

Un autre avantage de l'indexation automatique est de pouvoir analyser par le même procédé les textes des auteurs et les requêtes de l'utilisateur, alors que dans un système traditionnel celui-ci doit s'adapter aux termes choisis par l'indexeur.

Encore faut-il que l'ordinateur puisse produire des formules d'indexation acceptables – sinon comparables à celles de l'indexeur. Or les dernières recherches en traitement informatique des langues (traduction automatique) et en sémantique (analyse conceptuelle, réseaux sémantiques, analyseur automatique de texte) ont mis à la disposition des concepteurs des outils efficaces, du moins pour les documents textuels, qui sont encore les plus nombreux.

Fonction documentaire du texte et mots vides

On a observé depuis longtemps un trait remarquable des documents textuels : non seulement ils nous livrent des informations, mais ils nous renseignent aussi sur le sujet traité puisqu'il est impossible de pa [...]


1  2  3  4  5
pour nos abonnés,
l’article se compose de 16 pages



Médias de l’article

Maison des sciences de l'homme

Maison des sciences de l'homme
Crédits : C. Mouly

photographie

SYNTOL

SYNTOL
Crédits : Encyclopædia Universalis France

tableau

Algèbre de Boole

Algèbre de Boole
Crédits : Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.

vidéo




Écrit par :

  • : (formerly) director of central library services and Goldsmith'Librarian, University of London, England.
  • : agrégé de l'Université, docteur en linguistique

Classification


Autres références

«  INDEXATION  » est également traité dans :

BIBLIOTHÈQUES NUMÉRIQUES

  • Écrit par 
  • Yannick MAIGNIEN
  •  • 5 182 mots
  •  • 1 média

Dans le chapitre « Vers un Web sémantique »  : […] Le modèle de Gallica ou des bibliothèques numériques établi par les grandes bibliothèques nationales se calquait peu ou prou sur celui de la bibliothèque physique : identification dans le catalogue d'un document édité et numérisé, recherche dans les zones plein texte grâce à un moteur. Cette informatisation avait gagné petit à petit l'ensemble des fonctions de gestion des catalogues et inventaires […] Lire la suite☛ http://www.universalis.fr/encyclopedie/bibliotheques-numeriques/#i_94441

MOTEURS DE RECHERCHE

  • Écrit par 
  • Brigitte SIMONNOT
  •  • 4 126 mots
  •  • 3 médias

Dans le chapitre « Indexation des documents »  : […] Les pages Web collectées sont analysées par un logiciel qui procède à leur indexation. L'indexation consiste à caractériser les pages par des mots clés pour permettre de les retrouver. Dans le cas des moteurs de recherche, l'extraction de mots ou de groupes de mots à partir des documents est automatisée. Le moteur constitue un index qui, pour chaque mot repéré, renvoie aux pages où ce mot est pr […] Lire la suite☛ http://www.universalis.fr/encyclopedie/moteurs-de-recherche/#i_94441

MOYEN ÂGE - La pensée médiévale

  • Écrit par 
  • Alain de LIBERA
  •  • 22 370 mots

Dans le chapitre « L'homme qui lit »  : […] Le premier fondement du rapport de l'homme médiéval au texte qu'il lit est à la fois matériel et psychologique : il appartient à l'histoire du livre en tant que tel. On peut le situer dans les trois ou quatre premiers siècles de l'ère chrétienne, quand le codex , « livre » formé par la réunion de cahiers de parchemin, remplace le volumen , manuscrit en forme de rouleau. On ne doit pas sous-estimer […] Lire la suite☛ http://www.universalis.fr/encyclopedie/moyen-age-la-pensee-medievale/#i_94441

TERMINOLOGIE

  • Écrit par 
  • Loïc DEPECKER
  •  • 6 205 mots

Dans le chapitre « Structurer l'information »  : […] La terminologie, en effet, donne forme à l'information en la structurant par le biais d'unités linguistiques précisément définies. Ces unités donnent de plus accès au concept, difficilement manipulable autrement. La question des ontologies par exemple – objets que manipule toute entreprise (composants, produits, unités de mesure, etc.) – débouche nécessairement sur la manière de les désigner. La t […] Lire la suite☛ http://www.universalis.fr/encyclopedie/terminologie/#i_94441

TRAITEMENT AUTOMATIQUE DES LANGUES

  • Écrit par 
  • Anne ABEILLÉ
  •  • 8 408 mots
  •  • 5 médias

Dans le chapitre « Les principaux types d'applications »  : […] Toutes les activités mettant en jeu de la parole ou du texte peuvent donner lieu à des produits ou services de type T.A.L. Le T.A.L. permet soit le développement de produits ou de services entièrement nouveaux tels que le téléphone traducteur ou les clés vocales (dispositif d'accès qui s'ouvre en reconnaissant la voix des locuteurs autorisés), soit l'amélioration (en productivité ou en qualité des […] Lire la suite☛ http://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/#i_94441

Voir aussi

Pour citer l’article

Douglas J. FOSKETT, Jacques MANIEZ, « INDEXATION », Encyclopædia Universalis [en ligne], consulté le 20 janvier 2020. URL : http://www.universalis.fr/encyclopedie/indexation/