9. Indexation et intelligence artificielle
L'indexation est une pratique ancienne indispensable pour retrouver rapidement les documents voulus. Jusqu'à une époque récente, elle semblait réservée à l'intelligence humaine. Car indexer ne consiste pas à créer des index (tâche facilement automatisable) mais à affecter aux documents des indices, des marques significatives de leur contenu, à la suite d'une série d'opérations mentales complexes et encore mal connues.
Pourtant, l'indexation est atteinte à son tour par l'irrésistible progression des « machines à penser ».
• Genèse des recherches en indexation automatique
Plusieurs facteurs ont incité les chercheurs en informatique documentaire à tenter de concurrencer l'indexation humaine. D'abord, les contraintes et les insuffisances inhérentes à celle-ci : elle est coûteuse (il faut entre un quart d'heure et une heure pour indexer un document) ; elle est tributaire de la subjectivité de l'indexeur (deux analystes différents indexent rarement un document de manière rigoureusement identique).
À l'inverse, les coûts de traitement informatique ne cessent de baisser, et la machine est exempte de subjectivité.
Un autre avantage de l'indexation automatique est de pouvoir analyser par le même procédé les textes des auteurs et les requêtes de l'utilisateur, alors que dans un système traditionnel celui-ci doit s'adapter aux termes choisis par l'indexeur.
Encore faut-il que l'ordinateur puisse produire des formules d'indexation acceptables – sinon comparables à celles de l'indexeur. Or les dernières recherches en traitement informatique des langues (traduction automatique) et en sémantique (analyse conceptuelle, réseaux sémantiques, analyseur automatique de texte) ont mis à la disposition des concepteurs des outils efficaces, du moins pour les documents textuels, qui sont encore les plus nombreux.
[…]… pour nos abonnés, l'article se prolonge sur 15 pages…



