Abonnez-vous à Universalis pour 1 euro

INDEXATION

La recherche dans un index

Un bon index présente une structure intellectuelle complexe, et une certaine maîtrise est essentielle pour toute recherche, si simple qu'elle ait d'abord paru. Il faut concevoir une « stratégie de recherche » qui conduise le plus efficacement, donc le plus économiquement, jusqu'à l'information requise. Quand on consulte un fichier informatisé, cet itinéraire est celui qui correspond au temps de connexion le plus court.

Même les index par auteurs posent des problèmes. Un auteur peut avoir pris des pseudonymes, avoir écrit sous plusieurs noms, avoir publié en collaboration comme coauteur. Les institutions produisent des documents dont elles sont auteur collectif, sans nom de personne. Certains documents ne portent pas de nom d'auteur et sont catalogués comme « anonymes ». Toute stratégie de consultation exige donc qu'on connaisse d'abord bien les principes selon lesquels l'index a été conçu, c'est-à-dire le système des entrées et des renvois. Cela implique qu'on sache de quelle manière l'entrée figurant dans l'index désigne le document indexé et, bien qu'il existe un grand nombre de normes régissant ce genre de détails, aucun, pour l'instant, n'est universellement admis.

Algèbre de Boole - crédits : Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.

Algèbre de Boole

Celui qui consulte un index matières a tout particulièrement besoin d'une stratégie de recherche. Dans une première étape, il procédera à une analyse précise afin d'identifier le sujet de sa recherche, par exemple en utilisant un ensemble de termes empruntés à des catégories qui s'excluent les unes les autres, comme c'est le cas dans l'analyse par facettes : objets, parties, propriétés, processus, etc. Lorsque les termes d'un index sont choisis dans une liste ou un thesaurus, il faut consulter cette source afin de savoir quels termes l'index utilise pour désigner le sujet recherché. La plupart des chercheurs commencent par énoncer leur sujet de façon très générale, bien que ce ne soit pas la meilleure manière de procéder. Dans des index imprimés comme l'étaient ceux du C.N.R.S., on peut, en cherchant un terme trop général, passer à côté de documents qui sont indexés par des descripteurs plus spécifiques. Dans un index informatisé (PASCAL et MYRIADE pour le C.N.R.S.), si on utilise un terme trop large, on se voit livrer un nombre de références tel qu'on ne pourra pas les exploiter en temps réel, si ce n'est à un coût prohibitif. Il faut donc ajouter des termes au descripteur choisi pour le rendre plus spécifique. Cela sera facilité par une analyse initiale détaillée du sujet. La plupart des fichiers informatisés se prêtent à des recherches qui s'inspirent de la logique de Boole à laquelle elles empruntent les relations AND, OR et NOT (ET, OU et SAUF).

– Terme A OU terme B : affiche sur l'écran les références qui contiennent soit l'un, soit l'autre terme ; il s'agit là de l'étape la plus générale de la recherche.

– Terme A SAUF terme B : affiche les références qui contiennent le premier terme, mais pas le second ; on a là quelque chose de plus spécifique mais qui inclura encore les termes C, D, E, etc.

– Terme A ET terme B : affiche les références qui contiennent les deux termes à la fois ; étape plus spécifique elle aussi, qui peut produire des références moins nombreuses que ne fait la relation SAUF.

– Terme A ET terme B SAUF C SAUF D... : affiche les références qui contiennent A et B, à l'exclusion des autres termes ; c'est la recherche la plus spécifique, mais ce n'est pas toujours la plus féconde.

La recherche ayant été élargie ou rétrécie au point de fournir un nombre raisonnable de références ou « coups au but », l'étape suivante consiste à consulter les références elles-mêmes, ou des résumés s'il y en a. L'ordinateur peut afficher sur l'écran les[...]

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

  • : (formerly) director of central library services and Goldsmith'Librarian, University of London, England.
  • : agrégé de l'Université, docteur en linguistique

Classification

Pour citer cet article

Douglas J. FOSKETT et Jacques MANIEZ. INDEXATION [en ligne]. In Encyclopædia Universalis. Disponible sur : (consulté le )

Médias

Maison des sciences de l'homme - crédits : C. Mouly

Maison des sciences de l'homme

SYNTOL - crédits : Encyclopædia Universalis France

SYNTOL

Algèbre de Boole - crédits : Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.

Algèbre de Boole

Autres références

  • BIBLIOTHÈQUES NUMÉRIQUES

    • Écrit par Yannick MAIGNIEN
    • 5 198 mots
    • 1 média
    Les bibliothèques trouvent ici une confirmation de leur vocation première : à savoir décrire et signaler les collections,indexer leur contenu, tenir des bases d'autorité concernant une discipline ou un auteur, classer les documents dans des systèmes normés (Décimal, Dewey) et encyclopédiques....
  • HUMANITÉS NUMÉRIQUES

    • Écrit par Thierry POIBEAU
    • 5 371 mots
    • 2 médias
    ...souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus. Plus récemment, il a été souligné, à juste titre, que...
  • MOTEURS DE RECHERCHE

    • Écrit par Brigitte SIMONNOT
    • 4 130 mots
    • 2 médias
    Les pages Web collectées sont analysées par un logiciel qui procède à leur indexation. L'indexation consiste à caractériser les pages par des mots clés pour permettre de les retrouver. Dans le cas des moteurs de recherche, l'extraction de mots ou de groupes de mots à partir des documents est automatisée....
  • MOYEN ÂGE - La pensée médiévale

    • Écrit par Alain de LIBERA
    • 22 212 mots
    ...Saint-Cher, les dominicains de Saint-Jacques mettent en chantier une grande Concordance de la Bible(achevée vers 1240), véritable ouvrage de référence, où chaque mot est indexé du nom du livre dans lequel il est employé, d'un numéro de chapitre, enfin d'une lettre (de A à G) y notant sa place relative....

Voir aussi