INDEXATION
La recherche dans un index
Un bon index présente une structure intellectuelle complexe, et une certaine maîtrise est essentielle pour toute recherche, si simple qu'elle ait d'abord paru. Il faut concevoir une « stratégie de recherche » qui conduise le plus efficacement, donc le plus économiquement, jusqu'à l'information requise. Quand on consulte un fichier informatisé, cet itinéraire est celui qui correspond au temps de connexion le plus court.
Même les index par auteurs posent des problèmes. Un auteur peut avoir pris des pseudonymes, avoir écrit sous plusieurs noms, avoir publié en collaboration comme coauteur. Les institutions produisent des documents dont elles sont auteur collectif, sans nom de personne. Certains documents ne portent pas de nom d'auteur et sont catalogués comme « anonymes ». Toute stratégie de consultation exige donc qu'on connaisse d'abord bien les principes selon lesquels l'index a été conçu, c'est-à-dire le système des entrées et des renvois. Cela implique qu'on sache de quelle manière l'entrée figurant dans l'index désigne le document indexé et, bien qu'il existe un grand nombre de normes régissant ce genre de détails, aucun, pour l'instant, n'est universellement admis.

Algèbre de Boole
Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.
Algèbre de Boole
Les opérateurs booléens et leurs combinaisons : les portes logiques.
L'algèbre de Boole est une…
Planeta Actimedia S.A.© Encyclopædia Universalis France pour la version française.
Celui qui consulte un index matières a tout particulièrement besoin d'une stratégie de recherche. Dans une première étape, il procédera à une analyse précise afin d'identifier le sujet de sa recherche, par exemple en utilisant un ensemble de termes empruntés à des catégories qui s'excluent les unes les autres, comme c'est le cas dans l'analyse par facettes : objets, parties, propriétés, processus, etc. Lorsque les termes d'un index sont choisis dans une liste ou un thesaurus, il faut consulter cette source afin de savoir quels termes l'index utilise pour désigner le sujet recherché. La plupart des chercheurs commencent par énoncer leur sujet de façon très générale, bien que ce ne soit pas la meilleure manière de procéder. Dans des index imprimés comme l'étaient ceux du C.N.R.S., on peut, en cherchant un terme trop général, passer à côté de documents qui sont indexés par des descripteurs plus spécifiques. Dans un index informatisé (PASCAL et MYRIADE pour le C.N.R.S.), si on utilise un terme trop large, on se voit livrer un nombre de références tel qu'on ne pourra pas les exploiter en temps réel, si ce n'est à un coût prohibitif. Il faut donc ajouter des termes au descripteur choisi pour le rendre plus spécifique. Cela sera facilité par une analyse initiale détaillée du sujet. La plupart des fichiers informatisés se prêtent à des recherches qui s'inspirent de la logique de Boole à laquelle elles empruntent les relations AND, OR et NOT (ET, OU et SAUF).
– Terme A OU terme B : affiche sur l'écran les références qui contiennent soit l'un, soit l'autre terme ; il s'agit là de l'étape la plus générale de la recherche.
– Terme A SAUF terme B : affiche les références qui contiennent le premier terme, mais pas le second ; on a là quelque chose de plus spécifique mais qui inclura encore les termes C, D, E, etc.
– Terme A ET terme B : affiche les références qui contiennent les deux termes à la fois ; étape plus spécifique elle aussi, qui peut produire des références moins nombreuses que ne fait la relation SAUF.
– Terme A ET terme B SAUF C SAUF D... : affiche les références qui contiennent A et B, à l'exclusion des autres termes ; c'est la recherche la plus spécifique, mais ce n'est pas toujours la plus féconde.
La recherche ayant été élargie ou rétrécie au point de fournir un nombre raisonnable de références ou « coups au but », l'étape suivante consiste à consulter les références elles-mêmes, ou des résumés s'il y en a. L'ordinateur peut afficher sur[...]
Pour nos abonnés, l'article se compose de 10 pages
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Douglas J. FOSKETT : (formerly) director of central library services and Goldsmith'Librarian, University of London, England.
- Jacques MANIEZ : agrégé de l'Université, docteur en linguistique
Classification
Pour citer cet article
Douglas J. FOSKETT, Jacques MANIEZ, « INDEXATION », Encyclopædia Universalis [en ligne], consulté le . URL :
Médias
Autres références
-
BIBLIOTHÈQUES NUMÉRIQUES
- Écrit par Yannick MAIGNIEN
- 28 586 mots
- 1 média
-
HUMANITÉS NUMÉRIQUES
- Écrit par Thierry POIBEAU
- 29 974 mots
- 2 médias
[...]souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus. Plus récemment, il a été souligné, à juste titre, que[...] -
MOTEURS DE RECHERCHE
- Écrit par Brigitte SIMONNOT
- 22 776 mots
- 3 médias
Les pages Web collectées sont analysées par un logiciel qui procède à leur indexation. L'indexation consiste à caractériser les pages par des mots clés pour permettre de les retrouver. Dans le cas des moteurs de recherche, l'extraction de mots ou de groupes de mots à partir des documents est automatisée.[...] -
MOYEN ÂGE - La pensée médiévale
- Écrit par Alain de LIBERA
- 122 160 mots
[...]Saint-Cher, les dominicains de Saint-Jacques mettent en chantier une grande Concordance de la Bible (achevée vers 1240), véritable ouvrage de référence, où chaque mot est indexé du nom du livre dans lequel il est employé, d'un numéro de chapitre, enfin d'une lettre (de A à G) y notant sa place relative.[...] -
TERMINOLOGIE
- Écrit par Loïc DEPECKER
- 34 130 mots
- 1 média
[...]d'informations en langue naturelle est en pleine expansion. En ce sens, l'unité terminologique forme un élément essentiel des techniques documentaires. Elle structure l'information contenue dans un texte ; elle la restitue sous la forme de mots clés (termes apparaissant explicitement dans un document)[...]
Voir aussi
- CONTENU ANALYSE DE
- DOCUMENTATION
- DOCUMENT
- ORDRE LEXICOGRAPHIQUE
- THESAURUS
- CLASSIFICATION
- LA FONTAINE HENRI (1854-1943)
- OTLET PAUL (1868-1944)
- LINGUISTIQUE APPLIQUÉE
- BIBLIOGRAPHIE
- SYSTÈME EXPERT
- BASE DE DONNÉES
- CATALOGAGE
- C.D.U. (classification décimale universelle)
- INFORMATIQUE DOCUMENTAIRE
- KWIC & KWOC INDEX
- C.D.D. (classification décimale de Dewey)
- NORMALISATION