BIBLIOTHÈQUES NUMÉRIQUES

Carte mentale

Élargissez votre recherche dans Universalis

Vers un Web sémantique

Le modèle de Gallica ou des bibliothèques numériques établi par les grandes bibliothèques nationales se calquait peu ou prou sur celui de la bibliothèque physique : identification dans le catalogue d'un document édité et numérisé, recherche dans les zones plein texte grâce à un moteur. Cette informatisation avait gagné petit à petit l'ensemble des fonctions de gestion des catalogues et inventaires, par le biais de la normalisation engagée dans le domaine des données structurées. Puis, c'est la numérisation des contenus des documents eux-mêmes qui a représenté une transformation qualitative décisive : numérisation des documents physiques déjà imprimés, images, enregistrements audiovisuels, archives, etc. La transformation change de nature dès lors que les documents sont eux-mêmes uniquement numériques : bases de données, documents et matériaux en ligne sur Internet, prépublication d'articles scientifiques, autopublications, sites de nature des plus hétérogènes, etc.

Les bibliothèques trouvent ici une confirmation de leur vocation première : à savoir décrire et signaler les collections, indexer leur contenu, tenir des bases d'autorité concernant une discipline ou un auteur, classer les documents dans des systèmes normés (Décimal, Dewey) et encyclopédiques. Ce catalogage devient celui de documents complexes, composites, tels que ceux qui sont repérés sur le réseau. Ces métadonnées (metadata en anglais) sont essentielles pour une recherche d'information efficiente. Elles intègrent non seulement les données bibliographiques traditionnelles (auteur, édition, date de parution, etc.), mais aussi des données « administratives » (restriction ou autorisation d'accès, type de format numérisé). Elles précisent également la nature des liens hypertextes avec d'autres sites ou documents, et fournissent tout autre renseignement souhaitable sur la « contextualité » sociale, économique, juridique ou culturelle du document. Ces descriptions en métadonnées sont elles-mêmes exprimées en langage de structuration ou de balisage (XML).

Depuis le début des années 1990, les standards de description des données (metadata) et les syntaxes logiques qui peuvent les mettre en œuvre ne cessent de se perfectionner : Dublin Core, Warwick Framework, RDF (Resource Description Framework), etc. Un tel effort de normalisation devrait permettre une interaction accrue des contenus numérisés. L'effort sémantique s'appuie aussi sur la construction d'ontologies, où l'effort de classification encyclopédique apporté par les bibliothèques depuis le xixe siècle doit nécessairement être pris en compte. Il est en pleine cohérence avec les fonctions majeures des bibliothèques consistant à évaluer et sélectionner des documents, afin d'en valoriser au mieux l'usage heuristique ou culturel (recherche d'informations pertinentes, création de collections thématiques, gestion des droits d'accès, etc.). Pour les bibliothèques, comme pour le Web, cet ajout doit être suffisamment formalisé pour que des classes d'objets, des représentations de connaissances communes ou partagées puissent s'exprimer dans une syntaxe utilisable par des machines automatisées. Cette sémantique qu'apporte l'automatisation des métalangages permet de considérer non seulement des documents textuels, mais aussi iconiques, sonores ou extraits de bases de données structurées.

D'où la possibilité de construire des ontologies, ou du moins des hiérarchies de catégories permettant ensuite de rendre le Web sémantique, et de faire en sorte que des machines puissent « comprendre » et non seulement « lire » les contenus des sites Web. Cette évolution en cours s'inscrit dans un vaste et ambitieux projet du consortium W3 d'instaurer un « Web sémantique » (Tim Berners Lee) consistant à utiliser les métadonnées comme source de traitement automatisé des données, les concepts étant identifiés par des adresses (URL) au sein du Web universel.

Des moteurs de recherche très performants, comme Google, s'appuient sur cette logique d'indexation. Des sites bibliométriques (par exemple le site scientifique Citeseer), les notions de filtrage du Web (contre la violence, le sexe, etc.) s'inscrivent dans une démarche similaire. Nous n'en sommes vraisemblablement qu'à l'aube d'une ère où les représentations des connaissances, issues des contenus des collections numérisées elles-mêmes, permettront en retour une exploitation optimale des contenus. Ce qui est en jeu dans l'avenir lointain est la capacité de mettre en œuvre au sein du Web des procédures automatiques de « vérification » par croisement intertextuel, pouvant fournir des indices de « confiance » dans les contenus communiqués.

Notons que la mise en réseau des bibliothèques plaide pour une spécialisation et une complémentarité des différents centres. Cet apprentissage sémantique permettant de nourrir des métadonnées structurées doit vraisemblablement venir de bibliothèques thématiques ou spécialisées, avant de s'étendre dans la capillarité du réseau. Selon V. Quint, il s'agit ici d'« appliquer au domaine de l'ingénierie des connaissances le même processus de globalisation qui a été appliqué au domaine de l'hypertexte ». Enfin, les bibliothèques numériques évolueront en convergence avec le Web sémantique si non seulement les contenus bénéficient de ces apports, mais également les services. Ceux-ci, parce qu'ils deviennent le fait d'interactions humaines et sociales hautement formalisées entre personnels et fonctions des bibliothécaires, d'une part, et sophistication des besoins des publics, de l'autre, doivent faire l'objet d'assistances informatisées beaucoup plus « intelligentes ».

1  2  3  4  5
pour nos abonnés,
l’article se compose de 9 pages

Écrit par :

  • : enseignant de philosophie, École normale supérieure, lettres et sciences humaines, Lyon

Classification

Autres références

«  BIBLIOTHÈQUES NUMÉRIQUES  » est également traité dans :

CULTURE NUMÉRIQUE

  • Écrit par 
  • Jean-Yves MOLLIER
  •  • 4 525 mots
  •  • 1 média

Dans le chapitre « Quel livre pour demain? »  : […] Puisque le numérique ne porte pas atteinte au principe de la lecture, qu'il conduit même, dans certains cas, des fractions de public peu portées vers l'imprimé à se remettre à lire, on peut se demander si les digital natives ne seront pas, finalement, les plus grands dévoreurs d'informations et de connaissances, partant de bribes ou d'éléments du savoir, de l'histoire de l'humanité. L'exemple des […] Lire la suite

DARNTON ROBERT (1939- )

  • Écrit par 
  • Roger CHARTIER
  •  • 1 021 mots

L’historien du xviii e  siècle Robert Darnton a entrepris dès les années 1960 une grande recherche sur les Lumières et leur rôle dans la fin de l'Ancien Régime. Diplômé de Harvard et d'Oxford, Robert Darnton, après avoir enseigné l'histoire européenne à Princeton de 1968 à 2007, est directeur de la Harvard University Library (qui réunit plusieurs dizaines de bibliothèques spécialisées). Ce spécia […] Lire la suite

ÉDITION ÉLECTRONIQUE

  • Écrit par 
  • Alexandra SAEMMER
  •  • 4 000 mots
  •  • 3 médias

Dans le chapitre « Le livre numérisé  »  : […] Un large pan de l’édition électronique repose sur la numérisation de livres initialement édités sur papier, qui sont codés en une suite de 0 et de 1 manipulables par l’ordinateur. Il existe deux grandes façons de procéder. La première, désormais moins employée, consiste à coder le document en mode image : la page est analysée en points ( pixels) plus ou moins nombreux auxquels correspondent des va […] Lire la suite

INFORMATION : L'UTOPIE INFORMATIONNELLE EN QUESTION

  • Écrit par 
  • Armand MATTELART
  •  • 8 081 mots

Dans le chapitre « Vers une nouvelle Atlantide ? »  : […] Il n'y a de citoyen que par l'instruction et par l'information, affirmait en 1793 Condorcet dans son Esquisse d'un tableau historique des progrès de l'esprit humain . De la langue à l'écriture puis à l'imprimerie, le philosophe et mathématicien révolutionnaire tissait dans cet ouvrage, médiologique avant la lettre, un lien entre l'évolution des techniques de transmission et le façonnement des inst […] Lire la suite

Voir aussi

Pour citer l’article

Yannick MAIGNIEN, « BIBLIOTHÈQUES NUMÉRIQUES », Encyclopædia Universalis [en ligne], consulté le 02 décembre 2021. URL : https://www.universalis.fr/encyclopedie/bibliotheques-numeriques/