HUMANITÉS NUMÉRIQUES

Carte mentale

Élargissez votre recherche dans Universalis

Histoire du domaine

On l’a dit, les humanités numériques concernent les analyses, dans le domaine des lettres et des SHS, conduites avec des moyens informatiques. Dès le début, l’informatique a été considérée comme un outil extrêmement puissant pour mener à bien des tâches mécaniques et peu intéressantes. Les chercheurs travaillant sur des sources textuelles ont ainsi souvent besoin de « concordances », ce qui consiste à faire un relevé exhaustif de toutes les occurrences d’un mot ou d’une expression donnée, pertinente pour une question de recherche précise, dans un corpus de référence. Il s’agit d’une tâche extrêmement fastidieuse si elle est menée à la main. Dès le début du xxe siècle, différentes « machines mécaniques » ont été imaginées pour indexer les textes, retrouver les différentes occurrences d’un mot ou produire automatiquement des concordances, mais ces quelques tentatives n’ont jamais abouti à des systèmes mécaniques réellement opérationnels. Après la Seconde Guerre mondiale, l’informatique est venue ouvrir de nouvelles perspectives.

Le jésuite italien Roberto Busa (1913-2011) est souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus. Plus récemment, il a été souligné, à juste titre, que Busa n’était pas seul dans cette entreprise, car son projet avait en fait bénéficié d’une très importante main-d’œuvre féminine, restée longtemps ignorée. Dans les décennies qui suivirent, de très nombreuses équipes, un peu partout dans le monde, ont utilisé l’approche informatique pour mettre au point non seulement des éditions de référence d’œuvres majeures, mais aussi des index, des concordanciers ainsi que les outils nécessaires pour produire des analyses statistiques à partir de textes, que ce soit en littérature, en histoire ou en archéologie. Par exemple, le projet Thesaurus Linguae graecae® (http://stephanus.tlg.uci.edu/) a été lancé par l’université de Californie à Irvine dès 1972, et a permis en quelques années de disposer d’un ensemble très important de textes grecs sur support informatique (l’équivalent a été réalisé indépendamment pour le latin). Il est intéressant de noter que les textes n’étaient pas numérisés (la technologie n’existant pas dans les années 1960) mais saisis à la main par des ouvriers non qualifiés en Asie du Sud-Est, qui n’avaient aucune connaissance des langues qu’ils transcrivaient.

En parallèle, dès les années 1950 et surtout 1960, des équipes travaillent à la mise au point de corpus en propre (c’est-à-dire de données textuelles assemblées dans un but et suivant des critères précis), notamment pour conduire des études linguistiques. Il peut s’agir d’examiner le sens des mots à partir d’exemples réels (en lexicologie ou pour la mise au point de dictionnaires) ou de mettre en lumière les différences linguistiques entre groupes d’individus (ce que l’on appelle la sociolinguistique). En 1959, Randolph Quirk lance ainsi le Survey of English Language (https://www.ucl.ac.uk/english-usage/), une collection d’enregistrements et de transcription de différentes variétés d’anglais, ce qui donnera ultérieurement naissance au British National Corpus (1991, http://www.natcorp.ox.ac.uk/), un corpus de référence pour l’analyse de la langue anglaise. La Grande-Bretagne devient ainsi, à partir des années 1960, un des centres majeurs pour la « linguistique de corpus », c’est-à-dire l’analyse de la langue à partir de données attestées et méthodiquement assemblées sur support informatique (Léon, 2015).

Le traitement automatique des langues, qui se développe en parallèle mais de manière largement indépendante, fournit de son côté des outils d’analyse permettant d’interroger les corpus de manière plus précise. Le but est de pouvoir « interroger » un texte non plus simplement à partir des formes de surface, mais à partir des lemmes ou des catégories morphosyntaxiques. Il s’agit, par exemple, de retrouver toutes les occurrences d’un mot dans un texte à partir de sa forme canonique, quelle que soit la forme employée dans le texte ; on pourra ainsi retrouver « verte », « verts » et « vertes » à partir de « vert » ou « fait », « faisons » et « fera » à partir de « faire ». Contrairement à ce qu’on pourrait penser, ce niveau d’analyse est loin d’être trivial et continue [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 8 pages

Médias de l’article

Méthodes de modélisation et de traitement des données : villa de Diomède

Méthodes de modélisation et de traitement des données : villa de Diomède
Crédits : Villa Diomedes Project (http://villadiomede.huma-num.fr/3dproject/). Réalisation Alban-Brice Pimpaud (archeo3d.net).

photographie

Portrait d’Edmond de Belamy

Portrait d’Edmond de Belamy
Crédits : obvious-art.com

photographie

Afficher les 2 médias de l'article


Écrit par :

Classification

Autres références

«  HUMANITÉS NUMÉRIQUES  » est également traité dans :

ANTHROPOLOGIE VISUELLE

  • Écrit par 
  • Damien MOTTIER
  •  • 4 464 mots

Dans le chapitre « Devenir-archives »  : […] Du plaidoyer de Félix Regnault pour la constitution d’un « musée de films » (1912) à la résolution adoptée à Chicago en 1973 en faveur de l’anthropologie visuelle, l’une des principales justifications de l’usage de la photographie et du film en anthropologie a toujours été, selon les mots de Margaret Mead, « la nécessité d’enregistrer de toute urgence un monde qui disparaît » (1975). Le présupposé […] Lire la suite

ÉDITION ÉLECTRONIQUE

  • Écrit par 
  • Alexandra SAEMMER
  •  • 4 000 mots
  •  • 3 médias

Dans le chapitre « L’édition en ligne »  : […] Hybride, ouverte et interconnectée, l’édition en ligne englobe aujourd’hui la plupart des productions éditoriales numériques. Le livre numérique se connecte au réseau, du moins pendant la phase de téléchargement, et de façon constante si le lecteur utilise les fonctionnalités d’annotation collective ou de commentaire. Il en est de même pour le jeu vidéo, dont beaucoup d’émanations sont aujourd’hui […] Lire la suite

LINGUISTIQUE - Le langage au carrefour des disciplines

  • Écrit par 
  • Catherine FUCHS
  •  • 10 045 mots
  •  • 6 médias

Dans le chapitre « L'enseignement des langues  »  : […] En matière d'enseignement des langues , il convient de distinguer trois cas : l'enseignement de la langue maternelle, celui d'une langue seconde dans un cadre de bilinguisme et celui d'une langue étrangère. L'enseignement de la langue maternelle, chez le jeune enfant, concerne d'abord l'acquisition de la lecture et de l'écriture : les connaissances requises pour l'élaboration des méthodes d'appren […] Lire la suite

Voir aussi

Pour citer l’article

Thierry POIBEAU, « HUMANITÉS NUMÉRIQUES », Encyclopædia Universalis [en ligne], consulté le 08 mai 2022. URL : https://www.universalis.fr/encyclopedie/humanites-numeriques/