TRAITEMENT AUTOMATIQUE DES LANGUES

Carte mentale

Élargissez votre recherche dans Universalis

Les grands domaines d’application du traitement automatique des langues

Le traitement automatique des langues ne constitue pas un domaine monolithique : de nombreuses applications ont vu le jour au fur et à mesure que la technologie s’améliorait. Certaines applications sont connues du grand public (comme la traduction automatique, la correction orthographique ou encore, avec le développement des téléphones mobiles, la reconnaissance vocale), et d’autres moins (l’apprentissage en ligne, les agents conversationnels…).

Les moteurs de recherche

Le principe du moteur de recherche est à la fois simple et bien connu. Il s’agit de retrouver, à partir d’un fonds documentaire, les documents pertinents pour une requête donnée. En général, ceux-ci sont hiérarchisés, c’est-à-dire que les plus pertinents doivent figurer en tête de liste. Le fonds documentaire le plus connu aujourd’hui est bien sûr Internet, mais il existe de nombreux autres fonds documentaires, spécifiques, de Gallica à la Bibliothèque nationale de France jusqu’aux fonds d’archives d’entreprises ou d’associations particulières (un fonds documentaire est traditionnellement un ensemble de documents choisis sur un sujet donné, mais il semble intéressant d’élargir cette définition et de l’adapter au contexte du traitement des langues pour désigner ce qu’on appelle aussi parfois une archive).

La fouille d’opinion

Les outils de fouille d’opinion sont sans doute moins connus du grand public que les moteurs de recherche et ils sont surtout moins accessibles. La fouille d’opinion est la tâche qui vise à capter, analyser et synthétiser les opinions exprimées en ligne sur un sujet donné. Les critiques de films constituent, par exemple, un domaine d’exploration privilégié pour les chercheurs dans ce secteur.

La classification de documents

La classification de documents est très complémentaire des moteurs de recherche. Une fois qu’un moteur de recherche classique a identifié des pages Internet pertinentes par rapport à une requête, il peut chercher à les classer en fonction de leur contenu informationnel, afin de privilégier par exemple des pages montrant différentes facettes d’un même événement. Autrement dit, si deux pages expriment un contenu jugé similaire, une seule sera montrée à l’utilisateur par défaut, la deuxième n’ayant pas d’intérêt puisqu’elle n’apporte pas d’information supplémentaire. Un exemple typique est celui des sites agrégeant les flux d’information : seuls quelques articles, les plus représentatifs, sont mis en avant pour un événement donné.

La traduction automatique

La traduction est une application phare pour le traitement automatique des langues, pour plusieurs raisons : la tâche est bien identifiée et facilement compréhensible par le grand public ; elle est extrêmement complexe et recouvre en fait l’ensemble des problématiques du domaine du traitement automatique des langues (analyse de la langue source, transfert d’une langue à l’autre et production d’un texte cohérent dans la langue cible) ; enfin, elle répond à des besoins pratiques avérés. Certains outils en ligne offrent plus de 100 langues possibles (comme langue source ou langue cible), mais les traducteurs automatiques sont surtout efficaces pour une vingtaine de langues, et en pratique donnent les meilleurs résultats si l’anglais est soit la langue source, soit la langue cible. Signalons enfin la traduction de la parole (conversation en direct), qui n’est pas encore complètement opérationnelle, mais est appelée à faire rapidement de grands progrès.

La correction orthographique et grammaticale

La correction de textes est une autre application très populaire du domaine du traitement automatique des langues, du fait de l’intégration d’outils relativement performants dans tous les logiciels de traitement de textes grand public (Microsoft Word, Open Office, etc.). Le principe en est fort simple : il s’agit avant tout de repérer les erreurs orthographiques et grammaticales, généralement au cours de la saisie effectuée par un utilisateur (le principe est simple, mais la mise en œuvre évidemment complexe). Il existe aussi des outils plus avancés, avant tout destinés à l’usage des professionnels, qui peuvent en outre offrir d’autres fonctionnalités (analyse du style par exemple), avec plus ou moins de succès.

Les applications d’apprentissage en ligne

Par « apprentissage en ligne », on désigne tous les sites et les applications en [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 9 pages

Médias de l’article

Texte analysé par un analyseur morphosyntaxique

Texte analysé par un analyseur morphosyntaxique
Crédits : Encyclopædia Universalis France

tableau

Analyse syntaxique d’une même phrase dans quatre langues différentes

Analyse syntaxique d’une même phrase dans quatre langues différentes
Crédits : Encyclopædia Universalis France

dessin

Analyse sémantique des prédicats et de leurs arguments selon la théorie Frame Semantics

Analyse sémantique des prédicats et de leurs arguments selon la théorie Frame Semantics
Crédits : Encyclopædia Universalis France

dessin

Afficher les 3 médias de l'article


Écrit par :

Classification

Autres références

«  TRAITEMENT AUTOMATIQUE DES LANGUES  » est également traité dans :

TRAITEMENT AUTOMATIQUE DES LANGUES

  • Écrit par 
  • Anne ABEILLÉ
  •  • 8 410 mots
  •  • 5 médias

Le traitement automatique des langues (T.A.L.) est un domaine de recherches pluridisciplinaire, qui fait collaborer linguistes, informaticiens, logiciens, psychologues, documentalistes, lexicographes ou traducteurs, et qui appartient au domaine de l'Intelligence artificielle (I.A.). On dispose d'automates qui […] Lire la suite

LANGAGE ACQUISITION DU

  • Écrit par 
  • Michèle KAIL
  •  • 4 944 mots
  •  • 3 médias

Dans le chapitre « Méthodes d’étude de la production du langage »  : […] Les études de production se sont considérablement renouvelées grâce aux moyens audio-visuels et à l’avènement de la micro-informatique. Au recueil des données langagières s’ajoutent des indications concernant les gestes et les regards ainsi que les phénomènes d’interaction avec l’entourage. L’informatique permet le stockage, le traitement automatique et le transfert des données, entraînant un vér […] Lire la suite

COGNITIVES SCIENCES

  • Écrit par 
  • Daniel ANDLER
  •  • 19 242 mots
  •  • 4 médias

Dans le chapitre « Phase II (1970-1995) : l'institutionnalisation »  : […] S'ouvre alors une phase d'environ un quart de siècle au cours de laquelle les sciences cognitives montent en puissance, passant d'un statut avant-gardiste à celui d'acteur majeur. Elles s'institutionnalisent. Elles étendent leur domaine d'étude. Elles produisent des résultats en qualité et en quantité rapidement croissantes. Enfin, elles traversent une série de reconfigurations épistémologiques. L […] Lire la suite

DICTIONNAIRE

  • Écrit par 
  • Bernard QUEMADA
  •  • 7 981 mots

Dans le chapitre « « Nouvelle lexicographie » et « Nouveaux dictionnaires » »  : […] Dans la seconde moitié du xx e  siècle, le dictionnaire connaît d'importants développements. Les nouveaux rôles qu'il est appelé à jouer dans la société de l'information et de la communication renforcent l'intérêt qu'on lui portait jusque-là. Reconsidéré, son usage dans l'enseignement amène à produire des dictionnaires d'apprentissage d'un type nouveau, conçus comme compléments des grammaires scol […] Lire la suite

HARRIS ZELLIG SABBETAI (1909-1992)

  • Écrit par 
  • Morris SALKOFF
  •  • 1 063 mots

La recherche de Zellig Sabbetai Harris est intimement liée aux travaux de l'école américaine d'analyse distributionnelle qui a élaboré son programme pour la linguistique dans les années 1930 et 1940, sous l'impulsion de E. Sapir et L. Bloomfield. Ce dernier avait proposé d'abstraire de la phrase des unités définies formellement et qui serviraient à décrire les rapports observés entre les diverses […] Lire la suite

HUMANITÉS NUMÉRIQUES

  • Écrit par 
  • Thierry POIBEAU
  •  • 5 444 mots
  •  • 2 médias

Dans le chapitre « Histoire du domaine »  : […] On l’a dit, les humanités numériques concernent les analyses, dans le domaine des lettres et des SHS, conduites avec des moyens informatiques. Dès le début, l’informatique a été considérée comme un outil extrêmement puissant pour mener à bien des tâches mécaniques et peu intéressantes. Les chercheurs travaillant sur des sources textuelles ont ainsi souvent besoin de « concordances », ce qui consis […] Lire la suite

LINGUISTIQUE - Théories

  • Écrit par 
  • Catherine FUCHS
  •  • 7 693 mots
  •  • 1 média

Dans le chapitre « Les nouvelles syntaxes  »  : […] C'est précisément pour cette dernière raison que d'autres types de grammaires formelles se sont développées outre-Atlantique au tournant des années 1970-1980 : la plupart d'entre elles ont pris naissance dans la mouvance de la grammaire générative chomskienne, mais ne l'ont pas suivie dans ses développements récents, cherchant avant tout à rester opératoires et calculables, afin de pouvoir être mi […] Lire la suite

LINGUISTIQUE - Le langage au carrefour des disciplines

  • Écrit par 
  • Catherine FUCHS
  •  • 10 045 mots
  •  • 6 médias

Dans le chapitre « Le traitement automatique des langues  »  : […] Outre la traduction automatique, les recherches fondamentales et appliquées en matière de traitement automatique des langues concernent, d’une part, le traitement de la parole et, d’autre part, celui de l’écrit. Les chercheurs en traitement automatique des langues relèvent de disciplines nombreuses et variées (linguistique, mathématiques, logique, intelligence artificielle, informatique, physique. […] Lire la suite

MODÈLE

  • Écrit par 
  • Raymond BOUDON, 
  • Hubert DAMISCH, 
  • Jean GOGUEL, 
  • Sylvanie GUINAND, 
  • Bernard JAULIN, 
  • Noël MOULOUD, 
  • Jean-François RICHARD, 
  • Bernard VICTORRI
  •  • 24 441 mots
  •  • 2 médias

Dans le chapitre «  Le modèle en linguistique »  : […] L'activité de modélisation en linguistique a connu un essor considérable depuis le début des années 1970. Comme dans toutes les disciplines qui traitent de données empiriques, les modèles en linguistique cherchent à rendre compte de phénomènes observables : il s'agit de mettre en place un dispositif dont la conception est régie par la théorie linguistique que l'on veut illustrer et dont le fonctio […] Lire la suite

TERMINOLOGIE

  • Écrit par 
  • Loïc DEPECKER
  •  • 6 205 mots

Dans le chapitre «  La terminologie dans la société de l'information »  : […] Même si la terminologie entre de plus en plus dans le champ d'une réflexion théorique, elle apparaît d'abord comme une discipline d'application dans les entreprises, les laboratoires de recherche, les instituts de normalisation. Elle est primordiale pour la traduction spécialisée, la rédaction technique et la documentation. Mais sa pratique évolue rapidement en raison du développement de la sociét […] Lire la suite

UNIVERSAUX, linguistique

  • Écrit par 
  • Catherine FUCHS
  •  • 4 975 mots

Dans le chapitre «  Noam Chomsky et la grammaire universelle »  : […] À cette position extrême s'oppose de façon diamétrale celle de Noam Chomsky , qui affirme, quant à lui, qu'il n'existerait en définitive dans les langues « qu'un seul système et un seul lexique ». Dans le courant des années 1960, en effet, l'essor naissant de la linguistique formelle, en lien avec les premiers travaux en traitement automatique des langues (notamment pour la traduction), a condui […] Lire la suite

Voir aussi

Pour citer l’article

Thierry POIBEAU, « TRAITEMENT AUTOMATIQUE DES LANGUES », Encyclopædia Universalis [en ligne], consulté le 28 juin 2022. URL : https://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/