CORPUS, linguistique

Carte mentale

Élargissez votre recherche dans Universalis

Ensemble homogène et significatif de données linguistiques observées et à partir desquelles pourra s'élaborer la théorie. La notion de corpus est évidemment fondamentale dans la linguistique structurale : désireuse de substituer à la normativité de la grammaire ou aux fondements pseudo-logiques de la signification un enregistrement de l'usage, écrit ou oral, ainsi qu'un relevé des différences en fonction des différents contextes, elle pose en principe l'absolue nécessité de s'appuyer sur des productions de parole. Les caractéristiques d'un corpus significatif sont : l'homogénéité (le groupe qui le produit est socialement défini), la synchronie (on ne peut travailler sur des énoncés trop éloignés chronologiquement les uns des autres), la moindre redondance possible (on supprimera des énoncés représentatifs d'un phénomène identique). Nanti de son matériau, le linguiste distributionnaliste induira, par l'intermédiaire d'une formalisation des contextes et en s'appuyant sur l'hypothèse des deux axes de fonctionnement (paradigmatique et syntagmatique), les lois du code. La notion de corpus prête le flanc à une critique néanmoins sérieuse : notamment, dans le modèle de langage impliqué par le recours à l'échantillon, on ne peut que rester en deçà de la perspective créative par laquelle le sujet est capable de produire aussi bien que de comprendre un nombre infini d'énoncés qui ne figurent pas dans le corpus. Il faut alors reconnaître la fragilité d'une observation inductive comparée aux théories hypothético-déductives capables d'intégrer cette créativité. On est alors conduit à renoncer au corpus pour le remplacer par l'épreuve de grammaticalité auprès d'un locuteur natif.

—  Robert SCTRICK

Écrit par :

Classification


Autres références

«  CORPUS, linguistique  » est également traité dans :

LANGAGE ACQUISITION DU

  • Écrit par 
  • Michèle KAIL
  •  • 4 942 mots
  •  • 3 médias

Dans le chapitre « Méthodes d’étude de la production du langage »  : […] Les études de production se sont considérablement renouvelées grâce aux moyens audio-visuels et à l’avènement de la micro-informatique. Au recueil des données langagières s’ajoutent des indications concernant les gestes et les regards ainsi que les phénomènes d’interaction avec l’entourage. L’informatique permet le stockage, le traitement automatique et le transfert des données, entraînant un vér […] Lire la suite☛ http://www.universalis.fr/encyclopedie/acquisition-du-langage/#i_51064

AMÉNAGEMENT LINGUISTIQUE

  • Écrit par 
  • Loïc DEPECKER
  •  • 4 727 mots

Dans le chapitre « Modalités de l'aménagement linguistique »  : […] De fait, la compréhension de la notion d'aménagement linguistique n'a cessé de se diversifier, et il est possible de l'articuler globalement aujourd'hui de la façon suivante : — l'aménagement du statut des langues ; il inclut le type de statut, constitutionnel, législatif, juridique, réglementaire (usage de la ou des langues, présence de ces langues dans la vie publique et administrative, apprenti […] Lire la suite☛ http://www.universalis.fr/encyclopedie/amenagement-linguistique/#i_51064

DISTRIBUTIONNALISME

  • Écrit par 
  • Catherine FUCHS
  •  • 964 mots

Dans le chapitre « Une méthode descriptive »  : […] Né en réaction contre les approches des grammaires mentalistes, ce courant s'est inscrit au départ dans la perspective mécaniste de la psychologie dite « behavioriste », qui entendait expliquer objectivement le comportement en termes de facteurs externes – stimulus et réponse – sans recourir à l'introspection. Dans cette perspective, le sens d'un message reste hors d'atteinte, puisqu'il est conçu […] Lire la suite☛ http://www.universalis.fr/encyclopedie/distributionnalisme/#i_51064

GRAMMATICALITÉ

  • Écrit par 
  • Robert SCTRICK
  •  • 317 mots

Une bonne grammaire doit être capable de «  projeter le corpus fini et toujours plus ou moins aléatoire des énoncés observés sur l'ensemble, qu'on présuppose infini, des phrases grammaticales », écrit N. Chomsky ( Structures syntaxiques ). Ce passage de l'induction à la projection ne peut se faire qu'au moyen d'un appareil hypothético-déductif qui conce […] Lire la suite☛ http://www.universalis.fr/encyclopedie/grammaticalite/#i_51064

SMS (Short Message Service) ou TEXTO

  • Écrit par 
  • Josie BERNICOT
  •  • 1 324 mots

Dans le chapitre « La constitution de grands corpus et les méthodes d’étude des SMS »  : […] La première étape, pour appréhender le phénomène nouveau que constituent les SMS, a été de recueillir des grands corpus produits en situation naturelle. Le projet européen SMS4science, sous la responsabilité de Cédrick Fairon (université catholique de Louvain, U.C.L.) a permis d’organiser cette collecte. En langue française, on dispose de plusieurs corpus allant de 5 000 à 88 000 SMS. La majorité […] Lire la suite☛ http://www.universalis.fr/encyclopedie/sms-texto/#i_51064

STRUCTURALISME

  • Écrit par 
  • Jean-Louis CHISS, 
  • Michel IZARD, 
  • Christian PUECH
  •  • 24 036 mots
  •  • 1 média

Dans le chapitre « Principes généraux »  : […] Les écoles structuralistes en linguistique se développent à partir des années 1920 essentiellement à Prague, Copenhague et aux États-Unis. Genève et Paris (les deux villes où Saussure enseigna) donnèrent plutôt naissance à des personnalités originales, informées, mais relativement isolées. Le point de vue structural, dans ses différentes versions, dominera l'avant-garde des recherches linguistique […] Lire la suite☛ http://www.universalis.fr/encyclopedie/structuralisme/#i_51064

Pour citer l’article

Robert SCTRICK, « CORPUS, linguistique », Encyclopædia Universalis [en ligne], consulté le 09 août 2019. URL : http://www.universalis.fr/encyclopedie/corpus-linguistique/