STATISTIQUE

Carte mentale

Élargissez votre recherche dans Universalis

Le mot « statistique » désigne à la fois un ensemble de données d'observation et l'activité qui consiste dans leur recueil, leur traitement et leur interprétation.

Au cours de l'histoire, la collecte d'observations et la méthodologie de leur emploi se sont développées de façons largement indépendantes. Aujourd'hui, le recueil de statistiques est une activité importante, indispensable à la gestion des sociétés modernes. Leur traitement bénéficie des moyens offerts par l'alliance des calculateurs électroniques et de l'algèbre linéaire ; et l'on voit apparaître, dans l'analyse des données, des méthodes extrêmement puissantes pour « faire parler les chiffres ». Les raisonnements par lesquels on peut tirer, à partir des observations, des conclusions concernant les lois de probabilité des phénomènes (inférence ou induction statistique) sont codifiés par la statistique mathématique.

Dans la diversité des significations attachées au mot, il convient de souligner au moins la distinction entre les deux définitions suivantes :

– statistique : activité qui consiste à réunir des données, concernant en particulier la connaissance de la situation des États ou des sociétés humaines (c'est le « budget des choses » de Napoléon) ;

– statistique : méthode de traitement et d'interprétation des observations, de passage de celles-ci aux lois des phénomènes et aux modèles théoriques susceptibles de les représenter (c'est l'« inférence statistique » des statisticiens classiques, qu'on a eu quelque raison d'assimiler à l'induction formalisée).

En réalité, ces deux sens du mot statistique ont naturellement entre eux des liens étroits. Il serait vain de recueillir des données, si ce n'était pour les traiter et les interpréter en vue d'éclairer les actions humaines ou de faire progresser la connaissance des phénomènes. Inversement, la manière de recueillir des données peut et doit être influencée d'abord par les méthodes de traitement ultérieures et ensuite par l'utilisation pratique de ces données ou des produits qui en sont dérivés.

De plus, la statistique, en tant qu'activité consistant à recueillir des données, ne concerne pas seulement la connaissance des États et des sociétés, mais aussi tous les phénomènes particuliers pouvant faire l'objet d'études en laboratoire ou dans la nature. La méthodologie statistique, quant à elle, s'applique indifféremment dans ces diverses circonstances.

Dans le présent article, les deux sens du mot statistique – recueil de données ou méthodologie de traitement et d'induction – sont présents tour à tour ou simultanément.

Historique

On attribue souvent la création du terme « statistique » à un professeur de Göttingen, G. Achenwall, qui aurait en 1746 créé le mot Statistik, dérivé de la notion Staatskunde. En fait, l'activité correspondante de recueil de données permettant de connaître la situation des États remonte à une fort lointaine antiquité. On cite, d'une part, l'empereur chinois Yao, organisant le recensement des productions agricoles en 2238 avant J.-C., et, d'autre part, l'institution du cadastre et du cens chez les Égyptiens, en 1700 avant J.-C. L'importance sociale de la statistique était reconnue, puisqu'il advint que le pharaon Amasis édicta la peine de mort contre ceux qui refusaient de déclarer leurs nom, profession et moyens de subsistance. Un tableau d'ensemble de l'activité statistique dans ce sens particulier, au cours des différentes périodes de l'histoire, mériterait d'être dressé ; mais on ne pourra donner ici que quelques points de repère. On notera que le recueil de statistiques n'implique pas la connaissance de l'écriture : des planchettes à encoches (encore en usage dans certaines professions) ou des cordes à nœuds peuvent servir de supports à l'information statistique ; on assure que les quipos des Incas constituaient des systèmes particulièrement sophistiqués, permettant de recueillir et de tenir à jour leurs statistiques de récoltes sur des cordes de couleur.

R. Horwath (Revue de l'Institut international de statistique, 1972) signale le rôle de précurseurs des commerçants de la république de Venise, rassemblant, aux xiiie et xive siècles, dans leurs Relazioni, de nombreuses données sur le commerce extérieur, qui furent utilisées pour la politique commerciale des régents. Au début du xviie siècle, ce sont les frères Elzévir, aux Pays-Bas, qui publient, sous le titre Respublica Elzeviriana, une sorte d'encyclopédie en soixante volumes contenant des informations sur l'économie et le commerce des États. Les travaux de W. Petty en Angleterre (cadastre, statistiques commerciales) sont bien connus, ainsi qu'en France les enquêtes ordonnées par Colbert et par Vauban (mémoires des intendants).

Au cours de cette période, les recensements de population et de ressources sont restés à un niveau purement descriptif, et c'est seulement au xviiie siècle que s'est répandue l'idée (introduite au siècle précédent par John Graunt, en Angleterre) que les statistiques recueillies en matière démographique pouvaient servir de base à des prévisions : tables de mortalité de P. G. Wargentin en Suède, de A. Deparcieux en France). Pour ce faire, les fréquences observées sur des populations assez nombreuses étaient purement et simplement assimilées à des probabilités, approximation légitime lorsqu'on dispose d'un grand nombre d'observations.

Parallèlement, le calcul des probabilités avait été développé par des mathématiciens, de Pascal et Fermat au xviie siècle jusqu'à Laplace au xixe siècle, à peu près sans rapports réels avec l'activité statistique. Pourtant, Thomas Bayes, dans les Philosophical Transactions, avait donné, dans deux mémoires publiés après sa mort par les soins de son ami R. Price en 1764 et en 1765, le théorème et la formule qui portent son nom, en quoi il est permis de voir la naissance de l'induction formalisée. Mais la plupart des applications qui en furent faites d'abord, et pendant près de cent cinquante ans, méritent d'être regardées plutôt comme des applications de la théorie des probabilités que comme des exemples d'inférence statistique. Il s'agit notamment des travaux de Condorcet et de Laplace, qui sont parmi les plus connus, où l'on trouve des exemples assez variés de calculs de « probabilité des causes » : jugements des tribunaux, résultats obtenus dans des jeux de société, probabilité des témoignages, etc.

Adolphe Quételet fut certainement le premier à concevoir que la statistique pouvait être fondée sur le [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 21 pages

Écrit par :

Classification

Autres références

«  STATISTIQUE  » est également traité dans :

APPROCHES TRANSVERSALE ET LONGITUDINALE EN PSYCHOLOGIE DU DÉVELOPPEMENT

  • Écrit par 
  • Henri LEHALLE
  •  • 1 042 mots

S’informer sur le développement des enfants et des adolescents impose de pouvoir comparer leurs comportements aux différents âges. Pour cela, diverses approches méthodologiques sont possibles. Selon une première approche « transversale », les groupes d’âge à comparer sont constitués par des échantillons d’enfants différents : autant d’échantillons que de groupes d’âge. À chaque âge, on note les co […] Lire la suite

ASSURANCE - Histoire et droit de l'assurance

  • Écrit par 
  • Jean-Pierre AUDINOT, 
  • Jacques GARNIER
  • , Universalis
  •  • 7 480 mots
  •  • 1 média

Dans le chapitre « Le calcul actuariel, création européenne »  : […] Pour que cet aléa disparaisse, il fallut attendre que la découverte du calcul des probabilités et le progrès de l'observation statistique permettent une prévision rationnelle du risque. Mais ce n'est qu'au xvii e  siècle que Pascal, à la demande d'un joueur de cartes passionné, le chevalier de Méré, découvre les bases du calcul des probabilités et la loi des grands nombres ( La Géométrie du hasard […] Lire la suite

BAYES THOMAS (1702-1761)

  • Écrit par 
  • Bernard PIRE
  •  • 310 mots

Mathématicien britannique, pionnier de la statistique. Né en 1702 à Londres, Thomas Bayes est le fils d'un des six premiers pasteurs non conformistes à être ordonnés après le refus en 1664 d'une partie de l'Église anglicane d'adhérer à l'Act of Uniformity. Après avoir reçu une solide éducation privée, il est ordonné et devient l'assistant de son père à Holborn (Londres). À la fin des années 1720, […] Lire la suite

BERNSTEIN FELIX (1878-1956)

  • Écrit par 
  • Bernard PIRE
  •  • 335 mots

Mathématicien allemand naturalisé américain, spécialiste de la théorie des ensembles puis des statistiques appliquées. Né le 24 février 1878 à Halle (Allemagne), Felix Bernstein est le fils d'un spécialiste de l'électrobiologie. Élève de Georg Cantor (1845-1918) à Halle, Bernstein démontre en 1897 son fameux théorème sur l'équivalence des ensembles : si deux ensembles A et B sont chacun équivalent […] Lire la suite

BERTILLON LES

  • Écrit par 
  • Christine BARTHET
  •  • 743 mots
  •  • 1 média

Né à Paris, Alphonse Bertillon appartient à une famille prestigieuse. Son père, Louis-Adolphe (1821-1883), ami de Michelet, proche du mouvement socialiste (en juin 1848, il prodigue ses soins aux blessés des barricades), était un médecin renommé, mais aussi un spécialiste des sciences humaines et surtout de la démographie, travaillant sur les traces d'un des fondateurs de cette discipline, le gra […] Lire la suite

BIBLIOMÉTRIE

  • Écrit par 
  • Ghislaine FILLIATREAU
  •  • 1 803 mots
  •  • 1 média

Les bases de la bibliométrie – qui est un ensemble de techniques visant à s’appuyer sur l’analyse des publications scientifiques pour mesurer la production de connaissances nouvelles – se sont véritablement développées à partir des années 1950, lorsque des chercheurs ont pu établir des statistiques sur la science à partir de bases de données bibliographiques recensant les publications scientifiqu […] Lire la suite

BIG DATA

  • Écrit par 
  • François PÊCHEUX
  •  • 6 153 mots
  •  • 3 médias

Dans le chapitre « Les aspects algorithmiques et logiciels du big data »  : […] Les logiciels de gestion de bases de données traditionnels s’appuient sur les mathématiques relatives à la théorie des ensembles pour appliquer des algorithmes de recherche exhaustifs et déterministes (pour un algorithme donné, les mêmes données initiales impliquent le même résultat en sortie) sur des données fortement structurées (en tables contenant des lignes d’informations pertinentes appelées […] Lire la suite

BLACKWELL DAVID (1919-2010)

  • Écrit par 
  • Universalis
  •  • 391 mots

Le statisticien et mathématicien américain David Blackwell apporta une contribution importante à la théorie des jeux, à la théorie des probabilités, à la théorie de l'information et aux statistiques bayésiennes. Il bouscula des barrières raciales quand il devint, en 1965, le premier Noir américain nommé membre de la National Academy of Sciences aux États-Unis. David Harold Blackwell est né le 24 a […] Lire la suite

CALCUL ET RATIONALISATION - (repères chronologiques)

  • Écrit par 
  • Pierre MOUNIER-KUHN
  •  • 732 mots

1623 L'astronome allemand Wilhelm Schickard invente une « horloge à calcul ». Mais celle-ci disparaît dans un incendie et Schickard ne poursuit pas ce projet qui n'aura donc aucune influence historique. 1637 René Descartes, dans le Discours de la méthode , définit la méthode rationnelle de résolution des problèmes : diviser chaque difficulté en opérations ou en éléments aussi simples que possibl […] Lire la suite

CAUSALITÉ

  • Écrit par 
  • Raymond BOUDON, 
  • Marie GAUTIER, 
  • Bertrand SAINT-SERNIN
  •  • 13 000 mots
  •  • 3 médias

Dans le chapitre « Relations causales et relations statistiques »  : […] Eu égard à la première question, remarquons qu'une relation statistique, si elle ne peut s'accompagner d'une interprétation causale, est dépourvue de sens : elle peut donner lieu à une proposition constatant l'existence de cette relation, mais non à un énoncé empirique. Une relation statistique n'a généralement de sens que si elle est interprétable en termes de causalité. Prenons un exemple : les […] Lire la suite

Voir aussi

Les derniers événements

26 août 2021 Suisse. Chiffrage de la baisse du PIB en 2020.

statistique chiffre à 2,4 % la baisse du PIB en 2020, du fait de la pandémie de Covid-19, contre 2,9 % estimé en février par le secrétariat d’État à l’Économie (SECO). […] Lire la suite

1er-30 avril 2021 Canada. Couvre-feu au Québec contre la Covid-19.

Statistique Canada indique que seize mille trois cents personnes de plus sont mortes en 2020 – sur un total de quelque trois cent mille morts – par rapport à ce que la situation démographique pouvait laisser prévoir en l’absence de pandémie, soit une surmortalité de 5,6 %. Le 30, le gouvernement fédéral annonce la suspension de l’administration du […] Lire la suite

2 mars 2021 Canada. Annonce du taux de croissance en 2020.

Statistique Canada chiffre à 5,4 p. 100 la contraction du PIB en 2020, soit la plus forte baisse annuelle depuis l’enregistrement des données trimestrielles en 1961. Le PIB avait fléchi de 1,9 p. 100 au premier trimestre et de 11,3 p. 100 au deuxième, puis progressé de 8,9 p. 100 au troisième et de 2,3 p. 100 au quatrième. […] Lire la suite

1er-29 janvier 2021 France. Aménagement des mesures de restriction liées à la Covid-19.

statistique et des études économiques (INSEE) annonce une surmortalité de 9 % dans le pays en 2020, toutes causes confondues, ce qui représente cinquante-trois mille neuf cents décès supplémentaires. Le 18, la vaccination est ouverte aux personnes de plus de soixante-quinze ans dans les centaines de centres de vaccination prévus à cet effet. Ceux-ci […] Lire la suite

14 janvier 2021 Allemagne. Présentation des chiffres de l'économie pour 2020.

statistique Destatis. Il annonce une contraction du PIB de 5 %, la première de cette ampleur depuis 2009 en raison de la crise financière, mais toutefois moindre que les prévisions. Le pays enregistre un déficit public de 158,2 milliards d’euros, le premier depuis l’entrée en vigueur en 2011 du mécanisme constitutionnel de « frein à la dette » qui  […] Lire la suite

Pour citer l’article

Georges MORLAT, « STATISTIQUE », Encyclopædia Universalis [en ligne], consulté le 26 novembre 2021. URL : https://www.universalis.fr/encyclopedie/statistique/