STATISTIQUE

Carte mentale

Élargissez votre recherche dans Universalis

Inférence statistique classique

Les méthodes que nous avons décrites au chapitre précédent sous le titre d'analyse des données concernent la description des tableaux d'observations statistiques et ne font intervenir aucune hypothèse sur l'origine de ces données. La statistique classique était au contraire une statistique probabiliste, fondée sur la prise en considération des lois de probabilité auxquelles obéissent les phénomènes naturels, objets d'observation. On décrira maintenant les principes et les méthodes de la statistique classique.

Théorie de l'échantillonnage

Tout, dans la statistique classique, repose sur l'étude des distributions des échantillons. Pour la statistique classique, un échantillon est défini dans le cas le plus simple comme un ensemble d'épreuves indépendantes et de même loi. Il convient d'abord d'étudier la distribution de probabilité de tels échantillons, dont on donnera quelques exemples. Soit x une variable aléatoire suivant une loi de Laplace-Gauss de moyenne m, d'écart type σ, et soit :

un n-échantillon, au sens qui vient d'être indiqué au chapitre 3, sous le titre Statistique descriptive. La moyenne arithmétique de cet échantillon suit une loi de Laplace-Gauss, de moyenne m et d'écart type σ/n. La variance, ou plus exactement la quantité (ns2)/σ2, qui est proportionnelle à la variance de l'échantillon, suit une loi dite loi de χ2 à n − 1 degrés de liberté, dont la densité s'écrit, en posant (ns2)/σ2 = u et n − 1 = ν,
cette loi est dite aussi loi gamma. La quantité :
suit une loi de probabilité qui ne dépend d'aucun des paramètres de la loi de Laplace-Gauss initiale ; c'est la loi de Student, de densité :

De même, étant donné un échantillon d'une loi de Laplace-Gauss à deux variables, soit :

on sait établir la loi de probabilité des grandeurs servant habituellement à caractériser les moyennes et dispersions, ainsi que la liaison entre x et y. On montre que si mx, my, σx, σy et ρ sont les paramètres de la loi du couple (x, y), alors le couple (ȳ) suit une loi de Laplace-Gauss de paramètres (mx, my, σx/n, σy/n, ρ) et se trouve indépendant du triplet (sx, sy, r) dont on sait par ailleurs calculer la loi de distribution exacte (c'est une expression analytique assez compliquée).

Une autre loi de distribution d'échantillonnage couramment utilisée dans la statistique classique est celle du quotient de deux variances indépendantes (ou de deux χ2) ; elle est connue sous le nom de loi de Fisher-Snedecor. Un certain nombre d'autres lois, que suivent les grandeurs caractérisant des échantillons de variables gaussiennes, ont été étudiées et tabulées. Les premiers statisticiens, au début du siècle, utilisaient de tels résultats à l'aide d'un principe de raisonnement extrêmement simple : les grandeurs calculées à partir d'un échantillon étant choisies de façon quelque peu intuitive, on convenait que des valeurs de probabilité très petites ne devaient pas se produire, ou plus précisément qu'il était raisonnable de « faire comme si » des valeurs de probabilité très petites ne s'étaient pas produites. La statistique mathématique a donné peu à peu une forme cohérente à ce type de raisonnement. Nous donnerons comme exemples quelques-unes des théories développées à cet effet.

Théorie de l'estimation

Supposons qu'une grandeur observable x suive une loi de probabilité dépendant d'un paramètre θ et possédant une densité f(x, θ) ; on dispose d'un échantillon de valeurs données, soit x1, x2, ..., xn, et on veut se faire une idée de la valeur du paramètre inconnu θ. On peut préciser cet énoncé de plusieurs façons. La plus simple conduit à poser le problème de l'estimation ponctuelle : on veut, au vu des observations, choisir une valeur qu'on attribuera à θ. Ce qu'il faut déterminer est donc une application de Rn dans R ; une telle application est appelée un estimateur. On a étudié systématiquement les propriétés des estimateurs, et on convient souvent qu'un bon estimateur doit être :

– sans biais, c'est-à-dire que son espérance mathématique doit être égale à la vraie valeur du paramètre θ ;

– convergent, c'est-à-dire qu'il doit converger en probabilité (ou en moyenne quadratique) vers θ lorsque n tend vers l'infini ;

– de variance minimum (on dit estimateur « efficace »).

On a montré que, avec des hypothèses assez générales, on obtient un estimateur convergent, asymptotiquement sans biais et efficace lorsqu'on utilise la méthode du maximum de vraisemblance : on prend pour valeur estimée ̂θ la valeur de θ qui rend maximum [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 21 pages

Écrit par :

Classification

Autres références

«  STATISTIQUE  » est également traité dans :

APPROCHES TRANSVERSALE ET LONGITUDINALE EN PSYCHOLOGIE DU DÉVELOPPEMENT

  • Écrit par 
  • Henri LEHALLE
  •  • 1 042 mots

S’informer sur le développement des enfants et des adolescents impose de pouvoir comparer leurs comportements aux différents âges. Pour cela, diverses approches méthodologiques sont possibles. Selon une première approche « transversale », les groupes d’âge à comparer sont constitués par des échantillons d’enfants différents : autant d’échantillons que de groupes d’âge. À chaque âge, on note les co […] Lire la suite

ASSURANCE - Histoire et droit de l'assurance

  • Écrit par 
  • Jean-Pierre AUDINOT, 
  • Jacques GARNIER
  • , Universalis
  •  • 7 480 mots
  •  • 1 média

Dans le chapitre « Le calcul actuariel, création européenne »  : […] Pour que cet aléa disparaisse, il fallut attendre que la découverte du calcul des probabilités et le progrès de l'observation statistique permettent une prévision rationnelle du risque. Mais ce n'est qu'au xvii e  siècle que Pascal, à la demande d'un joueur de cartes passionné, le chevalier de Méré, découvre les bases du calcul des probabilités et la loi des grands nombres ( La Géométrie du hasard […] Lire la suite

BAYES THOMAS (1702-1761)

  • Écrit par 
  • Bernard PIRE
  •  • 310 mots

Mathématicien britannique, pionnier de la statistique. Né en 1702 à Londres, Thomas Bayes est le fils d'un des six premiers pasteurs non conformistes à être ordonnés après le refus en 1664 d'une partie de l'Église anglicane d'adhérer à l'Act of Uniformity. Après avoir reçu une solide éducation privée, il est ordonné et devient l'assistant de son père à Holborn (Londres). À la fin des années 1720, […] Lire la suite

BERNSTEIN FELIX (1878-1956)

  • Écrit par 
  • Bernard PIRE
  •  • 335 mots

Mathématicien allemand naturalisé américain, spécialiste de la théorie des ensembles puis des statistiques appliquées. Né le 24 février 1878 à Halle (Allemagne), Felix Bernstein est le fils d'un spécialiste de l'électrobiologie. Élève de Georg Cantor (1845-1918) à Halle, Bernstein démontre en 1897 son fameux théorème sur l'équivalence des ensembles : si deux ensembles A et B sont chacun équivalent […] Lire la suite

BERTILLON LES

  • Écrit par 
  • Christine BARTHET
  •  • 743 mots
  •  • 1 média

Né à Paris, Alphonse Bertillon appartient à une famille prestigieuse. Son père, Louis-Adolphe (1821-1883), ami de Michelet, proche du mouvement socialiste (en juin 1848, il prodigue ses soins aux blessés des barricades), était un médecin renommé, mais aussi un spécialiste des sciences humaines et surtout de la démographie, travaillant sur les traces d'un des fondateurs de cette discipline, le gra […] Lire la suite

BIBLIOMÉTRIE

  • Écrit par 
  • Ghislaine FILLIATREAU
  •  • 1 803 mots
  •  • 1 média

Les bases de la bibliométrie – qui est un ensemble de techniques visant à s’appuyer sur l’analyse des publications scientifiques pour mesurer la production de connaissances nouvelles – se sont véritablement développées à partir des années 1950, lorsque des chercheurs ont pu établir des statistiques sur la science à partir de bases de données bibliographiques recensant les publications scientifiqu […] Lire la suite

BIG DATA

  • Écrit par 
  • François PÊCHEUX
  •  • 6 153 mots
  •  • 3 médias

Dans le chapitre « Les aspects algorithmiques et logiciels du big data »  : […] Les logiciels de gestion de bases de données traditionnels s’appuient sur les mathématiques relatives à la théorie des ensembles pour appliquer des algorithmes de recherche exhaustifs et déterministes (pour un algorithme donné, les mêmes données initiales impliquent le même résultat en sortie) sur des données fortement structurées (en tables contenant des lignes d’informations pertinentes appelées […] Lire la suite

BLACKWELL DAVID (1919-2010)

  • Écrit par 
  • Universalis
  •  • 391 mots

Le statisticien et mathématicien américain David Blackwell apporta une contribution importante à la théorie des jeux, à la théorie des probabilités, à la théorie de l'information et aux statistiques bayésiennes. Il bouscula des barrières raciales quand il devint, en 1965, le premier Noir américain nommé membre de la National Academy of Sciences aux États-Unis. David Harold Blackwell est né le 24 a […] Lire la suite

CALCUL ET RATIONALISATION - (repères chronologiques)

  • Écrit par 
  • Pierre MOUNIER-KUHN
  •  • 732 mots

1623 L'astronome allemand Wilhelm Schickard invente une « horloge à calcul ». Mais celle-ci disparaît dans un incendie et Schickard ne poursuit pas ce projet qui n'aura donc aucune influence historique. 1637 René Descartes, dans le Discours de la méthode , définit la méthode rationnelle de résolution des problèmes : diviser chaque difficulté en opérations ou en éléments aussi simples que possibl […] Lire la suite

CAUSALITÉ

  • Écrit par 
  • Raymond BOUDON, 
  • Marie GAUTIER, 
  • Bertrand SAINT-SERNIN
  •  • 13 000 mots
  •  • 3 médias

Dans le chapitre « Relations causales et relations statistiques »  : […] Eu égard à la première question, remarquons qu'une relation statistique, si elle ne peut s'accompagner d'une interprétation causale, est dépourvue de sens : elle peut donner lieu à une proposition constatant l'existence de cette relation, mais non à un énoncé empirique. Une relation statistique n'a généralement de sens que si elle est interprétable en termes de causalité. Prenons un exemple : les […] Lire la suite

Voir aussi

Les derniers événements

26 août 2021 Suisse. Chiffrage de la baisse du PIB en 2020.

L’Office fédéral de la statistique chiffre à 2,4 % la baisse du PIB en 2020, du fait de la pandémie de Covid-19, contre 2,9 % estimé en février par le secrétariat d’État à l’Économie (SECO). […] Lire la suite

1er-30 avril 2021 Canada. Couvre-feu au Québec contre la Covid-19.

Le 16, Statistique Canada indique que seize mille trois cents personnes de plus sont mortes en 2020 – sur un total de quelque trois cent mille morts – par rapport à ce que la situation démographique pouvait laisser prévoir en l’absence de pandémie, soit une surmortalité de 5,6 %. Le 30, le gouvernement fédéral annonce la suspension de l’administration du vaccin Janssen de Johnson & Johnson contre la Covid-19, en raison de suspicions sur la qualité des composants utilisés. […] Lire la suite

2 mars 2021 Canada. Annonce du taux de croissance en 2020.

Statistique Canada chiffre à 5,4 % la contraction du PIB en 2020, soit la plus forte baisse annuelle depuis l’enregistrement des données trimestrielles en 1961. Le PIB avait fléchi de 1,9 % au premier trimestre et de 11,3 % au deuxième, puis progressé de 8,9 % au troisième et de 2,3 % au quatrième. […] Lire la suite

1er-29 janvier 2021 France. Aménagement des mesures de restriction liées à la Covid-19.

Le 15, l’Institut national de la statistique et des études économiques (INSEE) annonce une surmortalité de 9 % dans le pays en 2020, toutes causes confondues, ce qui représente cinquante-trois mille neuf cents décès supplémentaires. Le 18, la vaccination est ouverte aux personnes de plus de soixante-quinze ans dans les centaines de centres de vaccination prévus à cet effet. […] Lire la suite

14 janvier 2021 Allemagne. Présentation des chiffres de l'économie pour 2020.

Le ministre de l’Économie Peter Altmaier (CDU) présente les chiffres de l’économie pour 2020, publiés par l’institut national de la statistique Destatis. Il annonce une contraction du PIB de 5 %, la première de cette ampleur depuis 2009 en raison de la crise financière, mais toutefois moindre que les prévisions. Le pays enregistre un déficit public de 158,2 milliards d’euros, le premier depuis l’entrée en vigueur en 2011 du mécanisme constitutionnel de « frein à la dette » qui limite le déficit à 0,35 % du PIB. […] Lire la suite

Pour citer l’article

Georges MORLAT, « STATISTIQUE », Encyclopædia Universalis [en ligne], consulté le 19 mai 2022. URL : https://www.universalis.fr/encyclopedie/statistique/