BIG DATA

Carte mentale

Élargissez votre recherche dans Universalis

Médias de l’article

Centre de données

Centre de données
Crédits : Google

photographie

Apprentissage supervisé

Apprentissage supervisé
Crédits : Encyclopædia Universalis France

dessin

Apprentissage non supervisé

Apprentissage non supervisé
Crédits : Encyclopædia Universalis France

dessin


Caractéristiques des données du big data

Les données du big data sont donc en perpétuelle expansion (plus ou moins contrôlée), sont acquises à travers de multiples canaux (trafic Internet généré, capteurs…) à des rythmes très différents (de la nanoseconde pour les transactions boursières au jour ou à l’année pour les mesures sur des données démographiques ou sociétales) et sont de différentes natures (texte, vidéo, image, son, biométrie, etc.). Elles sont aussi acquises dans un contexte qui peut, le cas échéant, dégrader la quantité et la qualité de l’information associée. Dans un monde où les fausses nouvelles (fake news) pullulent, on pourra ainsi accorder un degré de confiance en fonction de l’émetteur de la donnée.

Après prétraitement (formatage, conversion, filtrage), les données du big data sont analysées à l’aide d’algorithmes complexes permettant de les identifier, de les classer de manière automatique, sans intervention humaine. Afin de définir aussi précisément que possible la taille de l’espace dans lequel s’opèrent ces analyses, plusieurs générations de modèles de représentation des données du big data ont successivement vu le jour. Le plus connu est le modèle 3V (pour volume, vitesse, variété). Le modèle 4V ajoute la véracité (une donnée est liée à un facteur de vraisemblance) aux trois précédentes caractéristiques. Au gré des inspirations du marketing, d’autres V (par exemple pour valeur, qui associe un coût financier à l’information) ont également fait leur apparition.

Volume des données

Le volume des données est certainement ce qui caractérise le mieux l’expression « big data ». Il suffit d’égrener certaines grandeurs pour apprécier le volume colossal des données générées : 7 milliards d’individus sur Terre, 6 milliards de possesseurs de téléphones portables ou de smartphones, 100 à 120 téraoctets de données nécessaires pour rendre compte de l’activité d’une grande entreprise mondiale, 150 exaoctets pour représenter l’ensemble des données médicales de la population mondiale, 30 milliards de contenus Web différe [...]


1  2  3  4  5
pour nos abonnés,
l’article se compose de 10 pages



Écrit par :

Classification


Autres références

«  BIG DATA  » est également traité dans :

APPRENTISSAGE PROFOND ou DEEP LEARNING

  • Écrit par 
  • Jean-Gabriel GANASCIA
  •  • 2 649 mots
  •  • 1 média

Dans le chapitre « Différents types d’apprentissage machine »  : […] On distingue usuellement au moins trois types d’apprentissage machine : l’apprentissage par renforcement, l’apprentissage supervisé et l’apprentissage non supervisé. L’apprentissage par renforcement suppose que, lors de ses pérégrinations, un agent (entité qui agit de façon autonome) reçoit des récompenses ou des punitions en fonction des actions qu’il exécute. Il s’agit alors d’établir automatiq […] Lire la suite☛ http://www.universalis.fr/encyclopedie/apprentissage-profond-deep-learning/#i_57306

CONSOMMATION - Comportement du consommateur

  • Écrit par 
  • Bernard DUBOIS, 
  • Marc VANHUELE
  •  • 8 995 mots
  •  • 1 média

Par « comportement du consommateur », on entend l'ensemble des comportements qui se rapportent à l'acquisition de biens et services. On y inclut l’exposition à des messages commerciaux et à d’autres types d’information, l'expérience de l’utilisation des biens et services achetés et l'abandon éventuel de ces produits. La consommation occupe une place importante dans les activités des individus, en […] Lire la suite☛ http://www.universalis.fr/encyclopedie/consommation-comportement-du-consommateur/#i_57306

HISTOIRE GLOBALE

  • Écrit par 
  • Pierre-Yves SAUNIER
  •  • 5 954 mots
  •  • 1 média

Dans le chapitre « Les discours de la méthode »  : […] La façon de concevoir et de mener l’enquête historique est une autre dimension où se confrontent des manières de penser et de faire au sujet des matériaux de l’enquête historienne. Une posture empirique place fermement les sources originales au pivot de la démarche de recherche. Ici, on se questionne sur les formes de leur fréquentation et de leur lecture, qu’il s’agisse de l’archive coloniale, d […] Lire la suite☛ http://www.universalis.fr/encyclopedie/histoire-globale/#i_57306

INTELLIGENCE ARTIFICIELLE (IA)

  • Écrit par 
  • Jean-Gabriel GANASCIA
  •  • 5 073 mots
  •  • 5 médias

Dans le chapitre « Renaissance de l’intelligence artificielle  »  : […] Depuis 2010, la puissance des machines permet d’exploiter de grandes masses de données (ce que l’on appelle couramment les b ig d ata ) avec des techniques d’apprentissage machine qui se fondent sur le recours à des réseaux de neurones formels, c’est-à-dire à des techniques relativement anciennes que l’on déplo […] Lire la suite☛ http://www.universalis.fr/encyclopedie/intelligence-artificielle-ia/#i_57306

MÉDECINE ET INTERNET

  • Écrit par 
  • Philippe MARREL, 
  • Elisabeth PARIZEL, 
  • René WALLSTEIN
  •  • 5 384 mots
  •  • 3 médias

Dans le chapitre « La navigation sur Internet : une donnée médicale »  : […] Chaque requête et l’exploitation qu’en fait l’utilisateur laissent des traces sur le réseau qui sont soigneusement collectées et deviennent autant de données attachées à la personne qui a lancé la requête. Google et les autres moteurs de recherche se sont fait une spécialité de la collecte et de l’exploitation des quantités astronomiques de données ainsi accumulées, les big […] Lire la suite☛ http://www.universalis.fr/encyclopedie/medecine-et-internet/#i_57306

Voir aussi

Pour citer l’article

François PÊCHEUX, « BIG DATA », Encyclopædia Universalis [en ligne], consulté le 10 octobre 2019. URL : http://www.universalis.fr/encyclopedie/big-data/