BIG DATA

Carte mentale

Élargissez votre recherche dans Universalis

Les aspects matériels du big data

Les algorithmes et les outils logiciels liés au big data s’exécutent sur de puissantes machines fortement connectées en réseaux, les centres de données ou data centers. Ces outils ont pour principale fonction d’analyser de grands ensembles de données possiblement disparates ou entachées d’erreurs pour y trouver un sens, une loi d’évolution. La manière de procéder est à peu près toujours la même : « décomposer pour régner » (divide and conquer). L’analyse globale est découpée en sous-analyses indépendantes traitées en parallèle par des ordinateurs nœuds de calcul, ce qui correspond à la phase de déploiement (map en anglais) du calcul. Les résultats sont ensuite calculés indépendamment par ces nœuds de calcul, puis rassemblés et agglomérés pour être réduits (data reduction) à un résultat, la loi d’évolution recherchée. Cette technologie, connue sous le nom de MapReduce, a été développée avec succès par la société américaine Google, en utilisant l’environnement de développement libre Hadoop, qui permet de créer facilement des applications réparties sur les différents centres de données. Remplacé en 2014 par Spark, plus rapide, MapReduce a inspiré plusieurs autres acteurs majeurs comme Oracle ou Microsoft, qui s’appuient sur leur propre solution de cloud computing (« informatique en nuage ») pour un service identique.


1  2  3  4  5
pour nos abonnés,
l’article se compose de 10 pages

Médias de l’article

Centre de données

Centre de données
Crédits : Google

photographie

Apprentissage supervisé

Apprentissage supervisé
Crédits : Encyclopædia Universalis France

dessin

Apprentissage non supervisé

Apprentissage non supervisé
Crédits : Encyclopædia Universalis France

dessin

Afficher les 3 médias de l'article


Écrit par :

Classification

Autres références

«  BIG DATA  » est également traité dans :

APPRENTISSAGE PROFOND ou DEEP LEARNING

  • Écrit par 
  • Jean-Gabriel GANASCIA
  •  • 2 649 mots
  •  • 1 média

Dans le chapitre « Différents types d’apprentissage machine »  : […] On distingue usuellement au moins trois types d’apprentissage machine : l’apprentissage par renforcement, l’apprentissage supervisé et l’apprentissage non supervisé. L’apprentissage par renforcement suppose que, lors de ses pérégrinations, un agent (entité qui agit de façon autonome) reçoit des récompenses ou des punitions en fonction des actions qu’il exécute. Il s’agit alors d’établir automatiq […] Lire la suite

CONSOMMATION - Comportement du consommateur

  • Écrit par 
  • Bernard DUBOIS, 
  • Marc VANHUELE
  •  • 8 995 mots
  •  • 1 média

Par « comportement du consommateur », on entend l'ensemble des comportements qui se rapportent à l'acquisition de biens et services. On y inclut l’exposition à des messages commerciaux et à d’autres types d’information, l'expérience de l’utilisation des biens et services achetés et l'abandon éventuel de ces produits. La consommation occupe une place importante dans les activités des individus, en […] Lire la suite

HISTOIRE GLOBALE

  • Écrit par 
  • Pierre-Yves SAUNIER
  •  • 5 954 mots
  •  • 1 média

Dans le chapitre « Les discours de la méthode »  : […] La façon de concevoir et de mener l’enquête historique est une autre dimension où se confrontent des manières de penser et de faire au sujet des matériaux de l’enquête historienne. Une posture empirique place fermement les sources originales au pivot de la démarche de recherche. Ici, on se questionne sur les formes de leur fréquentation et de leur lecture, qu’il s’agisse de l’archive coloniale, d […] Lire la suite

INTELLIGENCE ARTIFICIELLE (IA)

  • Écrit par 
  • Jean-Gabriel GANASCIA
  •  • 5 073 mots
  •  • 5 médias

Dans le chapitre « Renaissance de l’intelligence artificielle  »  : […] Depuis 2010, la puissance des machines permet d’exploiter de grandes masses de données (ce que l’on appelle couramment les b ig d ata ) avec des techniques d’apprentissage machine qui se fondent sur le recours à des réseaux de neurones formels, c’est-à-dire à des techniques relativement anciennes que l’on déploie aujourd’hui sur des architectures de dimensions beaucoup plus importantes qu’auparava […] Lire la suite

MÉDECINE ET INTERNET

  • Écrit par 
  • Philippe MARREL, 
  • Elisabeth PARIZEL, 
  • René WALLSTEIN
  •  • 5 384 mots
  •  • 3 médias

Dans le chapitre « La navigation sur Internet : une donnée médicale »  : […] Chaque requête et l’exploitation qu’en fait l’utilisateur laissent des traces sur le réseau qui sont soigneusement collectées et deviennent autant de données attachées à la personne qui a lancé la requête. Google et les autres moteurs de recherche se sont fait une spécialité de la collecte et de l’exploitation des quantités astronomiques de données ainsi accumulées, les big data ou mégadonnées. […] Lire la suite

Voir aussi

Les derniers événements

Chine. Stockage dans le pays des données des utilisateurs chinois d’Apple. 27 février 2018

La firme d’électronique américaine Apple annonce qu’elle a achevé le transfert en Chine des données de ses utilisateurs chinois, jusque-là stockées aux États-Unis, en application d’une loi chinoise adoptée en novembre 2016 et entrée en vigueur en juin 2017. Le centre de données doit être géré par Cloud Big Data Industrial Development Co, une entreprise liée au gouvernement de Pékin. […] Lire la suite

Pour citer l’article

François PÊCHEUX, « BIG DATA », Encyclopædia Universalis [en ligne], consulté le 25 octobre 2020. URL : https://www.universalis.fr/encyclopedie/big-data/