Abonnez-vous à Universalis pour 1 euro

BIG DATA

Risques liés au big data

Le big data est un agencement subtil de technologies matérielles et logicielles offrant à celui qui le maîtrise et le contrôle un énorme pouvoir en termes politique, économique et social. Avec des grandeurs qui dépassent l’entendement, c’est un domaine qui offre la part belle aux fantasmes, à l’anticipation. Les quelques entreprises mondiales qui ont les ressources financières suffisantes pour investir des dizaines de milliards de dollars dans ces technologies savent pertinemment qu’elles vont pouvoir en tirer des profits encore plus importants. Le monde appartient en effet à ceux qui créent et distillent une information instantanée, contrôlée à l’échelle planétaire et pouvant influencer l’humanité tout entière.

Atteinte à la vie privée

Les informations collectées par le big data peuvent contenir des données personnelles qui, lorsqu'elles sont restructurées, acquièrent très rapidement une valeur marchande très importante. Quel que soit leur mode d’acquisition, légal ou illégal (par exemple le scandale Cambridge Analytica, du nom de la société britannique accusée d’avoir récupéré les données personnelles de dizaines de millions d’utilisateurs de Facebook à des fins politiques), public ou secret, les données accumulées sont souvent revendues ou exploitées à l’insu de l’individu concerné pour le compte d’agences de marketing ou d’organismes de sondage. Toute transaction bancaire, tout échange téléphonique ou toute opération de roaming (accès au réseau téléphonique depuis un pays étranger), tout historique des consultations Internet, peut et va devenir un indicateur clair du mode de vie d’un individu, et la tentation est grande d’utiliser la valeur de cet indicateur pour le compte de formations politiques, de groupes religieux ou d’entreprises. L’appropriation de ces informations par un nombre réduit de grands groupes (Amazon, Google, Twitter, Facebook…), par des organismes d’État plus ou moins officiels, permet par croisement d’informations d’obtenir un profil socioculturel extrêmement précis d’une personne, de connaître son mode de vie et de la solliciter en fonction de ce profil (achats, consommation, mais aussi élections). On peut alors légitimement se poser la question de l’exploitation du big data à des fins de surveillance et de manipulation de la population.

Entropie incontrôlée et infobésité

Le big data est par sa définition même sujet à un autre danger intrinsèque majeur : le « déluge de données » (data deluge). Celui-ci correspond à une surproduction d’informations que l’on ne sait pas traiter correctement, ou sinon au détriment de leur véracité ou de leur valeur. Il se traduit par une pollution comparable à une marée noire d’informations dont on ne peut s’extirper, causant des dysfonctionnements et une augmentation de l’entropie (du désordre) dans notre monde numérique. Certains experts parlent aussi d’« infobésité » pour décrire ce phénomène de surcharge d’informations.

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

Classification

Pour citer cet article

François PÊCHEUX. BIG DATA [en ligne]. In Encyclopædia Universalis. Disponible sur : (consulté le )

Médias

Centre de données - crédits : Google

Centre de données

Apprentissage non supervisé - crédits : Encyclopædia Universalis France

Apprentissage non supervisé

Apprentissage supervisé - crédits : Encyclopædia Universalis France

Apprentissage supervisé

Autres références

  • APPRENTISSAGE PROFOND ou DEEP LEARNING

    • Écrit par Jean-Gabriel GANASCIA
    • 2 645 mots
    • 1 média
    L’apprentissage supervisé recourt à des techniques variées fondées sur la logique ou la statistique et s’inspirant de modèles psychologiques, physiologiques ou éthologiques. Parmi celles-ci, des techniques anciennes reposant sur un modèle très approximatif du tissu cérébral – les réseaux...
  • CONSOMMATION - Comportement du consommateur

    • Écrit par Bernard DUBOIS, Marc VANHUELE
    • 9 030 mots
    • 1 média

    Par « comportement du consommateur », on entend l'ensemble des comportements qui se rapportent à l'acquisition de biens et services. On y inclut l’exposition à des messages commerciaux et à d’autres types d’information, l'expérience de l’utilisation des biens et services achetés et l'abandon éventuel...

  • HISTOIRE GLOBALE

    • Écrit par Pierre-Yves SAUNIER
    • 5 932 mots
    • 1 média
    La montée en puissance des ressources en données massives (big data) et de leur possibilité de traitement approfondit cette fracture méthodologique. Le Collaborative for Historical Information and Analysis (CHIA, fondé en 2011, université de Pittsburgh), le projet Pulotu (Database of Pacific Religions),...
  • INTELLIGENCE ARTIFICIELLE (IA)

    • Écrit par Jean-Gabriel GANASCIA
    • 5 584 mots
    • 5 médias
    Depuis 2010, la puissance des machines permet d’exploiter de grandes masses de données (ce que l’on appelle couramment les big data) avec des techniques d’apprentissage machine qui se fondent sur le recours à des réseaux de neurones formels, c’est-à-dire à des techniques relativement anciennes que...
  • Afficher les 7 références

Voir aussi