SYSTÈMES INFORMATIQUESSystèmes d'aide à la décision

Carte mentale

Élargissez votre recherche dans Universalis

L'information est la matière première la plus précieuse pour la compétitivité des entreprises au xxie siècle et l'intelligence – humaine ou artificielle – a besoin de cette connaissance pour aider à la prise de décision. Le partage de données et la diffusion de connaissance sont donc les domaines les plus sollicités de l'informatique dans tous les domaines d'activité, de la grande distribution à la recherche médicale. Les systèmes d'information ont permis, à partir des années 1970, d'optimiser les activités de production de l'entreprise, ils ont aussi permis d'engranger dans les bases de données de véritables « gisements » d'informations. L'idée s'est alors faite dès les années 1980, en particulier grâce aux travaux de Ralph Kimball, de les utiliser à des fins décisionnelles et de les organiser pour en extraire de précieux renseignements.

En 1994, William Inmon a formalisé le concept d'entrepôt de données (en anglais data warehouse) : « Un entrepôt de données est une collection de données thématiques, intégrées, non volatiles et historisées, organisées pour le support à la prise de décision ». Jean-François Goglin définit un entrepôt de données comme un stockage intermédiaire de données issues des applications de production, dans lequel les utilisateurs finaux puisent avec des outils de restitution et d'analyse. Cette dernière définition résume bien toute la « chaîne décisionnelle » que suivent les données pour devenir des informations dont la connaissance améliorera les résultats de l'entreprise.

Nous détaillerons d'abord les différents processus de la chaîne décisionnelle, en particulier celui de l'intégration sémantique des données, qui représente la tâche la plus complexe de la chaîne. Puis nous présenterons le modèle OLAP, proposé par Edgar F. Codd, spécialement conçu pour la diffusion des informations à des fins décisionnelles. Enfin, nous montrerons les différents types de restitutions pour la business intelligence, dont l'objet est l'exploitation de cette information pour constituer une base de connaissance.

Architecture générale d'un entrepôt de données

L'idée générale de la chaîne décisionnelle (fig. 1a) est de fournir aux décideurs, sous une forme appropriée, les informations qui vont les aider à prendre les décisions.

Systèmes décisionnels : chaîne décisionnelle et entrepôt de données

Dessin : Systèmes décisionnels : chaîne décisionnelle et entrepôt de données

Chaîne décisionnelle et entrepôt de données. 

Crédits : Encyclopædia Universalis France

Afficher

La chaîne décisionnelle

Les données sont extraites à partir des sources puis stockées dans un entrepôt de données. On duplique les données pour ne pas travailler directement sur les sources, cela pour trois raisons :

– L'historisation des données sur de nombreuses années est un point capital de l'entrepôt. C'est à partir de l'historique que des extrapolations pourront être faites. Aucune suppression de donnée n'est effectuée dans l'entrepôt, ce qui implique que l'attribut date soit présent dans toutes les relations pour indiquer le début et la fin de validité d'une donnée. Cela permet par exemple de suivre le comportement d'un client au fil des changements qui peuvent intervenir dans sa vie ;

– Les interrogations effectuées à des fins décisionnelles font généralement intervenir un très grand nombre d'enregistrements (par exemple le calcul de toutes les ventes sur plusieurs années) et perturberaient gravement les performances des traitements de production ;

– Pour optimiser les temps de réponse, les requêtes effectuées par les applications de productions pour lesquelles ont été conçues les bases de données ne nécessitent pas les mêmes choix d'organisation à la fois logiciels (schéma physique de la base de données) et matériels (logiciels de stockage).

Les sources

La notion d'entrepôt de données est fondée sur le postulat que l'entreprise regorge de données stockées momentanément – pour des besoins précis de gestion – et qui ne sont plus jamais exploitées alors qu'elles représentent un gisement d'information de grande valeur. Les principales sources sont donc les bases de données existant dans l'entreprise et développées pour les applications de production, par exemple les bases de données des clients, des factures, des produits, des ventes, des stocks. En particulier, les tickets de caisse dans la grande distribution sont particulièrement porteurs d'information, d'autant plus qu'ils contiennent désormais de nombreux renseignements sur l'acheteur grâce aux cartes de fidélité.

Les sources continuent à avoir leur vie propre sans trop d'influence de la mise en place du système décisionnel, la chaîne décisionnelle étant justement créée pour ne pas les perturber par des interrogations très consommatrices en ressources.

Des sources externes à l'entreprise peuvent être injectées dans l'entrepôt, par exemple des bases de données météorologiques, boursières, géographiques, des études statistiques. Beaucoup de données numérisées sont actuellement disponibles.

L'extraction

L'extraction a pour but d'extraire les données des différentes sources et de les mettre dans un format commun. Le format commun est généralement le modèle relationnel, mais le modèle XML commence à s'imposer. Chaque source possède un extracteur (appelé wrapper en anglais) qui en extrait les données nécessaires à l'alimentation de l'entrepôt, c'est-à-dire celles qui sont considérées a priori comme utiles aux besoins des décideurs.

Stratégies de rafraîchissement

L'extracteur doit appliquer une stratégie de rafraîchissement : périodique ou sur déclenchement. Dans le cas d'un rafraîchissement périodique, les données sont systématiquement exportées à intervalle fixe vers l'entrepôt, par exemple tous les jours. Le deuxième type de rafraîchissement déclenche l'exportation sur un événement. Cette dernière solution permet par exemple d'exporter toutes les données concernant le séjour d'un patient à l'hôpital à la survenue de l'événement « fin du séjour », car ce n'est qu'ensemble qu'elles fourniront des informations d'intérêt médical. Pour réaliser une alimentation en temps réel, on déclare événement déclencheur l'insertion d'un nouvel enregistrement dans la source.

Le mode d'extraction le plus fréquemment appliqué est celui d'une extraction périodique journalière déclenchée tous les soirs vers 19 heures et s'exécutant la nuit, lorsque les traitements de productions sont moins sensibles aux perturbations. Notons que les différentes données d'une même source n'ont pas obligatoirement le même mécanisme d'extraction.

Mise en œuvre

Pour programmer les extracteurs, le développeur peut s'aider des fonctionnalités de réplication de haut niveau fournies par les systèmes de gestion de base de données (S.G.B.D.), par exemple les déclencheurs, les mécanismes de vue concrète ou l'exploitation des journaux.

Les extracteurs peuvent également être automatiquement générés par un outil ETL (extraction transformation loading) : par une interface graphique de très haut niveau, l'utilisateur trace un trait de la table source vers la table cible et peut spécifier quelques règles de transformation à effectuer au passage. L'ETL fournit le code source de [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 13 pages

Médias de l’article

Systèmes décisionnels : chaîne décisionnelle et entrepôt de données

Systèmes décisionnels : chaîne décisionnelle et entrepôt de données
Crédits : Encyclopædia Universalis France

dessin

Systèmes décisionnels : ontologie

Systèmes décisionnels : ontologie
Crédits : Encyclopædia Universalis France

dessin

Systèmes décisionnels : cube OLAP

Systèmes décisionnels : cube OLAP
Crédits : Encyclopædia Universalis France

dessin

Systèmes décisionnels : stockage dans une matrice MOLAP

Systèmes décisionnels : stockage dans une matrice MOLAP
Crédits : Encyclopædia Universalis France

tableau

Afficher les 7 médias de l'article


Écrit par :

  • : professeur des Universités en informatique au Conservatoire national des arts et métiers, Paris

Classification

Autres références

«  SYSTÈMES INFORMATIQUES  » est également traité dans :

SYSTÈMES INFORMATIQUES - Systèmes de gestion de bases de données

  • Écrit par 
  • Bernd AMANN, 
  • Michel SCHOLL
  •  • 6 201 mots
  •  • 4 médias

Un système de gestion de bases de données (S.G.B.D.) est un ensemble de logiciels informatiques pour la gestion d'informations. Sa tâche principale est de fournir à des applications informatiques un support de stockage et de gestion de données à travers une interface de haut niveau. Il doit être capable de manipuler de très grands volumes de données d'une […] Lire la suite

SYSTÈMES INFORMATIQUES - Conception, architecture et urbanisation des systèmes d'information

  • Écrit par 
  • Sylvie SERVIGNE
  •  • 3 256 mots
  •  • 7 médias

Le système d'information est aujourd'hui un élément central du fonctionnement d'une organisation. Un système d'information peut être défini comme un ensemble de ressources (personnel, logiciels, processus, données, matériels, équipements informatique et de télécommunication...) permettant la collecte, le stockage, la structuration, la m […] Lire la suite

Voir aussi

Pour citer l’article

Elisabeth METAIS, « SYSTÈMES INFORMATIQUES - Systèmes d'aide à la décision », Encyclopædia Universalis [en ligne], consulté le 02 décembre 2021. URL : https://www.universalis.fr/encyclopedie/systemes-informatiques-systemes-d-aide-a-la-decision/