1. Architecture générale d'un entrepôt de données
L'idée générale de la chaîne décisionnelle (fig. 1a) est de fournir aux décideurs, sous une forme appropriée, les informations qui vont les aider à prendre les décisions.
• La chaîne décisionnelle
Les données sont extraites à partir des sources puis stockées dans un entrepôt de données. On duplique les données pour ne pas travailler directement sur les sources, cela pour trois raisons :
– L'historisation des données sur de nombreuses années est un point capital de l'entrepôt. C'est à partir de l'historique que des extrapolations pourront être faites. Aucune suppression de donnée n'est effectuée dans l'entrepôt, ce qui implique que l'attribut date soit présent dans toutes les relations pour indiquer le début et la fin de validité d'une donnée. Cela permet par exemple de suivre le comportement d'un client au fil des changements qui peuvent intervenir dans sa vie ;
– Les interrogations effectuées à des fins décisionnelles font généralement intervenir un très grand nombre d'enregistrements (par exemple le calcul de toutes les ventes sur plusieurs années) et perturberaient gravement les performances des traitements de production ;
– Pour optimiser les temps de réponse, les requêtes effectuées par les applications de productions pour lesquelles ont été conçues les bases de données ne nécessitent pas les mêmes choix d'organisation à la fois logiciels (schéma physique de la base de données) et matériels (logiciels de stockage).
Les sources
La notion d'entrepôt de données est fondée sur le postulat que l'entreprise regorge de données stockées momentanément – pour des besoins précis de gestion – et qui ne sont plus jamais exploitées alors qu'elles représentent un gisement d'information de grande valeur. Les principales sources sont donc les bases de données existant dans l'entreprise et développées pour les applications de production, par exemple […]
… pour nos abonnés, l'article se prolonge sur 12 pages…



