L'information est la matière première la plus précieuse pour la compétitivité des entreprises au xxie siècle et l'intelligence – humaine ou artificielle – a besoin de cette connaissance pour aider à la prise de décision. Le partage de données et la diffusion de connaissance sont donc les domaines les plus sollicités de l'informatique dans tous les domaines d'activité, de la grande distribution à la recherche médicale. Les systèmes d'information ont permis, à partir des années 1970, d'optimiser les activités de production de l'entreprise, ils ont aussi permis d'engranger dans les bases de données de véritables « gisements » d'informations. L'idée s'est alors faite dès les années 1980, en particulier grâce aux travaux de Ralph Kimball, de les utiliser à des fins décisionnelles et de les organiser pour en extraire de précieux renseignements.
En 1994, William Inmon a formalisé le concept d'entrepôt de données (en anglais data warehouse) : « Un entrepôt de données est une collection de données thématiques, intégrées, non volatiles et historisées, organisées pour le support à la prise de décision ». Jean-François Goglin définit un entrepôt de données comme un stockage intermédiaire de données issues des applications de production, dans lequel les utilisateurs finaux puisent avec des outils de restitution et d'analyse. Cette dernière définition résume bien toute la « chaîne décisionnelle » que suivent les données pour devenir des informations dont la connaissance améliorera les résultats de l'entreprise.
Nous détaillerons d'abord les différents processus de la chaîne décisionnelle, en particulier celui de l'intégration sémantique des données, qui représente la tâche la plus complexe de la chaîne. Puis nous présenterons le modèle OLAP, proposé par Edgar F. Codd, spécialement conçu pour la diffusion des informations à des fins décisionnelles. Enfin, nous montrerons les différents types de restitutions pour la business intelligence, dont l'objet est l'exploitation de cette information pour constituer une base de connaissance.
1. Architecture générale d'un entrepôt de données
… pour nos abonnés, l'article se prolonge sur 12 pages…



