On appelle, de façon générale, bases de production toutes les sources (qu’il s’agisse de données de production, d’informations internes ou d’informations externes quel que soit leur mode de stockage) dont il va falloir extraire des données en vue d’alimenter le datawarehouse. On trouvera:
La base de données est le constituant principal du data warehouse puisque c’est dans celle-ci que l’on va stocker les informations extraites des bases de production.
C’est au sein du SGBD (système de gestion de bases de données) qu’est stocké le dictionnaire du datawarehouse où sont stockées les métadonnées, c’est-à-dire « les données sur les données stockées dans le SGBD » décrivant la manière dont sont constituées les informations stockées.
Le data warehouse est supporté par une base de données relationnelle, multidimensionnelle ou objet, même si celles-ci sont assez rares ou utilisés dans des contextes assez particuliers.
La base de données relationnelle présente une organisation de l’information s’appuyant sur des relations existant entre des tables. Ainsi, si la table des clients est en relation avec la table des factures de l’entreprise, alors on pourra établir la liste des factures par client.
Les bases de données multidimensionnelles sont utilisées de manière très spécifique pour certaines applications d’aide à la décision. Par rapport à l’utilisation d’une base de données relationnelle, les bases de données multidimensionnelles présentent des avantages incontestables :
Un data mart est un magasin de données. Il s’agit d’une solution départementale d’entrepôt de données (data warehouse) supportant une partie des données et fonctions de l’entreprise (produit, département, activité, etc.). C’est un sous-ensemble du data warehouse qui ne contient que les données d’un métier de l’entreprise alors que le data warehouse contient toutes les données décisionnelles de l’entreprise pour tous les métiers.
Ces deux anglicismes, entrés tels quels dans le langage informatique, ne sont ni plus ni moins que deux manières de désigner l’organisation du système de données d’une entreprise, le lieu où se tient son « intelligence ». Destinés à regrouper l’ensemble des contenus nécessaires à une application d’analyse décisionnelle, les entrepôts de données se partagent donc en deux grandes catégories :
