Entrepot de Donnees
Bases de Donnees Multidimensionnelles
L'analyse multidimensionnelle est la capacité à analyser des données
qui ont été
agrégées suivant plusieurs dimensions. On veut donc accéder
à des données déjà agrégés selon les
besoins de l'utilisateur, de façon simple est rapide.
On utilise pour cela des hypercubes OLAP. Les données sont représentées
dans des hypercubes à n dimensions. Les données sont structurées
suivant plusieurs axes d'analyses (dimensions) comme le temps, la localisation
...
Une cellule est l'intersection des différentes dimensions. Le calcul de chaque cellule
est réalisé au chargement. Le temps de réponse est ainsi
stable quelque soit la requête.
Illustration 16: Représentation d'un hypercube (source
: J Detroyes, supinfo)
Cela permet, dans l'exemple du schéma ci-dessus, d'analyser la répartition
de l'indicateur « vente » suivant le temps, les catégories
de produit et les régions.
En outre, des hiérarchies seront définies pour chaque axe d'analyse
(par exemple, l'année, puis la saison, le mois et la semaine, pour l'axe
temps). Une fois cette structure multidimensionnelle établie, l'outil
OLAP propose des méthodes de navigation dans les données : drill-down/drill-up,
rotate, slicing, scoping.
Drill-up / down
Cela permet d'aller vers les informations détaillées dans une hiérarchie
ou au contraire de remonter d'un niveau de granularité. Il s'agit donc
de « zoumer ou de dézoumer » sur une dimension.
Illustration 17: Drill Up/ Drill Down (source : D Donsez, Université
Joseph Fournier)
Rotate
Consiste à effectuer une rotation de l'hypercube afin de présenter une face différente.
Il s'agit donc de modifier une dimension de lecture.
Illustration 18: Rotate (source : D Donsez, Université
Joseph Fournier)
Slicing
Consiste à ne travailler que sur une tranche de l'hypercube. Une des dimensions est alors réduites
à une seule valeur .
Illustration 19: Slicing (source : D Donsez, Université
Joseph Fournier)
Scoping
Consiste à ne travailler que sur un sous-cube. On s'intéressera alors seulement
à une partie des données.
Illustration 20: Scoping (source : D Donsez, Université
Joseph Fournier)
Differents OLAP
Au niveau logique il existe plusieurs possibilités pour la modélisation multidimensionnel : ROLAP, MOLAP, HOLAP et OOLAP ROLAP : Dans le Relational OLAP les données sont stockées dans une base de données relationnelle. Un moteur OLAP permet de simuler le fonctionnement d'un hypercube. Cela permet une facilité dans la mise à jour des données. MOLAP : Le Multidimensional OLAP consiste à utiliser un système multidimensionnelle pur, qui gère des structures multidimensionnelles natives. Elles utilisent des tableaux à n dimensions. L'accès aux données se fait directement dans le cube. Cela permet une rapidité d'accès à l'information mais augmente le temps de mise à jour. HOLAP : HOLAP (Hybrid OLAP) est un hybride entre ROLAP ET HOLAP. Les parties tables de faits et tables de dimensions sont stockées dans une base relationnelle standard tandis que le reste des données (les calculs) sont stockées dans une base multidimensionnelle. OOLAP : C'est la technologie la plus récente, Object OLAP, qui s'appuie sur le paradigme objet. Le modèle multidimensionnel se traduit ainsi :
- chaque fait correspond à une classe, appelée classe de fait.
- chaque dimension correspond à une classe, appelée classe de dimension.