Mettre à jour son Data Warehouse


Le Data Warehouse est la zone de stockage de données utiles pour l’analyse décisionnelle. En réalité lorsque le système décisionnel est établi pour la première fois dans l’entreprise, le Data Warehouse est chargé par toutes les données issues des différentes sources de données, ce chargement s’appelle « Chargement initial ».

Mais par la suite, il faut programmer des chargements incrémentiels périodiques. La particularité de ces chargements réside dans le fait qu’on ne récupère que les mises à jour aux niveaux des sources de données.   

Pour réussir ce type de chargement, il faut pouvoir capturer les changements aux niveaux des différentes sources. La capture de changement peut se faire à travers :

      1.      Comparaison des instances de bases de données : cette méthode repose sur l’utilisation des Dalta Files aux niveaux des systèmes sources, elle permet de comparer les instances de bases de données ligne par ligne. Cette méthode est très simple et elle est recommandée pour les petites bases de données car elle est gourmande en temps.
      
     2.      Time-Stamping : elle est bien lorsqu’il existe un champ de la dernière date de changement dans les tables de la source.
     
      3.      Triggers de Bases de données : on peut programmer des triggers aux niveaux des sources de données qui se déclenchent à chaque changement  dans les sources.

     4.      Fichiers Log de bases de données : ce sont des fichiers journaux ou de traces qui contiennent  trace de la base de données.


Comments

Popular posts from this blog