Utilisation d’un Staging Area


Le Staging Area est une zone intermédiaire entre la source de données qui peut être une Base de données, des fichiers Excel, des pages web… et la des destination qui est généralement un entrepôt de données ou un magasin de données.

Le Staging Area permet de garder les données extraites à partir de la source pendant une durée avant de les charger dans l’entrepôt. Au lieu que le processus ETL soit appliqué sur les données au même temps qu’elles soient extraites et puis chargées directement, on préfère charger d’abord toutes les données nécessaires à l’analyse décisionnelle dans une zone intermédiaire pour libérer la source de données. Puis appliquer l’ETL sur les données récupérées du Staging Area.

Donc, si la source de données est tous les temps utilisée par les utilisateurs du système opérationnel de l’entreprise, alors le Staging Area est très recommandé parce que la source doit être accessible par le processus ETL pendant une durée bien limitée afin d’éviter le blocage du système opérationnel.
Par contre, s’il y a une période déterminée et suffisante pendant laquelle la source est libérée et on peut appliquer librement le processus ETL alors dans ce cas l’utilisation du Staging Area n’est pas forcément justifiée car elle engendre un traitement en plus.


Après tout, ça reste un choix à prendre selon les besoin du concepteur de l’ETL.      

Comments

Popular posts from this blog