Utilisation d’un Staging Area
Le Staging Area est une zone intermédiaire entre la source
de données qui peut être une Base de données, des fichiers Excel, des pages web…
et la des destination qui est généralement un entrepôt de données ou un magasin
de données.
Le Staging Area permet de garder les données extraites à
partir de la source pendant une durée avant de les charger dans l’entrepôt. Au lieu
que le processus ETL soit appliqué sur les données au même temps qu’elles soient
extraites et puis chargées directement, on préfère charger d’abord toutes les
données nécessaires à l’analyse décisionnelle dans une zone intermédiaire pour
libérer la source de données. Puis appliquer l’ETL sur les données récupérées du
Staging Area.
Donc, si la source de données est tous les temps utilisée
par les utilisateurs du système opérationnel de l’entreprise, alors le Staging
Area est très recommandé parce que la source doit être accessible par le
processus ETL pendant une durée bien limitée afin d’éviter le blocage du
système opérationnel.
Par contre, s’il y a une période déterminée et suffisante
pendant laquelle la source est libérée et on peut appliquer librement le
processus ETL alors dans ce cas l’utilisation du Staging Area n’est pas forcément
justifiée car elle engendre un traitement en plus.
Après tout, ça reste un choix à prendre selon les besoin du
concepteur de l’ETL.
Comments
Post a Comment
Put your comments here, please.
Share with us you vision...