L’architecture d’un Système Décisionnel
Un système d’information décisionnel comprend quatre composantes principales :
1. Collecte de données (Datapumping)
La collecte de données est une étape primordiale qui consiste à récolter les données à partir de plusieurs sources opérationnelles de l’entreprise. Souvent ces données sont hétérogènes, non standardisées. Les sources de données peuvent être d’après :
a. Les systèmes opérationnels de production : Fichiers plats du système d’exploitation, Systèmes de base de données, ERP (Enterprise Resource Planning).
b. Les archives : qui sont nécessaires pour l'analyse à long terme car elles fournissent des données historiques.
c. Les données internes : telles que les feuilles de calcul et les classeurs individuels, qui ne sont pas directement associés aux systèmes opérationnels de l'entreprise.
d. Les données externes : telles que les rapports périodiques provenant de sources extérieures, les informations d’analyse concurrentielle, les journaux…
2. Le processus ETL (Extract, Transform et Load)
« C'est un système par lequel vont passer toutes les données des systèmes opérationnels avant d'arriver à la forme souhaitée dans l'entrepôt. Les données en sortie seront nettoyées, purifiées, contextualisées et prêtes à être reçues dans l'entrepôt. » [Web 03]
Selon [KIMBALL et al, 2013], les ETL correspondent à une surface de travail, ils représentent l’intermédiaire entre le système opérationnel et l’interface du système décisionnel. Ce processus est constitué de trois étapes :
a. Extraction : c’est la première étape qui consiste à identifier les données à partir des différentes sources. Elle désigne : lire, comprendre la source de données puis extraire les données dont on a besoin et les orienter vers le système décisionnel.
b. Transformation : après l’extraction des données, ces dernières subissent un travail de transformation qui inclut:
Le nettoyage : filtrage des données manquantes, correction des erreurs, suppression des doublons, réglage de conflits.
Le formatage et la standardisation : définit les types de données, la longueur des champs.
La fusion ou l’éclatement des informations composites.
L’affectation des clés de substitution.
c. Chargement : C’est la dernière étape qui permet de charger ces données vers la ‘surface présentation’ du système décisionnel. Il y a deux types de chargement :
Chargement initial : premier chargement de l'entrepôt et dans des cas spéciaux comme la perte des données, toutes les données seront chargées.
Chargement incrémentiel : est le fait d'ajouter les nouvelles données à l’entrepôt existant. C'est une opération qui se répète périodiquement.
3. Stockage de données
Un entrepôt de données est un moyen pour centraliser un volume important de données dans un même endroit unifié et accessible par tous les utilisateurs. On distingue deux types d’entrepôt de données : Data Warehouse et Data Mart.
3.1. Data Warehouse: D’après [KIMBALL et al, 2013] et [Inmon 2002] : un Data Warehouse est l’ensemble des données répertoriées, nettoyées, valides, complètes et cohérentes d'une entreprise. Ces données sont organisées d’une façon à ce que des non-informaticiens puissent comprendre sa structure et donc l'exploiter, sans l'intervention d'un informaticien.
3.2. Data Mart: Appelé aussi ‘magasin de données’, un Data Mart est un extrait d’un Data Warehouse. Les données extraites sont adaptées à une classe de décideurs ou à un usage particulier [TESTE 2000]. En d’autres termes un Data Mart se focalise sur les données d’un seul département au sein de l’entreprise tel que : Marketing, Vente.
4. Analyse et Restitution
Pour faciliter l’accès à l’information, pour tous les utilisateurs selon leurs profils métiers et afin d’extraire les éléments de décision pour dynamiser la réactivité globale dans l’entreprise, certains outils ont été mis à la disposition des décideurs. Ces outils sont des applications qui peuvent être simples (Reporting, Tableau de bord) ou sophistiquées (Data mining).
[TESTE 2000] TESTE O. Modélisation et manipulation d'entrepôts de données complexes et historisées. Thèse de doctorat en informatique. Toulouse : Université Paul Sabatier de Toulouse (sciences) ,2000
[Web 03] GRIM Y. Passez en mode BI [en ligne]. Disponible sur : <www.developpez.com > (Consulté le 11.07.2014)
[Rédigé par BEKKOUCHE Salma & LANASRI Dihia, 2015]
Un système d’information décisionnel comprend quatre composantes principales :
Architecture d’un système d’information décisionnel
1. Collecte de données (Datapumping)
La collecte de données est une étape primordiale qui consiste à récolter les données à partir de plusieurs sources opérationnelles de l’entreprise. Souvent ces données sont hétérogènes, non standardisées. Les sources de données peuvent être d’après :
a. Les systèmes opérationnels de production : Fichiers plats du système d’exploitation, Systèmes de base de données, ERP (Enterprise Resource Planning).
b. Les archives : qui sont nécessaires pour l'analyse à long terme car elles fournissent des données historiques.
c. Les données internes : telles que les feuilles de calcul et les classeurs individuels, qui ne sont pas directement associés aux systèmes opérationnels de l'entreprise.
d. Les données externes : telles que les rapports périodiques provenant de sources extérieures, les informations d’analyse concurrentielle, les journaux…
2. Le processus ETL (Extract, Transform et Load)
« C'est un système par lequel vont passer toutes les données des systèmes opérationnels avant d'arriver à la forme souhaitée dans l'entrepôt. Les données en sortie seront nettoyées, purifiées, contextualisées et prêtes à être reçues dans l'entrepôt. » [Web 03]
Selon [KIMBALL et al, 2013], les ETL correspondent à une surface de travail, ils représentent l’intermédiaire entre le système opérationnel et l’interface du système décisionnel. Ce processus est constitué de trois étapes :
a. Extraction : c’est la première étape qui consiste à identifier les données à partir des différentes sources. Elle désigne : lire, comprendre la source de données puis extraire les données dont on a besoin et les orienter vers le système décisionnel.
b. Transformation : après l’extraction des données, ces dernières subissent un travail de transformation qui inclut:
Le nettoyage : filtrage des données manquantes, correction des erreurs, suppression des doublons, réglage de conflits.
Le formatage et la standardisation : définit les types de données, la longueur des champs.
La fusion ou l’éclatement des informations composites.
L’affectation des clés de substitution.
c. Chargement : C’est la dernière étape qui permet de charger ces données vers la ‘surface présentation’ du système décisionnel. Il y a deux types de chargement :
Chargement initial : premier chargement de l'entrepôt et dans des cas spéciaux comme la perte des données, toutes les données seront chargées.
Chargement incrémentiel : est le fait d'ajouter les nouvelles données à l’entrepôt existant. C'est une opération qui se répète périodiquement.
3. Stockage de données
Un entrepôt de données est un moyen pour centraliser un volume important de données dans un même endroit unifié et accessible par tous les utilisateurs. On distingue deux types d’entrepôt de données : Data Warehouse et Data Mart.
3.1. Data Warehouse: D’après [KIMBALL et al, 2013] et [Inmon 2002] : un Data Warehouse est l’ensemble des données répertoriées, nettoyées, valides, complètes et cohérentes d'une entreprise. Ces données sont organisées d’une façon à ce que des non-informaticiens puissent comprendre sa structure et donc l'exploiter, sans l'intervention d'un informaticien.
3.2. Data Mart: Appelé aussi ‘magasin de données’, un Data Mart est un extrait d’un Data Warehouse. Les données extraites sont adaptées à une classe de décideurs ou à un usage particulier [TESTE 2000]. En d’autres termes un Data Mart se focalise sur les données d’un seul département au sein de l’entreprise tel que : Marketing, Vente.
4. Analyse et Restitution
Pour faciliter l’accès à l’information, pour tous les utilisateurs selon leurs profils métiers et afin d’extraire les éléments de décision pour dynamiser la réactivité globale dans l’entreprise, certains outils ont été mis à la disposition des décideurs. Ces outils sont des applications qui peuvent être simples (Reporting, Tableau de bord) ou sophistiquées (Data mining).
[TESTE 2000] TESTE O. Modélisation et manipulation d'entrepôts de données complexes et historisées. Thèse de doctorat en informatique. Toulouse : Université Paul Sabatier de Toulouse (sciences) ,2000
[Web 03] GRIM Y. Passez en mode BI [en ligne]. Disponible sur : <www.developpez.com > (Consulté le 11.07.2014)
[Rédigé par BEKKOUCHE Salma & LANASRI Dihia, 2015]
Comments
Post a Comment
Put your comments here, please.
Share with us you vision...