Étapes de la mise en œuvre d'un DW. Méthodologie pour la construction d'un DW.

Avant de commencer notre projet de BI, nous allons déterminer le type de méthodologie que nous utilisons. Il existe différentes méthodes, toutes liées à la portée du déploiement des systèmes d'information, avec une certaine spécificité en ce qui concerne la BI et de systèmes de DW.

5.1. Metodogia Héphaïstos.

Comme une contribution majeure, on peut citer la méthodologie créée par Héphaïstos Ricardo Dario Bernabeu (disponible sous la licence GNU FDL)

Page de la méthodologie sur le blog Business Intelligence Open .

Consultation en ligne du livre ici .

Télécharger le livre ici .

Le livre est un résumé complet de tout ce qui touche à la Business Intelligence et de DW, et peut être un point de départ d'une grande qualité de commencer en la matière.Dans la deuxième partie du livre est une méthodologie développée Héphaïstos, créé et examinés par cette personne, qui a également partagé avec tout le monde leur travail GNU licence complète.

La méthodologie vise à renforcer les DW Analyse dimensionnelle (OLAP) et comprend les étapes suivantes, nous pouvons voir sur le graphique à droite.

5.1.1.Analyse des besoins.

Identifier les questions que nous avons des réponses et des objectifs à atteindre avec le nouveau système.

Analyser les questions afin de déterminer les perspectives d'analyse et des indicateurs d'activité.

Conception du modèle conceptuel, qui comprendra les perspectives et les indicateurs identifiés. Grâce à ce modèle est capable d'atteindre clairement quelle est la portée du projet, et sera un point de départ à la haute définition pour l'exposition aux utilisateurs et aux gestionnaires.

5.1.2. Analyse des systèmes transactionnels.

Détermination des indicateurs: identifier l'origine des indicateurs dans les systèmes commerciaux et de déterminer la forme de votre calcul.

Correspondance: mettre en relation les éléments définis dans le modèle conceptuel et sources de données existantes elos OLTP (systèmes transactionnels).

Définir le niveau de granularité: le niveau de détail des données obtenues pour chaque dimension de l'analyse.

Modèle conceptuel étendu aux régions identifiées pour chaque point de vue.

5.1.3.modèle logique ETL.

modèle de type logique DW: sélectionner le type de schéma utilisé (étoile, flocon de neige, etc).

Tableau des dimensions: la construction des tables de dimension pour chacun des points de vue de l'analyse considérée.

Les tables de faits: la définition des tables de faits qui contiennent des informations à partir de laquelle construire l'analyse des indicateurs.

Les syndicats: les relations entre les tables de dimension et les tables de faits.

5.1.4.processus ETL: analyse, la définition et le développement de tous les processus nécessaires pour extraire, transformer et charger des données provenant des systèmes de source de "remplir" la DW.

5.1.5. Performances et maintenance de la DW: ajustements dans la conception de la DW et de l'entretien au fil du temps.

5.2. A un autre niveau, nous avons la méthodologie développée par SAS, appelée La SAS rapide Data Warehouse Méthodologie

(Vous pouvez télécharger le document l' lien ).

Comme il ressort d'un article dans ComputerWorld: «Un entrepôt de données ne peut pas être acheté, vous avez à construire."Comme mentionné précédemment, la construction et la mise en œuvre d'un Data Warehouse est un processus évolutif.

Ce processus doit s'appuyer sur une méthodologie spécifique pour ce type de procédé, mais il est plus important que le choix des meilleures méthodes, effectuer un contrôle pour assurer le suivi de celle-ci.

Au cours des phases comme indiqué dans le champ d'application du projet est indispensable de prévoir une phase de formation dans l'outil utilisé pour l'optimisation de la demande.Après les étapes de la méthodologie et de commencer l'entrepôt de données pour une zone déterminée de la société, nous permettra d'obtenir des résultats tangibles dans un court espace de temps.

Nous proposons ici la méthodologie proposée par SAS Institute, le "Rapid entreposage Méthode». Cette méthode est itérative, et est basé sur le développement progressif de l'entrepôt de données du projet divisé en cinq phases:

  • Définition des objectifs
  • Définition des besoins en information
  • Conception et modélisation
  • La mise en œuvre
  • Examen

5.2.1-Définition des objectifs

En effet, comme point de départ de tout, nous devons "vendre" l'idée "pour les utilisateurs finaux d'un Data Warehouse.C'est parce que c'est une idée plutôt originale et les soupçons qui pourraient résulter de son efficacité. Ces craintes peuvent être éliminés en commençant par un petit module, qui sera en outre évaluer les avantages pour démarrer progressivement en développement de nouveaux modules, chacun avec un coût unitaire en baisse, mais toujours avec des revenus en hausse de distribution puissance de plus en plus inclure davantage d'informations.

Le simple fait doit faire un rapport préliminaire qui énumère l'état des données entre différents systèmes d'exploitation, peut être un événement décisif pour entreprendre un projet de ce type.Souvent, l'information est si peu norme existante, il ya de nombreuses différences entre ces systèmes, qui répondent à un entrepôt de données dans laquelle propre et normaliser les données peuvent fournir des incorporels de valeur »de la qualité et la fiabilité de l'information."

La vente d'ESTl'idée n'a pas seulement jouer devant l'adresse, mais doit être entrepris à tous les niveaux: management, gestion et même la zone de développement.

Après la vente de l'idée, commencer à deux phases similaires à l'analyse des exigences du système (ARS comme des abréviations de la méthodologie métriques): la définition des objectifs et des exigences d'information, qui va analyser les besoins de l'acheteur.

Définition des objectifs

Cette phase permettra de définir l'équipe du projet devrait être composé de représentants du ministère et les ministères utilisateurs IT de l'entrepôt de données ainsi que le chiffre gestionnaire de projet.

Définir la portée du système et quelles sont les caractéristiques qui font de l'entrepôt de données en tant que fournisseur de renseignements commerciaux stratégiques pour l'entreprise.Même être défini, les paramètres pour évaluer la réussite du projet.

5.2.2.-Définition des besoins en information

Comme dans tous les projets, en particulier si elles impliquent de nouvelles techniques telles que celles relatives à l'entrepôt de données est d'analyser les besoins et la compréhension des avantages que ce système peut fournir.

C'est pourquoi ce que nous référer à la section de ce guide d'analyse des besoins de l'acheteur .C'est à ce moment-là, où nous allons détailler les étapes d'un projet de ce type, où l'utilisateur va jouer un rôle de premier plan.

Définition des besoins en information

Au cours de cette étape restera entretiens successifs avec les représentants du département de l'utilisateur final et des représentants du ministère. Il a fait l'étude des systèmes d'information existants, afin d'aider à la compréhension de la pénurie actuelle et future qui doit être résolue dans la conception de l'entrepôt de données

Egalement dans cette phase l'équipe de projet devrait être en mesure de valider le processus d'entrevue et de renforcer l'orientation commerciale du projet.À la fin de cette phase permettra de documenter la définition des exigences qui tiennent compte non seulement les besoins d'information des utilisateurs, mais qui sera mise en œuvre de la stratégie et l'architecture de Data Warehouse.

5.2.3.-conception et modélisation

Obligations d'information identifiés au cours de la phase précédente servira de base pour la conception et la modélisation de l'entrepôt de données.

A ce stade d'identifier les sources des données (système d'exploitation, les sources externes ..) et les changements nécessaires pour, à partir de ces sources, obtenir le modèle logique de données de Data Warehouse.Ce modèle se compose d'entités et de relations qui répondent aux besoins opérationnels de l'organisation.

Le modèle logique est ensuite traduit dans les données du modèle physique pour être stockés dans l'entrepôt de données et de définir l'architecture de stockage de l'entrepôt de données pour le type d'exploitation qui font de même.

La plupart de ces définitions de l'entrepôt de données Les données seront stockées dans les métadonnées et en faire partie.

5.2.4.-La mise en œuvre

La mise en œuvre d'un Data Warehouse implicite dans les étapes suivantes:

  • L'extraction des données et la transformation du système d'exploitation de la même.
  • Chargement des données validées par le Data Warehouse.Cette charge doit être prévue avec une périodicité adaptée aux besoins de soude détectée durant les phases de conception du nouveau système.
  • L'exploitation de l'entrepôt de données en utilisant des techniques différentes selon le type d'application aux données:
    • Query & Reporting
    • de traitement analytique en ligne (OLAP)
    • Système d'information exécutif (SIE) ou gestion de l'information
    • Systèmes d'aide à la décision (DSS)
    • Information Visualization
    • Data Mining ou Data Mining, etc

Les informations nécessaires pour maintenir le contrôle sur les données stockées dans les métadonnées techniques (en décrivant les caractéristiques physiques des données) et les entreprises (comme ils le décrivent comment utiliser ces données.)Ces métadonnées doivent être accessibles par les utilisateurs finaux à tout moment pour permettre à l'utilisateur et l'administrateur doit également avoir le pouvoir de les modifier en fonction des besoins d'information varient.

Avec l'achèvement de cette phase se traduira par un entrepôt de données est disponible pour utilisation par les utilisateurs finaux et le service informatique.

5.2.5.-Review

Construction de Wa donnéesRehouse pas fin avec la mise en œuvre de celui-ci, mais c'est une tâche itérative qui cherche à accroître son champ d'application d'apprendre des expériences passées.

Après l'implantation, il devrait y avoir un examen de l'entrepôt de données de poser des questions qui permettent, au bout de six ou neuf mois après son lancement, qui définissent les domaines à améliorer et à renforcer en termes de l'utilisation du nouveau système .

-La structure de conception 5.2.6. de cours de formation

Avec les informations recueillies lors de rencontres avec des utilisateurs individuels d'une série de cours conçus sur mesure, qui aura pour but de fournir une formation statistiques nécessaires à la meilleure utilisation de la fonctionnalité incluse dans la demande.Vous allez le pratiquer sur le développement fait, ce qui nous permettra d'établir les notions apprises et de servir la formation des utilisateurs.

(Définitions extraites les conseils de l'informatique, le document Manuel pour l'achat d'un système d'entrepôt de données dans http://www.csi.map.es/csi/silice/Elogicos.html ).

Les deux méthodes ont beaucoup en commun et d'utiliser une combinaison des deux techniques décrites pour la réalisation de notre projet PHilotes.

méthodologies 5.3.Otras.

Dans le livre Maîtriser la conception d'entrepôts de données (Imhoff, Claudia; Galemmo, Nicolas Geiger, Jonathan G.) ISBN :978-0-471-32421-8, nous trouvons une méthode pour de tels projets, car les méthodes pour définir Business Model (en ce qui concerne d'avoir le compte en fonction du secteur d'affaires, nous analyserons)., la collecte des besoins, des réunions techniques et des informations techniques sur la façon de modéliser et concevoir les DW.

E essentiels pour bien concevoir notre DW et être formées dans ce domaine:

Becker) ISBN Bob, Entrepôt Kimball, Ralph, Ross, Margy, Thornthwaite, Warren, Mundy, Joy Data Lifecycle Toolkit (; L': 978-0-470-149777-5

La boîte à outils entrepôt de données: le guide complet pour la modélisation dimensionnelle.(Kimball, Ralph, Ross, Margy) ISBN 2ed: 978-0-471-20024-7

Ces deux livres sont essentiels pour comprendre tout ce dont vous avez besoin dans le domaine de la DW. En outre, dans la deuxième édition sont des exemples de design dans différents domaines d'une entreprise (ventes, comptabilité, ressources humaines, finances) et de différents secteurs.

Comme un résumé des méthodes décrites dans ces livres, il est intéressant de la présentation suivante de Manuel Torres, Université de Almeria:

Comme contribution intéressante à notre tâche de construction de la DW, soità savoir des articles publiés dans Business Intelligence Easy ( Comment construire un entrepôt de données ), nous parlons de la façon de définir et de construire les différents éléments d'un DW, et surtout mal qui n'a pas commis.

De même, j'ai laissé également des liens vers une série d'articles publiés paragement.wordpress.com / "> Josep cours dans votre blog, vous pouvez être très utile dans les différents aspects que vous avez à prendre en compte lors de la construction d'un DW:

Enfin, sont des matériaux de haute qualité bien sûr «Bâtir l'DataWarehouse suivante: intégration et qualité des données» , Faculté d'Informatique de l'UPC (qui fait partie du programme Aules Société 2009).Je laisse l'une des présentations: