Etapas na implantación dun D. Metodoloxía para a construción dun D.

Antes de iniciar o noso proxecto de DNI, que vai determinar que tipo de metodoloxía que usamos. Existen métodos diferentes, todos relacionados co ámbito da implantación de sistemas de información, con algunha especificidade con respecto a sistemas de DNI e DW.

5.1. Metodogia Hefesto.

Como unha gran contribución, podemos citar a Hefesto metodoloxía creada por Ricardo Dario Bernabeu (dispoñíbel baixo GNU FDL)

Páxina de metodoloxía no blog Open Business Intelligence .

Consulta en liña do libro aquí .

Descarga do libro aquí .

O libro é un resumo completo de todo o relacionado con Business Intelligence e D, e poden ser un punto de partida de gran calidade para iniciar o tema.Na segunda parte do libro é Hefesto metodoloxía desenvolvidos, creado e revisado por esa persoa, que tamén ten ao igual que todos os seus traballos GNU total licenza.

A metodoloxía ten como obxectivo construír DW Análise dimensional (OLAP) e comprende as seguintes etapas, podemos ver no gráfico á dereita.

5.1.1.Análise de Requisitos.

Identificar as cuestións que temos respostas e obxectivos a seren alcanzadas co novo sistema.

Analizar as cuestións para determinar as perspectivas de análise e indicadores de negocio.

Deseño do modelo conceptual, que debería incluír as perspectivas e indicadores identificados. A través do modelo é capaz de acadar claramente o que o alcance do proxecto, e será un punto de partida para a alta definición para a exposición aos usuarios e xestores.

5.1.2. Análise de sistemas transnacionais.

Determinación de indicadores: identificación da orixe dos indicadores nos sistemas de negociación e determinará a forma do seu cálculo.

Correspondencia: relacionar os elementos definidos no modelo conceptual e fontes de datos existentes elos OLTP (sistemas transnacionais).

Definindo o nivel de granularidade: o nivel de detalle dos datos obtidos para cada dimensión de análise.

Modelo conceptual estendida para as áreas identificadas para cada perspectiva.

5.1.3.ETL modelo lóxico.

Tipo de modelo lóxico D: seleccionar o tipo de esquema utilizado (estrela, folerpa de neve, etc.)

Táboa de dimensións: Construción das táboas de dimensión para cada unha das perspectivas de análise considerado.

As táboas de feitos: a definición das táboas de feitos que conteñen informacións para a construción de indicadores de análise.

Sindicatos: as relacións entre as táboas de dimensión e táboas de feito.

5.1.4.procesos de ETL: definición, análise e desenvolvemento de todos os procesos necesarios para a extracción, transformación e carga de datos dos sistemas de orixe para "encher" o D.

5.1.5. Rendemento e mantemento do DW: axustes no proxecto do DW e mantemento ao longo do tempo.

5.2. A outro nivel, temos a metodoloxía desenvolvidos polo SAS, chamados A SAS Rapid Data Warehouse Metodoloxía

(Podes baixar o documento o enlace ).

Como apareceu un artigo no ComputerWorld: "Un Data Warehouse non se pode comprar, ten que construír."Como descrito anteriormente, a construción e implantación dun Data Warehouse é un proceso evolutivo.

Isto ten que contar cunha metodoloxía específica para este tipo de proceso, aínda que sexa máis importante que a selección das mellores metodoloxías, realizando un control para asegurar o control do mesmo.

En fases indicadas no ámbito do proxecto é esencial incluír unha fase de adestramento na ferramenta utilizada para a optimización da aplicación.Seguindo os pasos da metodoloxía e iniciar o Data Warehouse para unha área específica da empresa, nos permitirá acadar resultados concretos nun curto espazo de tempo.

Propoñemos aquí a metodoloxía proposta pola SAS Institute, o "Rapid Almacenamento Metodoloxía". Esta metodoloxía é iterativa, e baséase no desenvolvemento incremental de datos do proxecto Almacén dividido en cinco fases:

  • Definición de Obxectivos
  • Definición das necesidades de información
  • Deseño e Modelaxe
  • Implementación
  • Revisión

5.2.1-Definición dos obxectivos

En realidade, como punto de partida de todo o que debe "vender a idea" para os usuarios finais dun Data Warehouse.Isto é porque é unha idea moi nova e as sospeitas de que poidan xurdir da súa eficacia. Eses medos poden ser eliminados comezando cun pequeno módulo, que continuará a avaliar as vantaxes de comezar gradualmente a desenvolver novos módulos, cada un cun custo unitario diminuíndo, pero aínda con aumento dos ingresos por distribuídos poder cada vez máis incluír máis información.

O simple feito cómpre facer un informe preliminar que listo o status de datos entre distintos sistemas operativos, pode ser un acontecemento decisivo para realizar un proxecto deste tipo.Moitas veces a información é tan pouco norma existente, hai moitas diferenzas entre estes sistemas, que tratan de un Data Warehouse no que limpar e normalizar os datos poden ofrecer valor intanxible "calidade e fiabilidade da información."

A venda de esta idea de non só realizar diante do enderezo, pero debe ser realizada a todos os niveis: xestión, xestión e mesmo a área de desenvolvemento.

Tras a venda da idea, comece a dúas fases similares á análise dos requisitos do sistema (ARS como abreviaturas da metodoloxía métrico): a definición de obxectivos e requisitos de información, que pode analizar as necesidades do comprador.

Definición de Obxectivos

Esta fase pode definir o equipo do proxecto debe ser composto por representantes dos departamentos departamento de TI e usuarios de Data Warehouse, así como a figura do xestor do proxecto.

Definindo o alcance do sistema e cales son as características que fan que o Data Warehouse como provedor de información estratéxicas de empresas para a empresa.Así mesmo a definir os parámetros para avaliar o éxito do proxecto.

5.2.2.-Definición das necesidades de información

Como en todos os proxectos, especialmente se elas implica novas técnicas, tales como as relacionadas co Data Warehouse é analizar as necesidades e comprensión das vantaxes que este sistema pode ofrecer.

É por iso que falamos de sección desta axuda de análise de necesidades do comprador .É neste punto, onde iremos detallar os pasos dun proxecto deste tipo, onde o usuario está indo xogar un papel tan destacado.

Definición das necesidades de información

Durante esta fase permanecerá sucesivas entrevistas con representantes do departamento do usuario final e os representantes do departamento. El fixo o estudo de sistemas de información existentes, para auxiliar na comprensión da escaseza actual e futura que debe ser resolto no proxecto de Data Warehouse

Tamén nesta fase, o equipo do proxecto debe ser capaz de validar o proceso de entrevista e reforzar a dirección de empresas do proxecto.Ao final desta fase documento definición de requisitos que reflicten non só a información das necesidades dos usuarios, pero que será a estratexia de implantación e arquitectura de Data Warehouse.

5.2.3.-Deseño e Modelaxe

Os requisitos de información identificados durante a fase anterior servirán de base para o deseño e modelaxe de Data Warehouse.

Neste punto, identificar as fontes de datos (sistema operativo, as fontes externas ..) e os cambios necesarios para, dende estas fontes, obter o modelo lóxico de datos de Data Warehouse.Este modelo estará composto de entidades e relacións que van ao encontro das necesidades de negocio da organización.

O modelo lóxico é entón traducido para o modelo físico de datos a ser almacenada na Data Warehouse e definir a arquitectura de almacenamento do Data Warehouse para o tipo de explotación que facer o mesmo.

A maioría destas definicións de datos de Data Warehouse serán gardados nos metadatos e ser parte dela.

5.2.4.-Implantación

A implantación dun Data Warehouse implícita nas seguintes etapas:

  • Os datos de extracción e transformación do sistema operativo do mesmo.
  • Cargando os datos validados polo Data Warehouse.Esta carga debe ser planificada cunha periodicidade que está adaptado ás necesidades de sosa detectados durante as fases de deseño do novo sistema.
  • Explotación do Data Warehouse utilizando diversas técnicas, dependendo do tipo de aplicación para os datos:
    • Query + Reporting
    • En liña Analytical Processing (OLAP)
    • Sistema de información executiva (EIS), ou Xestión da Información
    • Sistemas de Soporte á Decisión (SAD)
    • Visualización de Información
    • Data Mining ou minería de datos, etc

A información necesaria para manter o control sobre os datos almacenados nos metadatos técnicos (cando describindo as características físicas dos datos) e negocios (como describen como usar estes datos).Eses metadatos deben estar accesibles por usuarios finais en todo momento para permitir que tanto o usuario como administrador tamén debe ter o poder de modificar-los conforme as necesidades de información varían.

Coa conclusión desta fase pode producir un Data Warehouse está dispoñible para uso por usuarios finais e do departamento de TI.

5.2.5.-Review

Construción de Data WARealojar non rematará coa posta en marcha do mesmo, pero é unha tarefa iterativo que ten como obxectivo incrementar o seu alcance para aprender experiencias pasadas.

Despois do implante, debe haber unha revisión do Data Warehouse para facer preguntas que permiten, despois de seis ou nove meses despois do seu lanzamento, que define as áreas de mellora e reforzo en termos de utilización do novo sistema .

5.2.6.-estrutura de deseño dos cursos de formación

Coas informacións obtidas a partir de reunións con usuarios individuais dunha serie de cursos destinados a medida, que terá como obxectivo proporcionar formación estatística necesaria para a mellor utilización dos recursos incluídas na solicitude.Vai practicar o desenvolvemento fixo, que nos permiten establecer os conceptos aprendidos e serven como formación de usuarios.

(Axustes procedentes dos consellos de Informática, o documento Manual para a compra dun sistema de Data Warehouse en http://www.csi.map.es/csi/silice/Elogicos.html ).

Dous sistemas teñen moito en común e usan unha combinación de ambas as técnicas descritas para a realización do noso proxecto de PLotes.

metodoloxías 5.3.Otras.

No libro Dominando o almacén de datos de proxecto (Imhoff, Claudia; Galemmo, Nicholas; Geiger, Jonathan G.) ISBN :978-0-471-32421-8, atopamos unha metodoloxía para tales proxectos, sempre que os métodos para a definición Modelo de Negocio (con relación a ter a conta de acordo co sector empresarial que estamos analizando)., levantamento de requisitos, reunións técnicas e información técnica sobre a modelar e proxectar o D.

E esencial para proxectar correctamente a nosa DW e ser formado nesta área:

O Data Warehouse Lifecycle Toolkit (Kimball, Ralph Ross, Margy, Thornthwaite, Warren, Mundy, Alegría, Bob Becker) ISBN: 978-0-470-149777-5

O kit de ferramentas de data warehouse: o guía completa para modelado dimensional.2ed (Kimball, Ralph, Margy Ross), ISBN: 978-0-471-20024-7

Estes dous libros son esenciais para entender todo o que necesitas no campo da DW. Ademais, na segunda edición son exemplos de proxecto en distintas áreas dunha empresa (vendas, contabilidade, recursos humanos, Finanzas) e de distintos sectores.

Como un resumo das metodoloxías descritas nestes libros, é interesante a seguinte presentación de Manuel Torres, da Universidade de Almería:

Como contribución interesante para a nosa tarefa de construír o D, a serou sexa, de artigos publicados en Business Intelligence Fácil ( Como construír un almacén de datos ), falamos de como configurar e construír os distintos elementos dun D, e especialmente mal que non cometeu.

Do mesmo xeito, eu tamén deixou con unha serie de artigos publicados poragement.wordpress.com / "> Josep Curso no seu blog, pode ser moi útil en varios aspectos que ten que ter en conta na construción dun D:

Finalmente, son, evidentemente, materiais de alta calidade "Construíndo o DataWarehouse seguinte: Integración e Calidade dos Datos" , da Facultade de Informática da UPC (parte do programa Aules Empresa 2009).Deixo unha das presentacións: