Pentaho Kettle Solutions: Comentários

Bom ..

Acabei de ler Soluções Pentaho Kettle . Este livro é tão extenso e interessante, tenho lido mais do que eu pensava, mas fiquei surpreso com a qualidade do conteúdo e diversidade de temas abordados.
Aqui estão as opiniões:
Uma visão geral): Este é um livro muito divertido de ler, que analisa muitas questões complexas fácil de compreender explicações manter. O destaque deste livro é escrito por profissionais que trabalharam com PDI (akaChaleira) por muitos anos, fazendo inúmeras contribuições e até mesmo ter realizado o seu desenvolvimento (no caso de Matt Casters). Ou seja, há uma grande diferença entre saber o que é um 'passo', e sabe por que eles criaram este "passo", e essa diferença é perceptível em todos os lugares neste livro.
Pentaho Kettle Solutions Apesar de não ser destinado para iniciantes, é ideal para quem está trabalhando atualmente com PDI ou querem fazer no futuro, abordando temas que são vitais para tê-los em mente quando usar esta ferramenta.
2) Revisão detalhada: esta ini livrocia com uma introdução sobre a ETL e as particularidades que devem ter uma ferramenta de ETL, em seguida, apresenta Chaleira e descreve suas características, como instalar e executá-lo, e como ele é concebido, isto é, em detalhes Transformations, Empregos, saltos, tipos de dados , tipos de depósito, parâmetros, variáveis, etc
Em seguida, apresenta exemplos de tomar dados de um banco de dados transacional e carregar um data warehouse, abordando questões complexas relacionadas com dimensões de alteração lenta , mudança de detecção nos dados (CDC - Change Data Capture), desnormalização, etc
Siga com a explicação dos 34 subsistemas do processo de ETL, conforme definido pela Ralph Kimball, e então o endereço de cada subsistema de Chaleira, com ênfase em como ele resolve cada situação e ilustrando, em cada caso.Os tópicos abordados são de destacar:
  • Execução do trabalho, backtracking, em paralelo servidores, escravo (carta).
  • Executando transformações multi-threaded linhas, distribuição, clustering e gestão de mudanças partições.
  • Conexões com bancos de dados: as opções gerais e avançadas, pooling, clustering, gerenciamento de conexões e transações.
  • Desempenho e escalabilidade.
  • Extração de dados de perfis de dados, (usando DataCleaner), CDC.
  • Cleasing dados, gestão de diferentes tipos de erros, auditoria, dados duplicados, scripting.
  • Gerenciamento de chaves, carregar as tabelas de dimensão (snowflake schema e estrela), a implementação de diferentes tipos de tabelas de dimensão.
  • Diferentes tipos de tabelas de fatos, de carga a granel, carga e manuseio.
  • Extrair dados de múltiplas tecnologias OLAP.
  • Ciclo de vida ETLs desenvolvimento, boas e más práticas, desenvolvimento ágil, teste, depuração e documentação.
  • Agendamento (cron, at, xaction, PDS e Pentaho) e monitoramento.
  • Usando Clusters Dinâmico (Amazon EC2).
  • Integração e filiação religiosae, n dados em tempo real.
  • Manipulação de formatos de dados complexos (não-relacional, não-estruturados).
  • Utilizando o Serviço Web, exemplos de XML, SOAP e RSS.
Desde que atingiu os detalhes finais como obter e compilar Chaleira Chaleira, usando Java API por exemplo, e como desenvolver plugins para estender Chaleira própria!
Pentaho Kettle Solutions aborda a integração de dados (os 34 subsistemas) e lote inteiro sistematizado de conceitos, exemplos, melhores práticas, design e desempenho, tornando-se uma opção recomendada para aqueles que pertencem inteiramente ao mundo de BI, como para aqueles que precisam fazer qualquer tipo de integração de dados.
3) Análise final: Definitivamente, este é um outro livro de leitura indispensável, se você está trabalhando com soluções Pentaho BI ou implementação de sistemas transacionais.Porque a integração de dados abrange vários tópicos e endereços de muitas questões que estão presentes em qualquer empresa / organização que tem sistemas transacionais, os sistemas de BI, use DBMS ou planilhas simples.
De saúde.