Pentaho Solutions Kettle: Recensioni

Buona ..

Ho appena finito di leggere Pentaho Solutions Kettle . Questo libro è così estesa e interessante, ho letto più a lungo di quanto pensassi, ma mi ha sorpreso con la qualità dei contenuti e la diversità degli argomenti trattati.
Ecco le recensioni:
1) Descrizione: Questo è un libro molto divertente da leggere, che analizza molti complessi problemi facili da capire le spiegazioni custodia. Il culmine di questo libro è scritto da professionisti che hanno lavorato con PDI (aliasBollitore) per molti anni, facendo numerosi contributi e addirittura hanno svolto il loro sviluppo (nel caso di Caster Matt). Cioè, c'è un grande divario tra il sapere cosa significa per un 'passo', e so perché ha creato questo 'step', e questa differenza si nota ovunque in questo libro.
Pentaho Solutions Bollitore Anche se non è destinato ai principianti, è ideale per chi sta attualmente lavorando con PDI o vogliono fare in futuro, su argomenti che sono vitali per averli in mente quando si usa questo strumento.
2) dettagliato recensione: questo libro iniriferimento con una introduzione sulla ETL e le particolarità che deve avere uno strumento di ETL, presenta poi Kettle e ne descrive le caratteristiche, come installarlo ed eseguirlo, e come è stato progettato, cioè i dettagli sulle trasformazioni, Lavoro, salti, i tipi di dati , tipi di repository, parametri, variabili, ecc
Presenta quindi esempi per prendere i dati da un database transazionale e caricare un data warehouse, affrontando questioni complesse relative a dimensioni lentamente cambiando , il cambiamento di rilevazione dei dati (CDC - Change Data Capture), denormalizzazione, ecc
Seguite con la spiegazione dei 34 sottosistemi del processo di ETL come definito da Ralph Kimball, e poi l'indirizzo ogni sottosistema da Kettle, ponendo l'accento sul modo in cui risolve ogni situazione e illustrando in ogni caso.Gli argomenti trattati per evidenziare sono:
  • Job esecuzione, backtracking, in parallelo, i server slave (lettera).
  • Esecuzione di trasformazioni multi-threaded, linee di distribuzione, clustering e gestione dei cambiamenti partizioni.
  • Connessioni a database: opzioni generali e avanzate, pooling, il clustering, la gestione delle connessioni e transazioni.
  • Prestazioni e scalabilità.
  • Extrazione dei dati, profilazione dati (usando DataCleaner), CDC.
  • Detergente dati, la gestione di diversi tipi di errori, di revisione, i dati duplicati, scripting.
  • Gestione delle chiavi, il caricamento tabelle delle dimensioni (fiocco di neve e stelle dello schema), l'attuazione di diversi tipi di tabelle delle dimensioni.
  • Diversi tipi di tabelle dei fatti, il caricamento bulk, carico e movimentazione.
  • Estrarre i dati da molteplici tecnologie OLAP.
  • Ciclo di vita ETLs sviluppo, buone e cattive pratiche, lo sviluppo agile, test, debug e documentazione.
  • Scheduling (cron, at, xaction, Pds e Pentaho) e di monitoraggio.
  • Utilizzo di cluster di dinamica (Amazon EC2).
  • Integrazione e appartenenza religiosae, n dati in tempo reale.
  • Gestione complessi formati di dati (non-relazionali, non strutturati).
  • Tramite Web Service, esempi di XML, SOAP e RSS.
Dal momento che raggiungono gli ultimi dettagli come ottenere e compilare Bollitore, Bollitore utilizzando API Java per esempio, e come sviluppare plug-in per estendere Kettle parere!
Pentaho Solutions Kettle affronta l'integrazione dei dati (il 34 sottosistemi) e sistematizzata sacco di concetti, esempi, buone pratiche, progettazione e problemi di prestazioni, che lo rende una scelta consigliata per coloro che appartengono interamente al mondo di BI, come per chi ha bisogno di fare alcun tipo di integrazione dei dati.
3) ultima recensione: Definitely, questo è un altro libro di lettura essenziale, se si lavora con soluzioni Pentaho BI o implementazione di sistemi transazionali.Perché l'integrazione dei dati copre molti argomenti e affronta numerose questioni che sono presenti in ogni azienda / organizzazione che ha sistemi transazionali, sistemi di BI, utilizzare DBMS o semplici fogli di calcolo.
Sanità.