Pentaho Kettle Solutions: Bewertungen

Gute ..

Ich habe gerade gelesen Pentaho Kettle Lösungen . Dieses Buch ist so umfangreich und interessant, ich habe mehr gelesen, als ich dachte, aber ich war mit der Qualität der Inhalte und die Vielfalt der behandelten Themen überrascht.
Hier sind die Bewertungen:
1) Übersicht: Das ist ein sehr unterhaltsames Buch zu lesen, die viele komplexe Probleme analysiert einfache Erklärungen zu halten verstehen. Das Highlight dieses Buches ist von Profis, die mit PDI (aka gearbeitet haben geschriebenKettle) für viele Jahre, so dass zahlreiche Beiträge und sogar aus ihre Entwicklung durchgeführt (im Falle von Matt Casters). Das heißt, es besteht eine große Kluft zwischen dem Wissen, was es für einen "Schritt" ist, und wissen, warum sie diese "Stufe" erstellt, und dieser Unterschied ist überall spürbar in diesem Buch.
Pentaho Kettle Lösungen zwar nicht für Anfänger gedacht, eignet sich ideal für alle, die arbeiten derzeit mit PDI oder möchten in der Zukunft zu tun, mit Themen, die entscheidend für sie im Sinn haben, wenn mit diesem Tool.
2) Detaillierte Bewertung: dieses Buch inirung mit einer Einführung über die ETL-und den Besonderheiten, die ein ETL-Tool haben sollte, dann stellt Kettle und beschreibt deren Eigenschaften, wie zu installieren und auszuführen, und wie es gestaltet ist, also Informationen über Transformationen, Jobs, Sprünge, Datentypen , Repository-Typen, Parameter, Variablen, etc.
Dann stellt Beispiele, um Daten aus einer transaktionalen Datenbank zu nehmen und laden Sie ein Data Warehouse, Umgang mit komplexen Fragen im Zusammenhang mit Slowly Changing Dimensions , Change Detection in den Daten (CDC - Change Data Capture), Denormalisierung, etc.
Folgen Sie mit der Erklärung der 34 Subsysteme des ETL-Prozesses, wie Ralph Kimball definiert, und dann Adresse jedes Teilsystem von Kessel, mit Betonung darauf, wie sie verrechnet jede Situation und illustriert in jedem Fall.Die Themen hervorzuheben sind:
  • Job-Ausführung, Backtracking, parallel dazu, Slave-Server (Brief).
  • Transformations Laufen multi-threaded, Verteilungen, Clustering und Verwaltung von Partitionen verändert.
  • Verbindungen zu Datenbanken: allgemeine und erweiterte Optionen, die Bündelung, Clustering Management von Verbindungen und Transaktionen.
  • Performance und Skalierbarkeit.
  • ExTraktion, Daten-Profiling (mit DataCleaner), CDC.
  • Daten cleasing, die Verwaltung von verschiedenen Arten von Fehlern, Wirtschaftsprüfung, doppelte Daten, Scripting.
  • Key-Management, Be-Dimensionstabellen (Snowflake-Schema und Stern), die Umsetzung der verschiedenen Arten von Dimensionstabellen.
  • Verschiedene Arten von Faktentabellen, Bulk Load, Lade-und Handlingsysteme.
  • Extrahieren von Daten aus mehreren OLAP-Technologien.
  • Lifecycle ETLs Entwicklung, gute und schlechte Praktiken, agile Entwicklung, testen, debuggen und Dokumentation.
  • Scheduling (cron, at, xaction, PDS und Pentaho) und-überwachung.
  • Mit Dynamic Cluster (Amazon EC2).
  • Integration & Religionszugehörigkeite, n Echtzeit-Daten.
  • Handhabung komplexer Datenformate (non-relational, unstrukturiert).
  • Verwenden von Web-Service, Beispiele für XML, SOAP und RSS.
Seit dem Erreichen der letzten Details, wie man kompilieren und Wasserkocher, Wasserkocher mit Java API durch Beispiel und wie man Plugins zu entwickeln, zu erweitern Kettle Eigene!
Pentaho Kettle Lösungen befasst sich mit der Integration von Daten (die 34-Subsysteme) und systematisiert ganze Reihe von Konzepten, Beispielen, Best Practices, Design und Performance-Probleme, so dass es eine Option für diejenigen, die ganz gehören zu den BI Welt empfohlen, da für diejenigen, die jede Art von Daten-Integration vornehmen müssen.
3) endgültige Bewertung: Definitely, ist dies ein weiteres Buch zur Pflichtlektüre, ob Sie mit Pentaho BI-Lösungen arbeiten oder die Umsetzung transaktionalen Systemen.Da die Integration der Daten deckt viele Themen und befasst sich mit vielen Fragen, die in jedem Unternehmen / Organisation, transaktionalen Systemen, BI-Systemen verwenden DBMS oder einfache Tabellenkalkulationen hat, sind.
Health.