Pentaho Kettle Solutions: Avis

Bonne ..

Je viens de lire Pentaho Kettle Solutions . Ce livre est tellement vaste et intéressant, j'ai lu plus long que je pensais, mais j'ai été surpris par la qualité du contenu et de la diversité des sujets abordés.
Voici les commentaires:
1) Présentation: C'est un livre très agréable à lire, qui analyse les nombreuses questions complexes faciles à comprendre des explications garder. Le point culminant de ce livre est écrit par des professionnels qui ont travaillé avec PDI (akaKettle) pendant de nombreuses années, faisant de nombreuses contributions et ont même réalisé leur développement (dans le cas de Matt Casters). C'est, il ya un grand fossé entre savoir ce qu'il est pour une «étape», et savoir pourquoi ils ont créé cette «étape», et cette différence est perceptible partout dans ce livre.
Pentaho Kettle Solutions Bien que n'étant pas destiné aux débutants, est idéal pour quiconque travaille actuellement avec PDI ou si vous voulez faire dans l'avenir, couvrant des sujets qui sont vitaux pour les avoir à l'esprit lorsque vous utilisez cet outil.
2) Examen détaillé: cette ini livredance avec une introduction sur l'ETL et les particularités qui doivent disposer d'un outil d'ETL, présente ensuite Kettle et décrit leurs caractéristiques, comment installer et l'exécuter, et comment il est conçu, à savoir plus de détails sur les transformations, l'emploi, des sauts, des types de données , les types de référentiel, les paramètres, variables, etc
Présente ensuite des exemples de prendre les données d'une base de données transactionnelle et de la charge d'un entrepôt de données, traiter les questions complexes liées à des dimensions changent lentement , la détection des changements dans les données (CDC - Change Data Capture), la dénormalisation, etc
Suivez avec l'explication des 34 sous-systèmes du processus ETL tel que défini par Ralph Kimball, puis l'adresse chaque sous-système de Kettle, en mettant l'accent sur la façon dont il se résout à chaque situation et en illustrant dans chaque cas.Les sujets couverts sont à souligner:
  • L'exécution des travaux, retour en arrière, en parallèle des serveurs esclaves, (lettre).
  • Transformations du film multi-thread des lignes de distribution, de clustering et de gestion des changements partitions.
  • Connexions aux bases de données: options générales et avancées, la mutualisation, le regroupement, la gestion des connexions et des transactions.
  • Performances et évolutivité.
  • Extraction de données, de profilage des données (en utilisant DataCleaner), les CDC.
  • Cleasing données, la gestion des différents types d'erreurs, la vérification, les données dupliquées, les scripts.
  • Gestion des clés, le chargement des tables de dimension (flocon et étoile), la mise en œuvre de différents types de tables de dimension.
  • Différents types de tables de faits, chargement en vrac, chargement et de manutention.
  • Extraire des données provenant de multiples technologies OLAP.
  • Lifecycle ETL développement, bonnes et mauvaises pratiques, le développement agile, tester, déboguer et de documentation.
  • Scheduling (cron, at xaction, PDS et Pentaho) et de surveillance.
  • Utilisant des clusters dynamiques (Amazon EC2).
  • Intégration et appartenances religieusese, n données en temps réel.
  • Manipulation des formats de données complexes (non relationnel, non structurées).
  • Utilisation du service Web, des exemples de XML, SOAP et RSS.
Depuis qu'il a atteint les derniers détails comment obtenir et compiler Bouilloire, Bouilloire en utilisant l'API Java par exemple, et comment développer des plugins pour étendre Kettle propre!
Pentaho Kettle Solutions aborde l'intégration des données (les 34 sous-systèmes) et systématisé tas de concepts, des exemples des meilleures pratiques, la conception et les problèmes de performance, ce qui en fait une option recommandée pour ceux qui appartiennent entièrement au monde de BI, comme pour ceux qui ont besoin de faire n'importe quel type d'intégration de données.
3) Examen final: Certainement, ceci est une autre lecture du livre essentiel, si vous travaillez avec des solutions de BI de Pentaho ou mettre en œuvre des systèmes transactionnels.Parce que l'intégration de données couvre de nombreux sujets et traite de nombreuses questions qui sont présents dans toute entreprise / organisation qui a des systèmes transactionnels, les systèmes de BI, l'utilisation de SGBD ou de simples tableurs.
Santé.