Pentahoのケトルソリューション:レビュー

良い..

私はちょうど読み終えたPentahoのケトルソリューション 。この本は、その広範な、興味深い、私はもはや私が思っていたよりも読んでいるが、私はコンテンツと多様性を説明するトピックのの質の高さに驚きました。
ここにレビューがあります:
1)概要:これは、維持の問題を簡単に理解し、複雑な多くの説明は、探検読んで、その本は非常に楽しい。この本のハイライトは、別名(これはPDIは働いている専門家によって書かれていることです長年にわたってケトル)は、数多くの貢献をしていても(マットキャスターの場合)の開発を行っている。つまり、それは'ステップ'何であるかを知るの間には大きなギャップがある、彼らはこの'ステップ'を作成した理由を知っており、この違いは、この本の中でどこにでもある。
目的のため、初心者ではありませんがソリューションは、ヤカンPentahoのツールを使用してこのときです誰のための理想的な作業を希望するか、現在とPDIのように念頭に置いて、それらを持っている重要なトピックをカバーし、将来の。
2)評価の詳細:この本のiniファイルをETLツールを持っている必要がありますETLと特殊性について紹介してenceし、インストール方法、それを実行し、ケトルとその主要な機能、提示それは設計されているか、すなわち、変換、ジョブズCEOは、ダイビング、​​データ型の詳細についてはは、リポジトリのタイプ、パラメータ、変数など
その後、倉庫、データロードトランザクションデータベース、および関連するアドレッシングの複雑な問題からのデータを取る例を示しますゆっくりと寸法を変えず 、キャプチャ)データ変更検出のデータセンター(CDC -変更、非正規化など
Ralph Kimball氏によって定義されたETLプロセスの34のサブシステムの説明を継続し、それがそれぞれの状況とモデリングそれぞれのケースで解決する方法に重点を置いて、やかんから各サブシステムに対応します。強調表示するにはカバーのテーマは:
  • 作品の実行は、スレーブサーバ(文字)と、並行して、バックトラック。
  • マルチ、ねじ配電線を実行して変換、クラスタリング、パーティションの変更の管理。
  • 、接続とトランザクションの管理、クラスタリング、プールの一般および高度なオプション:データベースへの接続。
  • パフォーマンスとスケーラビリティ。
  • 例データ、データプロファイリング(DataCleanerを使用して)、CDCの牽引。
  • データクレンジング、エラー、監査、データを複製し、スクリプトの異なるタイプの管理。
  • 鍵管理は、ディメンションテーブル(スノーフレークスキーマとスター)は、ディメンションテーブルのさまざまな種類の実装をロード。
  • ファクトテーブルの異なるタイプは、読み込み、一括読み込みおよび処理します。
  • 複数のOLAP技術からデータを抽出します。
  • ETLsの開発ライフサイクル、良好な慣行の悪い、アジャイル開発、テスト、デバッグ、およびドキュメントを参照してください
  • スケジューリング(cronは、で、xaction、PDSとPentahoの)監視。
  • (AmazonのEC2)ダイナミックを使用してクラスタ。
  • 統合&oacute電子、リアルタイムのデータをn個。
  • 複雑なデータ形式(非リレーショナル、非構造化)処理。
  • Webサービスは、XML、SOAP、およびRSSフィードの例を使用します。
どのように取得し、ケトル、コンパイルの例でJava APIを使用してケトル、どのように独自のプラグインを開発ケトル拡張するために最終的な詳細を達するため!
Pentahoのケトルソリューションは、ベストプラクティス、例、デザイン、パフォーマンスの問題は、BIの世界では、意思にオプションを完全に適している人所属して、概念の統合のデータ(多くの全体の体系化と34のサブシステム)に対応統合データのための種類をいくつか行う必要のある人。
3)最終評価: 作業Pentahoのシステム、BIソリューションまたはトランザクションの実装の ​​本 がなければ 別です、これは疑う余地が必読かどうかいずれかの。データ統合は、多くのトピックをカバーするため、トランザクションシステム、BIシステム、使用DBMSまたは単純なスプレッドシートを持って/組織どのような企業内に存在する多くの問題を解決します。
健康。