Pentahoはケトルソリューション:レビュー

良い..

私はちょうど読み終わったPentahoのケトルのソリューションを 。この本は非常に広範で面白いですが、私は思ったより長く読んできたが、私が扱うトピックの内容と多様性の質の高さに驚いた。
ここにレビューは以下のとおりです。
1)概要:これは、維持の説明を理解しやすい多くの複雑な問題を分析して読むのは非常に面白い本である。この本のハイライトは、PDI(別名で働いている専門家によって書かれていますケトル)は長年にわたり、数多くの貢献をしても(マットキャスターの場合)、その開発を行っている。つまり、それは"ステップ"のためであるかを知るには大きなギャップがある、と彼らはこの"ステップ"を作成した理由を知って、そしてこの違いは、この本のどこでも顕著です。
Pentahoのケトルソリューション初心者のために意図されていないが、現在はPDIでの作業や将来何をしたい、このツールを使用する際には、それらを持つことが不可欠なトピックをカバーしている方に最適です。
2)詳細レビュー:この本のiniETLおよびETLツールを持っているはずの特殊性についての導入と比較し、その差は、その後、ケトルを提示し、彼らのそれをインストールして実行する方法の特性、および変換で、それが設計されている方法、すなわち細部、ジョブズ、ジャンプ、データ型について説明します、リポジトリの種類、パラメータ、変数、等
その後の例では、トランザクションデータベースからデータを取得し、データウェアハウスのロード、関連する複雑な問題に対処するために提示緩やかに変化するディメンションを 、非正規化、等- 、データの検出(チェンジデータキャプチャCDCの)変更
Ralph Kimball氏によって定義し、それがそれぞれの状況やそれぞれのケースで説明して解決する方法に重点を置いて、ポットから各サブシステムに対応するようにETLプロセスの34のサブシステムの説明に従ってください。強調するために、次の項目について説明します。
  • ジョブの実行、バックトラッキング、並行して、スレーブサーバ(手紙)。
  • マルチスレッド、配電線、クラスタリングとパーティションの変更の管理を実行して変換。
  • データベースへの接続:一般および高度なオプション、プーリング、クラスタ化、接続およびトランザクションの管理。
  • パフォーマンスとスケーラビリティ。
  • EXデータ、データのプロファイリング(DataCleanerを使用して)、CDCのトラクション。
  • データcleasing、エラー、監査、重複データ、スクリプトの異なるタイプの管理。
  • ディメンション表をロードする鍵管理、(スノーフレークスキーマとスター)、ディメンション表の異なるタイプのインプリメンテーション。
  • ファクトテーブルの異なる種類、バルクロード、ロードし処理する。
  • 複数のOLAPのテクノロジーからデータを抽出します。
  • ライフサイクルETLの開発、良いと悪い慣行、アジャイル開発、テスト、デバッグおよびドキュメント。
  • スケジューリング(cronの、で、xaction、PDSとPentahoの)とモニタリング。
  • 動的クラスタ(Amazon EC2を)使用する。
  • 統合と宗教的な提携E、Nリアルタイムデータ。
  • (非構造化、非リレーショナル)の複雑なデータ形式を処理する。
  • Webサービス、XMLの例、SOAPやRSSを使用する。
ケトルは、自分の拡張するプラグインを開発する方法を例にJava APIを使用してケトル、ケトルを入手し、コンパイルする方法を最終的な詳細に達し、それ以来!
Pentahoはケトルソリューションとして、それをBIの世界に完全に属している方にお勧めのオプション作り、データの統合(34サブシステム)と概念、例、ベストプラクティス、デザインとパフォーマンスの問題の体系全体の多くに対処するデータ統合のあらゆる種類を行う必要がある人のために。
3)最終的なレビューは:確かに、 これは、PentahoのBIソリューションでの作業やトランザクションシステムを実装しているかどうか、別の本必読です。データの統合は、多くのトピックやアドレストランザクションシステム、BIシステムを持つすべての企業/組織に存在する多くの問題をカバーするので、DBMSまたは単純なスプレッドシートを使用してください。
健康。