データウェアハウスのアーキテクチャ、私たちの会社Storeのデータ領域

キューブターゲットマートデータの道とに渡すと、データがある環境を場合引き上げているシステムには、 ウェアハウスの設計アーキテクチャのデータ 要件を加えておよびDWHを 、通常、その役割の支持分析 、行う必要がある変更の所定量するようにされ、それらが実行する統合データ関数をする店を経営形成また、 システム運用方法を相談の伝統的なそれはツールのOLAPおよびシステムパスの間に、ソース領域のデータがお勧めするために作成異なります

これらの領域の各々は、データがどのように、同じで構成されて、何の必要性の種類に対応できる、彼らが実行される機能によって区別されます。道路'領域の末尾に'が重要であるが、それは、 レポートのツールをする悪用されるデータストアのみがされていません

もなく、正確に各エリアをカバーし内容に標準の契約、およびそれらのそれぞれを使用する義務があります。各プロジェクトには、異なっており、複雑さが情報量など、多くの要因によって影響を受けてあなたが本当に企業の店舗やマスター情報システムのようにデータウェアハウスを使用する場合、または業務レポートをサポートするための真のニーズがある場合。

私は一般的に使用されるデータ領域以下の議論、私は誰もが自分のニーズや経験の面でお好みだけに対応していることが提案されたアーキテクチャを概説するよ、これをする見て。

ポンドは、ODS、DWHをとDM

ステージング領域

それはあなたのホームシステムに必要なデータを収集する一時的な領域です。我々は、データが厳密にロードするために必要な収集とそれらに最小限の変更を適用します。制限や整合性キーが使用されてありますが、データは、テーブル、フラットファイルであるかのように扱われます。これは、ソースシステムへの影響を最小限に抑えることが、チャージとして必要な時間のウィンドウを最小化するために、可能な限り迅速にされ、エラーの可能性を最小限に抑えられます。データが転送されると、DWHを、ソースシステムの次の負荷に独立しています。通常追加される唯一の事は負荷の格納する日付フィールドです。

明らかに、これらのデータは、任意のレポートアプリケーションを提供しませんが、その機能は、純粋に動作しているので、彼らは、頻繁に表示されていないアーキテクチャの論理図で実際には、その目的は削除されます提供したら一時的なデータがあります。

いくつかのステージング領域は、私は、この地域は、ETLが行われる処理環境全体を​​包含する、あるいは、私は一時的な領域としてのみ使用するために選んだと述べているものよりも包含することを検討してください。

のODS(オペレーショナルデータストア)

その名前が示すように、この領域は運用システムをサポートする予定です。オペレーショナルデータストアのデータモデルは、リレーショナル構造と標準化されているように、すべてのレポート作成ツールまたは照会できるデータのオペレーティングシステム。それは、統合作業はギャラリーを作成することです活用ので、データウェアハウス内にある我々はBIとDWHを話し始める前に企業のデータはまた、業務上のニーズに対処する必要はありません、またこのようBusiness Intelligenceに固有のものであり、ODSは既に存在していた。

これは、瞬間のイメージを示し、過去のデータを格納していませんが、それはあなたが変更を登録することができないことを意味しません。

ODSのデータは、ステージエリアから収集されるここでは、処理、データクレンジングとデータがシームレスに標準的なリレーショナルモデルに統合されると、参照整合性チェックを行います。

更新プログラムのODSのデータは、データソースシステムの変更は、対応する負荷の終了時まで反映されません、瞬時されないことに注意してください。つまり、レポートはほとんどがソースシステムに存在するものとして'分'とすることができるのODSに対して起動されるので、データは、ユーザーに説明しなければならない時間、随時更新されますです。それは、ODSの貨物の高い周波数に設定されているか何コーポレートギャラリーいることを確認します。必要な場合は、たとえば、残りの毎日、およびは、ODSには15分ごとに更新することができます。

企業のデータウェアハウス

企業のデータウェアハウスは、過去のデータが含まれていない、それが収集した情報の分析活用を目指している。DSSのツールや分析レポートは、主にデータマートを攻撃するが、企業のデータウェアハウスに対して直接クエリすることができます、それは別のデータマートに存在するデータの両方を表示するために必要な場合は特に。

これは、両方のステージング領域およびODSから来るデータを格納することができます。私たちは、ODSの変換と統合のプロセスを行っている場合、企業の倉庫で同じデータを渡すために繰り返すつもりはない。どのような自体がステージング領域を見て行くことにODSから収集することはできません。

方式は、標準のリレ​​ーショナルモデルに似ています、すでに非正規化手法が適用されます。たとえば、標準のフォーマットで、多くの階層関係はここで作成する必要があります別々のテーブルを使用して実装されるため、としてディメンションを表して、同じテーブルで、テーブルまたは関係の過剰な数を含めることはできません。もう一つの特徴はテーブルのほとんどは、日付フィールドが読み込み、日付、イベントが発生した日付、または登録の有効期間を制御するなどしなければならないということです。

Ifまたはデータ、大きさすぎるギャラリーの需要レベルは、を排除ODSを選択することが構造を簡素化、'運用の'面での要件を高い、非常にされていない、必要に応じて調整する企業データウェアハウスをレポートのタイプの二提供しています。この場合、結果として得られる領域は、企業のDWHをされる時ものODSと呼ばれる。

データマート

そして最後に我々は、データマートを作成する場所ですデータの最後の領域に来る。これらは、企業の倉庫の分野で収集した情報から導出されます。各データマートは、このストアのサブセットされているテーマ指向分析は、通常、会社の部門に関連付けられています。

データマートは、多次元構造で設計されており、分析の各オブジェクトには、さまざまなディメンションテーブルにリンクされているファクトテーブルです。次元ごとに実質的にテーブルになるスターモデルに応じて設計された場合非正規版です。モデルスノーフレークディメンションテーブルは、各次元の以下、非正規化され下に階層的にリンクされている複数のテーブルを使用することができます。

ツールは、ROLAPの種類を動作している場合、このエリアには、または、他の同じデータベースにある可能性のあるデータベースのいずれかから作成することができ、データ構造自体は知られているMOLAPをスタイルのアプリケーションを作成する多次元キューブ。

レポートには、このデータは、以上の以前の分析のための領域を使用する必要がありますが、かなりされているソフトウェアの独立性を簡単にいくつか提供し、また、これ。あなたは、メタデータを再定義するよりも、キューブを再生成、および変更は、2つのROLAPタイプでも、後者が必要となるの間であれば、もう少しするだろうOLAPツールを変更する必要が何らかの理由でください。いずれの場合も、上記の分野を変更する必要はありません。

それについてトークフォーラム