विश्लेषणात्मक डेटाबेस (डाटा गोदाम या डेटा की दुकान)

अब तक हम विभिन्न उपकरणों और तकनीकों हम अपने व्यापार खुफिया प्रणाली संचालित करने का उपयोग करने के डेटा की जानकारी और ज्ञान पाने का विश्लेषण कर सकते हैं देखा है.

कुछ मामलों में, वे एक ही उपकरण से हमारे व्यापार करने के लिए डेटा (पढ़ें ERP सीआरएम, या अन्य प्रणालियों) का विश्लेषण प्रणाली तक पहुँचने जा सकता है, लेकिन निश्चित रूप से हम होगा प्रतिक्रिया समय के मामले में समस्याओं, जानकारी विभिन्न प्रणालियों कि सजातीय नहीं कर रहे हैं पर वितरित किया जाता है, जो विश्लेषण करने की प्रक्रिया, जटिल अनम्य रिपोर्टों, आदि, आदि बना देता है

हल करने के लिए इस Dawarehouse या डाटा वेयरहाउस की अवधारणा आया था. एक डेटाबेस उन्मुख विश्लेषण है और कहा कि किसी भी व्यापार खुफिया परियोजना का दिल है.इस डेटाबेस के लिए विश्लेषण उपकरण है कि हम इस्तेमाल के सभी प्रकार का सामना करने में सक्षम होना चाहिए.

आगे बढ़ने से पहले, मैं सुझाव है कि आप विश्वविद्यालय में अपने छात्रों के लिए Josep Curto द्वारा उत्पादित वीडियो देखने के लिए. सभी DW आयामी मॉडल है और अपने सभी घटकों के विषय में concenptos समझाने में. इसके अलावा मैं अपने प्रकाशित लेख में की सिफारिश की विषयगत श्रृंखला ब्लॉग , अच्छा काम.

चलो एक छोटे से अधिक गहराई है कि है देखो:

(परिभाषा में परिषद प्रणाली से ली गई है के लिए डाटा गोदाम एक खरीद की, जो दस्तावेज़ के लिए कंप्यूटर http://www.csi.map.es/csi/silice/Elogicos.html ).

3.1.ऐतिहासिक औचित्य

आज, सूचना प्रौद्योगिकी स्वचालित है आमतौर पर दोहरावदार या प्रशासनिक चरित्र प्रक्रियाओं, का उपयोग कर हम क्या जानकारी परिचालन अनुप्रयोगों के लिए प्रणाली operacionales.Entendemos, उन है कि कंपनी की परिचालन आवश्यकताओं को पूरा कहते हैं. इन पद्धतियों में, सबसे महत्वपूर्ण अवधारणाओं को अद्यतन कर रहे हैं और प्रतिक्रिया समय है. एक बार सबसे अहम परिचालन जरूरतों को संतुष्ट हैं, वहाँ उद्यम प्रणाली पर की जरूरत का एक नया सेट है, जो हमें जानकारी की जरूरत के रूप में योग्य है.जानकारी की जरूरत के लिए, हम उन है कि निर्णय दोनों रणनीतिक और सामरिक पर बनाने के लिए एक आधार के रूप में आवश्यक जानकारी प्राप्त करने के उद्देश्य मतलब है. इन सूचनात्मक आवश्यकताओं डेटा की एक बड़ी संख्या है, जो ऐसा करने के लिए एक बहुत विस्तृत व्यापार मूल्य मिल के रूप में मूल्य के लिए कुल एक ही महत्वपूर्ण है के विश्लेषण पर काफी हद तक आधारित हैं. यह भी सभी चर के महत्वपूर्ण ऐतिहासिक दृश्य का विश्लेषण किया है, और पर्यावरण के डेटा का विश्लेषण है. इन जरूरतों, प्राथमिकताओं एक नहीं कर रहे हैं, मुश्किल हल करने के लिए क्योंकि जानकारी परिचालन प्रणालियों में वास्तव में है.किसी भी कंपनी द्वारा किए गतिविधि अच्छी तरह से अपने डेटाबेस में परिलक्षित होता है.

वास्तविकता, तथापि, ऐसी सूचना प्रणाली निर्माताओं की जरूरत है कई समस्याओं का सामना करना पड़ बैठक के बाद से अलग है. पहला, बड़े पैमाने पर जानकारी प्रश्नों (क्रम में अनुपात मूल्य पाने के लिए या अनुरोध समूहीकृत मानों के सेट), प्रतिकूल अन्य प्रणालियों से सेवा का स्तर प्रभावित हो सकते हैं, प्रश्नों के बाद हम बात कर रहे हैं करने के लिए काफी संसाधनों में महंगे होते हैं. इसके अलावा, जरूरत सीमित लचीलापन के लिए सूचना और इसकी विसंगति वैश्विक दृष्टि की कमी की वजह से ब्राउज़ द्वारा unmet कर रहे हैं (है ऑपरेटिंग सिस्टम है कि इसे रन में संग्रहीत डेटा की एक विशेष देखें.)

इस स्थिति में, अगले विकासवादी कदम के लिए एक जुड़वां ऑपरेटिंग वातावरण, जो आमतौर पर सूचना केन्द्र कहा जाता है जिसमें जानकारी कम आवृत्ति के साथ वातावरण में परिचालन से ताज़ा किया जाता है और स्तर पर आवश्यकताओं में से एक पीढ़ी किया जाना है सेवा उपयोगकर्ताओं को और अधिक लचीले होते हैं.इस रणनीति के संसाधन योजना और अनुप्रयोगों है कि सेवा के एक उच्च स्तर की आवश्यकता ऑपरेटिंग वातावरण का उपयोग करते हुए और बड़े पैमाने पर डेटा की आवश्यकता के सूचना केंद्र में काम कर रहे प्रश्नों की समस्या को हल करती है.इस नए माहौल का एक अन्य लाभ है, कोई निष्कर्ष परिचालन अनुप्रयोगों है.

लेकिन समस्या यहीं खत्म नहीं करते. जानकारी स्थानों की एक भीड़ का उपयोग करने के लिए वांछित डाटासेट मिलना चाहिए प्रश्न के रूप में परिचालन अनुप्रयोगों के रूप में ही संरचना बनी हुई है. प्रतिक्रिया जानकारी के लिए अनुरोध करने के लिए समय बहुत अधिक है. इसके अतिरिक्त, जब विभिन्न प्रणालियों से जानकारी का आयोजन, विभिन्न विचारों और विभिन्न उद्देश्यों के साथ, अक्सर एक आसान में वांछित जानकारी नहीं प्राप्त कर सकते हैं और आवश्यक विश्वसनीयता का अभाव है.

उपयोगकर्ता का सामना करना पड़ इन समस्याओं का मतलब है कि मांगी गई जानकारी का कोई समय और अधिक गहराई से संलग्न जानकारी प्राप्त करना होगा कि यह विश्लेषण, जहां मूल्य जोड़ा लाता है.

3.2 .- क्या एक डाटा गोदाम है?

पारंपरिक प्रणाली की कठिनाइयों के लिए सूचना के जरूरतों को पूरा करने के बाद, वहाँ डेटा वेयरहाउस की अवधारणा को कंपनी के वैश्विक सूचना के जरूरतों के लिए एक समाधान के रूप में.इस विधेयक Inmon द्वारा गढ़ा शब्द है, शाब्दिक अनुवाद के डाटा गोदाम के रूप में. हालांकि, अगर डाटा गोदाम एक डाटा स्टोर ही था, समस्याओं सूचना केंद्र के रूप में ही रहेगा.

ऐसी प्रणालियों के लाभ मुख्य जानकारी की संरचना पर आधारित है इसकी, अवधारणा मौलिक ही है. यह नेस्ट में उपचार के आधार पर परामर्श और संरचना अवधारणा एक में जानकारी का मतलब विश्वसनीय और सजातीय भंडारण की है, और एक परिचालन प्रणालियों के अंतर की स्थापना.के रूप में विधेयक Inmon द्वारा परिभाषित, डाटा वेयरहाउस की विशेषता है:

एकीकृत: गोदाम डेटा संग्रहीत डेटा संरचना में लगातार एक में एकीकृत किया जाना चाहिए, ताकि प्रणाली परिचालन विसंगतियों के बीच विभिन्न सफाया किया जाना चाहिए. जानकारी भी आम तौर पर विस्तार के विभिन्न स्तरों में संरचित को अलग उपयोगकर्ता आवश्यकताओं के अनुरूप.

विषय: केवल ज्ञान व्यापार पैदा करने की प्रक्रिया के लिए डेटा की जरूरत पर्यावरण परिचालन कर रहे हैं एकीकृत से.डेटा आसान और अंत उपयोगकर्ताओं द्वारा उपयोग को समझने के लिए विषय का आयोजन कर रहे हैं. उदाहरण के लिए, सभी ग्राहक डेटा डेटा गोदाम का कोई एकल तालिका में समेकित किया जा सकता है. इस रास्ते में, ग्राहक की जानकारी के लिए अनुरोध के जवाब के लिए आसान हो क्योंकि सभी जानकारी एक ही स्थान में रहता है.

इतिहास: समय गोदाम में एक डाटा निहित है सूचना का एक अंतर्निहित हिस्सा है.परिचालन प्रणालियों में, डेटा हमेशा वर्तमान में व्यावसायिक गतिविधि की स्थिति को प्रतिबिंबित करेगा. इसके विपरीत, डाटा गोदाम में संग्रहीत जानकारी प्रवृत्तियों के विश्लेषण के लिए अन्य बातों के अलावा, कार्य करता है. इसलिए, डाटा गोदाम समय में एक चर के विभिन्न मूल्यों के साथ तुलना की अनुमति देते हैं भरी हुई है.

अनह्रासी डाटा गोदाम एक दुकान में संशोधित जानकारी मौजूद है पढ़ने के लिए हो सकता है, नहीं. जानकारी इसलिए स्थायी है, अद्यतन डेटा नवीनतम क्या पहले से ही अस्तित्व पर कोई भी कार्रवाई के बिना उस में निहित चर लेने मूल्यों को शामिल गोदाम अर्थ.

एफईCodd, संबंधपरक डेटाबेस का पिता माना गया है, जोर दे रहा है जब से जल्दी नौवां दशक, जो संबंधपरक डेटाबेस की एक प्रणाली है, यह निर्णय लेने के लिए प्रत्यक्ष समर्थन होने का मतलब है. इन फैसलों से कई बहुआयामी प्रकृति है, जो इस प्रकार के लिए तैयार नहीं है प्रौद्योगिकी से जूझ रहा है के एक विश्लेषण पर आधारित हैं. इस बहुआयामी विश्लेषण, सूचना और व्यापार आयामों के एक दृष्टि का हिस्सा है. व्यापार के इन आयामों बेहतर क्या हम एक अभिलेख प्रबंधन प्रणाली के लिए दिखाने के लिए, के लिए एक उदाहरण स्थापित करने, पदानुक्रम द्वारा समझा रहे हैंआयाम के लिए ही की संख्या को संभाल कर सकते हैं: भौगोलिक क्षेत्र, फ़ाइल और समय संकल्प के प्रकार.

इन परिभाषित आयाम, के लिए बिक्री की जानकारी के अवलोकन के लिए दाईं तरफ घन के रूप में रेखांकन भी प्रतिनिधित्व करते हैं:

एक क्षेत्र के एक प्रबंधक अपने क्षेत्र के लिए जानकारी को देखने में रुचि होगी यह सभी उत्पादों वितरित लिए समय है.
एक उत्पाद प्रबंधक, लेकिन किसी भी ऐतिहासिक डाटा गोदाम में संग्रहीत जानकारी के लिए अपने उत्पादों की भौगोलिक वितरण की जांच करेंगे.

या फिर आप भी एक समय पर डेटा की जांच सकता है या दृष्टि particularized.बदले में, इन आयामों एक पदानुक्रम के रूप में बाल्टी प्रत्येक प्राथमिक घन है एक प्राथमिक तथ्य है, जो जानकारी उठा सकते गयी में व्याख्या की है.

तो उदाहरण के लिए आप को फरवरी 1996 से Galicia प्रति माह भौतिकी पुस्तकों में बिक्री प्रवृत्तियों मार्च 1997.Ello विश्लेषण करने के लिए चाहते हो सकता है आसान है के लिए (भी "एक क्लिक") बिक्री की जानकारी प्राप्त करने के लिए एक डाटा गोदाम में संग्रहीत हैं, इन पदानुक्रम और व्यापार के इन आयामों को परिभाषित.

इस संबंध में हम डी. के शब्दों उद्धरणवेन Calloway शेयरधारकों की एक सामान्य बैठक में चीफ ऑपरेटिंग ऑफिसर पेप्सीको की:

"दस साल पहले मैं कह सकता है कि कितने Doritos मिसिसिपी के पश्चिम में बेच दिया. आज मैं यह नहीं है कि केवल, लेकिन बता सकते हैं कि कितने हम Irvine, स्थानीय सुपरमार्केट वॉन, के शहर में कैलिफोर्निया, ऑरेंज काउंटी, 4 में गुरुवार को हॉल के अंत में एक विशेष पदोन्नति में बेच दिया. "

डेटा गोदाम के एक अन्य विशेषता यह है कि यह मेटाडेटा शब्द शामिल डेटा पर डेटा, के साथ संबद्ध किया गया है एक अवधारणा है कि.मेटाडाटा जानकारी के मूल के बारे में जानकारी बनाए रख सकते हैं, हमारे almacén.Estos मेटाडेटा से डेटा पर शीतल पेय, परिकलन के विश्वसनीय विधि, आदि की आवृत्ति को सरल बनाने और सूचना के संग्रह से स्वचालित किया जाएगा परिचालन सूचना प्रणाली सिस्टम.

उद्देश्य मेटाडेटा से मुलाकात की समूह के लिए इसे संबोधित है, जो कर रहे हैं,:

सहयोग अंत उपयोगकर्ताओं, की मदद से आप व्यापार की अपनी खुद की भाषा के साथ डेटा गोदाम का उपयोग, जानकारी का संकेत है और यह क्या मतलब है.नेविगेशन उपकरण के माध्यम से प्रश्नों, रिपोर्टें और विश्लेषण बनाने में मदद करें.

परिणाम विकास के लिए सॉफ्टवेयर गोदाम प्रबंधन, डेटा, सूचना सहायता करने के लिए कार्यालय के लिए डाटा वेयरहाउस, लेखा परीक्षा के ऐतिहासिक क्षेत्रों में सूचना प्रणालियों के संचालन के लिए प्रतिक्रिया के इंटरफेस के लिए विनिर्देश निष्कर्षण, आदि

करने के लिए डाटा वेयरहाउस की अवधारणा को समझने, यह प्रक्रियाओं है कि यह आकार पर विचार महत्वपूर्ण है.यहाँ एक डाटा गोदाम के प्रबंधन में उन प्रमुख प्रक्रियाओं हैं:

निष्कर्षण: बाहरी और आंतरिक दोनों प्राप्त जानकारी से भिन्न स्रोतों.
तैयारी: फ़िल्टरिंग, सफाई, सफाई के मानकीकरण, और जानकारी के एकत्रीकरण.
लोड: संगठन और डेटाबेस मेटाडाटा और में डेटा को अद्यतन करने के.
शोषण, एकत्रीकरण निष्कर्षण के स्तर पर अलग से सूचना और विश्लेषण.

देखने के बिंदु से घउपयोगकर्ता, केवल दृश्यमान प्रक्रिया गोदाम का डेटा शोषण है, हालांकि डेटा गोदाम की सफलता के प्रारंभिक जानकारी झूठ में तीन कि प्रक्रियाओं फ़ीड समान करने के लिए और सबसे अधिक प्रतिशत का प्रतिनिधित्व करने के प्रयास के बारे में (80%) दुकान कब का विकास.

परंपरागत किया जा सकता है सिस्टम के साथ एक डाटा गोदाम का अंतर निम्नलिखित योजना में संक्षेप हैं:

एक गोदाम के एक डाटा निर्माण में सफलता के लिए की कुंजी है, धीरे - धीरे विकास विभाग पायलट के रूप में एक उपयोगकर्ता का चयन एक है और धीरे धीरे उपयोगकर्ताओं को स्टोर करने के लिए अन्य डेटा का विस्तार.इसलिए यह महत्वपूर्ण है प्रारंभिक उपयोगकर्ता या पायलट चुनते हैं, तो कुछ उपयोगकर्ताओं के साथ एक विभाग है, जिसमें प्रणाली की इस प्रकार की आवश्यकता बहुत अधिक है और और एकत्र किया जा सकता मापा अल्पकालिक परिणाम के रूप में महत्वपूर्ण है.

हम एक डेटा प्रदान कर सकते हैं मालगोदाम के लाभों को सारांशित द्वारा इस खंड अंत:

• निर्णय किसी भी कार्य क्षेत्र में बना एकीकृत सूचना और विश्व व्यापार पर आधारित है, के लिए एक उपकरण प्रदान करता है.
• सांख्यिकीय तकनीकों और मॉडलिंग के विश्लेषण के लिए डेटा गोदाम के बीच छिपे हुए रिश्तों को खोजने के लिए, इस तरह की जानकारी के व्यवसाय के लिए एक जोड़ा मूल्य होने का आवेदन की सुविधा.
• करने के लिए अतीत से सीखने की क्षमता डेटा प्रदान करता है और विभिन्न परिदृश्यों में भविष्य स्थितियों का अनुमान है.
• ग्राहक संबंध के एकीकृत प्रबंधन प्रणाली के कार्यान्वयन के भीतर कंपनी सरल.
• मान लिया तकनीकी और आर्थिक अनुकूलन सूचना केन्द्र वातावरण, सांख्यिकीय या शानदार निवेश रिटर्न के साथ रिपोर्टिंग.

3.3.Data गोदाम बनामडेटा मार्ट

एक अलग वातावरण में डेटा के दोहराव से एक अक्सर गलत व्याख्या और गलत समझा शब्द है.इस डेटा का सरल प्रतिकृति के अर्थ में DBMS के निर्माताओं द्वारा वितरण प्रणाली में एक केंद्रीकृत परिचालन प्रणाली से किया जाता है. एक डाटा भंडारण संदर्भ में, शब्द दोहराव डेटा मार्ट्स स्थानीय या काउंटी के निर्माण में जानकारी का सबसेट मास्टर केंद्रीय या डेटा गोदाम में निहित पर आधारित के लिए संदर्भित करता है.

के रूप में मेटा समूह द्वारा परिभाषित किया, "एक डाटा मार्ट एक डाटा गोदाम का निर्माण जल्दी से एक ही व्यावसायिक लाइन आवेदन का समर्थन है." डेटा मार्ट्स एकीकरण, गैर अस्थिरता, गैर अस्थिरता विषयगत ध्यान केंद्रित करने और डाटा गोदाम का एक ही विशेषताओं है.प्रतिनिधित्व की एक रणनीति का एक डाटा गोदाम बहुत सामान्य क्षेत्रों के लिए "विभाजन और जीत".

यह रणनीति विशेष रूप से उपयुक्त है जब केंद्रीय डाटा गोदाम बहुत जल्दी बढ़ता है और विभागों की आवश्यकता ही के डेटा का एक छोटा सा हिस्सा है उसमें निहित. इन डेटा मार्ट्स का निर्माण सिर्फ डेटा की एक प्रतिकृति से अधिक की आवश्यकता: दोनों विभाजन समेकन के कुछ अतिरिक्त तरीके के रूप में की जरूरत होगी.

डेटा मार्ट के एक विकेन्द्रीकृत वास्तुकला के लिए पहले दृष्टिकोण आ रही एक के रूप में नीचे वर्णित स्थिति से उत्पन्न हो सकता है.

विपणन विभाग, एक विभागीय समाधान के रूप में डेटा गोदाम का पहला मसौदा चलाया, कंपनी की पहली डेटा बाजार का निर्माण.परियोजना की सफलता, जोखिम या वित्तीय भीड़ के रूप में अन्य विभागों के लिए अपने डेटा मार्ट्स बना दिया. विपणन करने के लिए अन्य डेटा है कि यह भी डेटा मार्ट्स और वित्तीय जोखिम का उपयोग का उपयोग शुरू होता है, और ये ही है. यह एक सामान्य निर्णय की तरह दिखता है, क्योंकि जानकारी सभी डेटा मार्ट्स की जरूरत है बढ़ने के रूप में समय की प्रगति.

जब इस स्थिति डेटा मार्ट्स के बीच एकीकरण की सामान्य योजना बन जाता है, पिछले ग्राफ विकसित.इस स्थिति में, यह आसान है देखने के लिए कैसे डेटा मार्ट्स से जानकारी इस एकीकरण, तो एक पहेली है जिसमें प्रबंधन मुश्किल है के लिए एक असली सिरदर्द पर जानकारी के लिए इस इच्छा बारी में बदल जाता है. लेकिन, क्या विफल रही है डेटा मार्ट्स के एकीकरण है, लेकिन एकता के अपने फार्म का.

वास्तव में, एक बेहतर दृष्टिकोण सभी डाटा मार्ट की जानकारी प्रबंधन का समन्वय एक केंद्रीकृत डाटा गोदाम में किया जाएगा. इस स्थिति में डेटा मार्ट्स आवश्यक जानकारी प्राप्त करने और पहले से भरी हुई और शुद्ध औरकॉर्पोरेट डेटा गोदाम n, कंपनी के व्यापक स्तर के लिए एक ज्ञान के आधार के विकास को सरल बनाने.

यह सरलीकरण शामिल कॉर्पोरेट डेटा गोदाम में डेटा मार्ट्स का प्रबंधन कार्य का केंद्रीकरण से आते हैं, डेटा मार्ट्स के प्रबंधन में बड़ी अर्थव्यवस्थाओं बनाने चाहते हैं.

द्वारा एक अध्ययन IDC (इंटरनेशनल डाटा कार्पोरेशन), 541 कंपनियों, डाटा वेयरहाउस तथा डाटा Marts अब, और भविष्य में इस वितरण पर उनके विचारों की implementations के वितरण का विश्लेषण करने के बाद निम्न दिखाता है:

डेटा गोदाम की तैनाती की मौजूदा अनुपात लगभग डाटा मार्ट की है कि दोहरी है.हालांकि, एक इन परियोजनाओं, डाटा मार्ट में से एक के प्रारंभिक कैरियर के बाद शायद, अधिक के रूप में भविष्य में इस दृष्टिकोण के लिए अनुकूल देखा है "विभाजन और जीत", इन भूमिकाओं के एक उलट आशंका और दोहरीकरण डाटा वेयरहाउस के लिए डेटा मार्ट्स का कार्यान्वयन .
डाटा गोदाम प्रौद्योगिकी के साथ प्रयोक्ताओं और इसे भविष्य में देने सोच के 5 शायद%, पहले से कारकों की एक अध्ययन एक डाटा गोदाम में शामिल नहीं किया है, या प्रारंभिक शुरू करने की स्थिति के माध्यम से चला गया, और नहीं एक पुनर्गठन का प्रस्ताव रखा.

3.4.COMPONENTES विचार जब एक DW भवन

3.4.1.Hardware

एक आवश्यक घटक है जब एक डाटा गोदाम है कि प्रयोक्ताओं की उन्नत विश्लेषणात्मक जरूरतों को पूरा करती है, के लिए प्रदान करने के लिए एक हार्डवेयर के लिए इसे समर्थन बुनियादी ढांचे की शक्ति है.इस संबंध में महत्वपूर्ण है जब या तो हार्डवेयर, दो मुख्य विशेषताएं मूल्यांकन कर रहे हैं:

एक ओर, इस तरह की व्यवस्था करने के लिए कई उपयोगकर्ताओं और विशिष्ट जानकारी की जरूरत के साथ परिचालन प्रणालियों के विपरीत बहुत बड़ी जानकारी की जरूरत के साथ कुछ उपयोगकर्ताओं, पहुंच जाते हैं. जरूरत पड़ने पर जटिल और अप्रत्याशित querying लचीलेपन के कारण, और बड़े जानकारी प्रबंधित एक उच्च प्रदर्शन मशीन पर की जरूरत है.
इसके अलावा, क्योंकि इन प्रणालियों अक्सर सीमित कार्यक्षमता, (एक सिफारिश की स्थिति), यह आवश्यक है कि सिस्टम में उपकरणों की बढ़ती जरूरतों को समर्थन स्केलेबल रहे हैं जो समय के साथ विस्तार होगा साथ शुरू करते हैं.इस अर्थ में, यह एक खुला वास्तुकला है जो हमें एक abricante का सबसे अच्छा बनाने के लिए अनुमति देता के लिए चुनते हैं उचित है.

बाजार आधारित प्रौद्योगिकियों समानांतर प्रसंस्करण प्रौद्योगिकी के क्षेत्र में विकसित किया गया है, उच्च प्रदर्शन और डाटा गोदाम के scalability की जरूरतों के लिए आवश्यक समर्थन दे.इन प्रौद्योगिकियों दो प्रकार के होते हैं:

• एसएमपी (सममित बहु, या सममित बहु) सिस्टम एकाधिक एक बस और एक स्मृति साझा प्रोसेसर है, प्रणाली उत्पादन प्रक्रियाओं साझा ऑपरेटिंग सिस्टम है कि कार्य के वितरण का प्रबंधन के साथ. इन पद्धतियों आर्किटेक्चर कहा जाता है "लगभग सभी साझा." ऐसी प्रणालियों का सबसे महत्वपूर्ण पहलू के प्रदर्शन का स्तर वर्तमान प्रोसेसर की संख्या के सापेक्ष, के लिए गैर रेखीय वृद्धि के कारण है.

• MPP (व्यापक समानांतर प्रसंस्करण या व्यापक समानांतर मल्टीप्रोसेसर): एक तकनीक है कि एसएमपी, जिसमें अर्ध स्वतंत्र प्रणालियों अक्सर उच्च गति interchanges कि एक सिस्टम के रूप में प्रबंधित की अनुमति से जुड़े हुए हैं के विरुद्ध प्रतिस्पर्धा.इसलिए आर्किटेक्चर के रूप में जाना "साझा कुछ नहीं." इसके scalability एसएमपी से अधिक है.

मेटा समूह के मुताबिक, बाजार के रुझान का संकेत है कि एसएमपी आमतौर पर पर्याप्त scalability प्रदान आर्किटेक्चर एक अधिक से अधिक आपूर्ति और कम जोखिम के साथ प्रौद्योगिकी,. हालांकि, जब स्थिति अत्यधिक scalability रहे हैं, एक विकल्प MPP विचार कर सकते हैं. बहरहाल, महत्वपूर्ण प्रगति एसएमपी आर्किटेक्चर, जो रैखिक वृद्धि एक 64 प्रोसेसर के लिए प्रदर्शन के साथ ogrado मशीनों में किया जा रहा है.

3.4.2.-भंडारण सॉफ्टवेयर (DBMS)

के रूप में चर्चा की, व्यवस्था है कि जानकारी (प्रबंधन प्रणाली या DBMS डाटा बेस) का भंडारण प्रबंधन एक डाटा गोदाम में एक और महत्वपूर्ण तत्व है.क्या डाटा गोदाम में संग्रहीत जानकारी बहुआयामी दृष्टिकोण से विश्लेषण किया जा सकता है, DBMS उपयोग प्रौद्योगिकी संबंधपरक डेटाबेस या बहुआयामी किया जा सकता है.

संबंधपरक डेटाबेस परिचालन प्रणालियों में लोकप्रिय हो गए हैं, लेकिन करने के लिए जानकारी के साथ सामना करने में असमर्थ किया गया डेटा गोदाम वातावरण की जरूरत है. इसलिए, और के बाद से, के रूप में उल्लेख किया है, आम तौर पर जानकारी बहुआयामी क्वेरी सेवा करने की जरूरत है, ऐसा लगता है कि एक बहुआयामी डेटाबेस, एक लाभ के साथ शुरू करते हैं.इस अर्थ में, हम टिप्पणियाँ हार्डवेयर, प्रदर्शन आवश्यकताओं, scalability और समेकन तकनीक पर अनुभाग में बनाया को लागू करने.

हार्डवेयर के रूप में, संबंधपरक डेटाबेस के नए डिजाइन, के बाद संबंधपरक डेटाबेस, ऊपर पसंद का एक व्यापक रेंज खोलने के लिए. इन बाद के संबंधपरक डेटाबेस, एक सिद्ध तकनीक पर आधारित हैं और प्रबंधन प्रणालियों के संबंधपरक डेटाबेस संभावनाओं की थकावट का जवाब है, एक ही लाभ भी अगर एक और अधिक कुशलता से बनाया गया आर्किटेक्चर पर लागू प्रदान करते हैं.

यह अधिक से अधिक क्षमता शारीरिक के बजाय तार्किक रिश्ते, जिसका मतलब है कि यह जरूरी है कि एक के लिए आवश्यक कार्यों के क्रियान्वयन को प्राप्त करने के समाधान में और अधिक हार्डवेयर आवंटित नहीं किया है की स्थापना के द्वारा प्राप्त किया है.नतीजा यह है कि वही एक बी.डी. postrelacional पर कार्यान्वित आवेदन कम हार्डवेयर की आवश्यकता है, उपयोगकर्ताओं की एक बड़ी संख्या सेवा कर सकते हैं और अधिक जटिल डेटा का उपयोग करने के लिए गहन तंत्र का उपयोग करें. इसके अलावा, इस तकनीक पदानुक्रमित डेटाबेस और एक कम लागत के साथ संबंध के लाभों को जोड़ती है. दोनों प्रणालियों के लाभ है कि यह सब, शक्तिशाली सर्वर है आवश्यक नहीं है प्रदान करते हैं, लेकिन यह स्तर माना जा सकता हैमामूली हार्डवेयर और कंपनी की जानकारी है और इस प्रणाली के प्रभावी उपयोग के रूप में विकसित करने की जरूरत का विस्तार.

हम इस विवरण कैसे डेटाबेस विक्रेताओं अनुक्रमित करने के लिए उपयोग, या नई ही जानकारी है कि जैसे अन्य लाभ के बीच का अर्थ है, के लिए डेटा (कम जगह सम्पीडन द्वारा की पेशकश की संभावनाओं अनुकूलित किया गाइड के दायरे से बाहर छोड़ दिया, अधिक जानकारी) कैश्ड किया जा सकता है, जिसके लिए प्रेस या निर्माताओं में से एक प्रकाशन को देखें.

सॉफ्टवेयर 3.4.3 .- निष्कर्षण और डेटा हेरफेर

इस भाग में हम एक आवश्यक घटक है जब एक डाटा गोदाम निष्कर्षण, और हेरफेर को लागू करने पर चर्चा की.यह, पेशेवर सूचना प्रौद्योगिकी के दायरे के भीतर काम है जो गिर जाता है के लिए के लिए नियंत्रित करने के लिए उपकरण है और स्वचालित रूप से महत्वपूर्ण है चल "लाड़" और डाटा वेयरहाउस अद्यतन की जरूरत है.

ये उपकरण निम्न सुविधाएँ प्रदान करना चाहिए:

अधिक से अधिक लचीलेपन की अनुमति • नियंत्रण डेटा निष्कर्षण और और में बिताए समय स्वचालन, कम कम प्रलेखित, प्रक्रिया खोज त्रुटि मार्जिन की.
विभिन्न तकनीकों का उपयोग करने के लिए, हरिद्वार उपयोग की प्रभावी बनानेऔर, सॉफ्टवेयर, डेटा और मौजूदा मानव संसाधन.
Marts और डाटा वेयरहाउस प्रदान एकीकृत प्रबंधन के डेटा है, जबकि परिवर्तन एकीकरण, निष्कर्षण और Marts डाटा वेयरहाउस तथा डाटा लोड करने के लिए निर्माण के कॉर्पोरेट.
वास्तुकला का प्रयोग मेटाडेटा, समेकन और नियमों की सुविधा परिभाषा वस्तुओं का व्यापार.
सूत्रों डेटा के विभिन्न प्रकार के लिए एक प्रवेश.
अपवाद हैंडलिंग.
योजना, लॉग, DW इंटरफेस के लिए तीसरे पक्ष के schedulers लोड करने के लिए, योजना एक हमारे लिए नेतृत्व की अनुमति होगी जो प्रबंधन प्रक्रियाओं के सभी.
हार्डवेयर स्वतंत्र इंटरफेस.
सहयोग डाटा वेयरहाउस ऑपरेशन के.

कभी कभी, नहीं आमतौर पर डाटा गोदाम प्रबंधन के इस चरण के लिए पर्याप्त ध्यान देना है, भले ही एक डाटा गोदाम के निर्माण में प्रयास का एक बड़ा हिस्सा है.कई बाजार में है कि काम का स्वचालित ओर से उपकरण उपलब्ध हैं.

Middleware 3.4.4 उपकरण .-

के रूप में उपकरण का एक डाटा गोदाम प्रबंधन चरण की सहायता के लिए, तो उपकरण के दो प्रकार की चर्चा:

• सबसे पहले Middleware उपकरण, विभिन्न वातावरण के बीच कनेक्टिविटी प्रदान करने, डाटा गोदाम के प्रबंधन में मदद करने के लिए.
इसके अलावा •, क्वेरी विश्लेषक और गतिवर्धक विश्लेषणात्मक जरूरतों में अनुकूलन प्रतिक्रिया समय, या डेटा लोड अलग परिचालन प्रणालियों से डाटा वेयरहाउस करने के लिए,.

Middleware उपकरणों के लिए डाटा गोदाम बढ़ता है, चिकनी मात्रा बढ़ने में सक्षम हो स्केलेबल किया जाना चाहिए.उन्होंने यह भी लचीला और मजबूत करने के लिए पर्याप्त प्रदर्शन प्रदान भूल के बिना किया जाना चाहिए. वास्तविक (OLE, ODBC, आदि) के मानकों के बाजार के सबसे लोकप्रिय प्रकार (DB2, प्रवेश, आदि.) के रूप में के माध्यम से डाटा भंडारण वातावरण के सभी प्रकार, दोनों के लिए खुला. कम से कम में मानक कनेक्टिविटी परिवहन,(SNA LU6.2, DECnet, आदि) अच्छी तरह से सुरक्षित होना चाहिए.

इन उपकरणों का प्रयोग, Middleware प्राप्त:

• अधिकतम संसाधन अनुप्रयोगों के लिए सबसे उपयुक्त मंच पर चल रहे.
• एकीकृत एक वितरित मंच पर डेटा और अनुप्रयोगों के मौजूदा.
• एक केंद्रीकृत प्रणाली से डेटा और अनुप्रयोगों के वितरण को स्वचालित.
• कम नेटवर्क यातायात, ग्राहक सर्वर के स्तर पर (डेटा और अधिक या कम स्थानीय, कम या ज्यादा स्थानीय प्रक्रिया) संतुलन.
• करने के लिए कई ऑपरेटिंग वातावरण सीखने के बिना रिमोट सिस्टम की क्षमताओं का दोहन.
• सुनिश्चित प्रणाली scalability.
• विकसित और सर्वर पर स्थानीय अनुप्रयोगों के शोषण.

Analyzers और querys गतिवर्धक निष्पादित प्रश्नों और उनके साथ जुड़े हैं के डेटा का एक लॉग फ़ाइल पर निर्णायक काम (प्रतिक्रिया समय सारणी पहुँचा, अभिगम विधि, आदि).इस लॉग विश्लेषण किया है, तो स्वतः या डेटा प्रबंधक की निगरानी के लिए उपयोग समय में सुधार के द्वारा.

इन निगरानी प्रणाली एक अलग टेस्ट मैचों में या वास्तविक वातावरण में कार्यान्वित किया जा सकता है. एक परीक्षण पर्यावरण पर चल रहे हैं, तो असली परिवेश का प्रदर्शन प्रभावित नहीं है. हालांकि, यह अनुकूलित करने के लिए संभव विश्लेषण के बाद से किए गए प्रयासों के गैर महत्वपूर्ण प्रश्नों पर प्रदर्शन किया जा सकता है या अक्सर उपयोगकर्ताओं द्वारा किया जाता है.

असली वातावरण में एक प्रश्न विश्लेषक दाखिल भी लाभ का एक जैसे नंबर है:

• तुम असली पर्यावरण की प्रतिक्रिया समय की निगरानी कर सकते हैं.
• तंत्र क्वेरी अनुकूलन कर सकते हैं को लागू करने, सिस्टम लोड को कम करने.
• आप डेटा वेयरहाउस की लागत के लिए उपयोगकर्ताओं के लिए लागत आवंटित कर सकते हैं.
• आप एक अत्यधिक प्रतिक्रिया समय के लिए नेतृत्व करेंगे विचार विमर्श के लिए तंत्र बंद कर सकते हैं.

3.4.5.Conclusiones और हित के विचार.

डाटा गोदाम हमारे व्यापार खुफिया प्रणाली में मुख्य तत्व हो जाएगा.इसके उचित परिभाषा, डाटा प्रोसेसिंग और लोडिंग परियोजना के बाद सफलता पर निर्भर करेगा.

हालांकि अंत उपयोगकर्ता को देखने विश्लेषण उपकरणों का केवल एक सेट डेटा के लिए "हमला", का उपयोग करने के लिए आगे की प्रक्रिया है कि विभिन्न प्रणालियों से सभी जानकारी बनाने की एक श्रृंखला की पहचान की गई है, निकाले, संसाधित, homogenized, शुद्ध और डाटा गोदाम में भरा हुआ है.इस ETL उपकरण और middleware के माध्यम से संभव है. और यह हिस्सा है कि सामान्य रूप से किसी भी परियोजना में और अधिक समय लेता है.

कई बार एक विभाग के लिए इस प्रकार है कि फिर हमें आंतरिक रूप से संगठन के भीतर परियोजना को बेचने की अनुमति के पायलट योजनाओं को लागू करने के लिए चुनना चाहिए.

कि हमेशा उपकरणों के उपयोग करने के लिए लींचपीण के रूप में प्रशिक्षण को महत्व देना होगा.

बीआई और DW परियोजनाओं केवल तकनीकी परियोजनाओं नहीं होगा, वहाँ बहुत अधिक पीछे है, और हालांकि वे तकनीक का इस्तेमाल किया व्यापार ज्ञान है पर प्रतिबिंबित करना चाहिए जो वास्तव में जरूरत है, जब तक निचले स्तर के बाद से वरिष्ठ निर्णय प्रक्रिया.इस समय द्विपक्षीय सलाहकार भी प्रौद्योगिकीय ही नहीं बल्कि व्यापार के क्षेत्र का ज्ञान ज्ञान और विभिन्न डिजाइन, विकास में इस्तेमाल किया जा तत्वों को एक द्विपक्षीय व्यवस्था के संचालन और प्रदान करने में सक्षम होना चाहिए (ब्लॉग में अपने फर्नांडीज द्वारा जॉर्ज लेख देखें: द्विपक्षीय सलाहकार, पागल है कि .)

3.4.6.DW दुनिया में नई प्रवृत्तियों. 2.0 Datawarehouse.

DW सिस्टम हाल के वर्षों में विकसित किया है के रूप में नए की जरूरत पैदा हुई है. इस विकास के लिए कई कारण हैं, और के रूप में संक्षेप किया जा सकता है:

विश्लेषण उपकरण है जो आवश्यक विभिन्न संरचनाओं कुछ प्रौद्योगिकियों (डाटा खनन या सांख्यिकीय उपकरणों के उपयोग जैसे) के उपयोग optimazadas का प्रयोग करें -.

- जटिल प्रत्येक विभाग के लिए एकाधिक डेटा उन्मुख DW marts जिसमें आप कॉर्पोरेट की अवधारणा को खोने से मिलकर सिस्टम के प्रबंधन को आसान बनाने (जो याद अवसरों का कारण बनता है).

- से कई छोटे (Datamarts या Datawarehouse) अनुप्रयोगों के संयोजन सब कॉर्पोरेट जानकारी ही नहीं उठता.यह करने के लिए इस केंद्र से जो विश्लेषण के सभी क्षेत्रों के लिए सभी आवश्यक DW उत्पन्न होगा बनाने के लिए आवश्यक हो जाएगा.

- ऑनलाइन प्रक्रिया: उन्नयन का मतलब है कि वहाँ कई बार जब आप डेटा का उपयोग नहीं कर सकते थे प्रक्रिया. इसी प्रकार, वहाँ की जानकारी है, जो हमें तत्काल बनाने के लिए (व्यवसाय आपरेशन की अधिक उन्मुख विश्लेषण) रोका की उपलब्धता में कुछ देरी हो सकती है.

- ETL उपकरणों में प्रौद्योगिकीय विकास, प्रौद्योगिकी लागत (लागत नीचे आ रही हैं ताकि परियोजनाओं को एक व्यापक तरीके से, आदि का पता कर सकते हैं).

के लिए यह सब सीआईएफ की अवधारणा (कॉर्पोरेट जानकारी फैक्टरी) है, जो हम सभी तत्वों से नीचे चित्र में देख शामिल हो सकते हैं आता है:

कॉर्पोरेट जानकारी फैक्टरी (CIF) बुनियादी सुविधाओं है एक वैचारिक वास्तुकला का वर्णन बीआई और categorizes मजबूत एक जानकारी भंडार सफलतापूर्वक इस्तेमाल करने के लिए काम करते हैं और लेते हैं.

इस वास्तुकला का प्रयोग या अन्य सरल लेकिन कंपनी, आवश्यकताओं के विश्लेषण के प्रकार पर निर्भर करेगा और जहां यह बीआई के उपयोग में आने करना चाहता है.तत्व है कि संक्षिप्त में सीआईएफ बनाने के लिए, कर रहे हैं:

डेटा गोदाम: गोदाम है डेटा तक तो देखा, परिभाषा के अनुसार.लेकिन यह भी, इस संरचना में डेटा एकीकरण के मध्य बिंदु है. केंद्रीकृत सारी जानकारी यह हमारे संगठन में जानकारी का एक आम दृष्टि देता है और डेटा प्रदान करने के लिए शेष सामग्री को भरने के डेटा (डेटा निष्कर्षण वितरण छानने की स्थिति की प्रक्रिया के माध्यम से विशिष्ट डेटा स्टोर, संक्षिप्तीकरण, विश्लेषण के अन्य प्रकारों के लिए आदि).

परिचालन डेटा स्टोर: किसी डेटा स्टोर, DW जैसे, लेकिन उन्मुख निर्णय सामरिक के लिए बना. वर्तमान डाटा फ़ीड परिचालन प्रणालियों से, हम एक ऐतिहासिक रहे हैं, बहुत है और अधिक विस्तृत जानकारी और अद्यतन बार कर रहे हैं आमतौर पर बहुत तेजी से व्यापार का संचालन डेटा पर तेजी से निर्णय लेने की अनुमति देने के लिए.यह एक के पास वास्तविक समय हो सकता है और अक्सर ग्राहकों को, सामग्री, सूची, बिक्री, आदि के बारे में जानकारी शामिल होगा

डाटा अधिग्रहण: गोदाम हैं सभी उपकरण और डेटा प्रबंधन प्रणाली के लिए अनुमति देता है कि हमें निकालने, हमारे डेटा से बदलना और लोड बाहरी प्रणाली, ईआरपी, आंतरिक प्रणाली, फ़ाइलें, आदि) पर (विभिन्न स्रोत प्रणाली. Serian ETL उपकरण और डाटा अधिग्रहण (डेटा Acquis का प्रबंधन प्रणालियोंप्रबंधन ition).

डेटा डिलिवरी: एकत्रीकरण की जानकारी संचालन कर रहे हैं, आवश्यकताओं व्यापार फ़िल्टर करके आकार या विशिष्ट, reformatting या जानकारी के प्रसंस्करण के लिए उपकरणों विशिष्ट बीआई के समर्थन का उपयोग करें, और अंत में, संगठन में सूचना के प्रसारण (विशिष्ट Datamarts या गोदाम के लिए सामग्री देने के लिए).

जब से हम द्विपक्षीय की विशिष्ट तकनीक का उपयोग का DW-उन्मुख सबसेट का निर्माण कर सकते हैं:

अन्वेषण वेयरहाउस: गोदाम अन्वेषण अन्वेषण का उपयोग करने के लिए सांख्यिकीय प्रकार और उपकरण.

खनन डाटा गोदाम: तकनीक खनन के आंकड़ों का इस्तेमाल गोदाम के लिए.

OLAP (OLAP प्रकार) के विश्लेषण के बहुआयामी उपयोग डाटा मार्ट डाटा गोदाम के लिए.

परिचालन मार्ट: स्टोर) डेटा एक सबसेट का ODS (आपरेशनल, गुंजाइश छोटे से एक के लिए प्रतिबंधित सक्षम परिचालन विश्लेषण.

यदि आप नए वास्तुकला के बारे में अधिक जानना चाहते हैं, मैं किताबें सुझाव है:

डाटा गोदाम टूलकिट: आयामी मॉडलिंग करने के लिए पूरी गाइड

राल्फ Kimball, Margy रॉस.- 2 एड.
ISBN 0-471-20024-7

डाटा गोदाम डिजाइन Mastering

Imhoff, Claudia
Galemmo, निकोलस
Geiger, जोनाथन जी
:978-0-471-32421-8 ISBN

2.0 DW: डेटा की अगली पीढ़ी के भण्डारण के लिए वास्तुकला

विलियम Inmon
डेरेक स्ट्रास
Genia Neushloss
ISBN: 978-0-12-374319-0