Computer in Hindi | Business in Hindi: data-warehouse
Showing posts with label data-warehouse. Show all posts
Showing posts with label data-warehouse. Show all posts

Tuesday, October 26, 2021

What is Data mining techniques in Hindi - Data warehouse notes PDF

October 26, 2021 0
What is Data mining techniques in Hindi - Data warehouse notes PDF

 डेटा माइनिंग में पहले से अज्ञात, मान्य पैटर्न और विशाल डेटा सेट में संबंधों को खोजने के लिए परिष्कृत डेटा विश्लेषण टूल का उपयोग शामिल है। ये उपकरण सांख्यिकीय मॉडल, मशीन सीखने की तकनीक और गणितीय एल्गोरिदम, जैसे तंत्रिका नेटवर्क या निर्णय पेड़ शामिल कर सकते हैं। इस प्रकार, डेटा माइनिंग में विश्लेषण और भविष्यवाणी शामिल है।


मशीन लर्निंग, डेटाबेस प्रबंधन और सांख्यिकी के प्रतिच्छेदन से विभिन्न तरीकों और तकनीकों के आधार पर, डेटा माइनिंग में पेशेवरों ने अपने करियर को बेहतर ढंग से समझने के लिए समर्पित किया है कि कैसे बड़ी मात्रा में डेटा को संसाधित और निष्कर्ष निकाला जाए, लेकिन वे कौन से तरीके हैं जिनका वे उपयोग करते हैं ऐसा करने के लिए?


हाल ही में डेटा माइनिंग परियोजनाओं में, विभिन्न प्रमुख डेटा माइनिंग तकनीकों को विकसित और उपयोग किया गया है, जिसमें एसोसिएशन, वर्गीकरण, क्लस्टरिंग, भविष्यवाणी, अनुक्रमिक पैटर्न और प्रतिगमन शामिल हैं।


data mining techniques in hindi
data mining techniques in hindi


data mining techniques in Hindi

1. Classification:

इस तकनीक का उपयोग डेटा और मेटाडेटा के बारे में महत्वपूर्ण और प्रासंगिक जानकारी प्राप्त करने के लिए किया जाता है। यह डेटा माइनिंग तकनीक डेटा को विभिन्न वर्गों में वर्गीकृत करने में मदद करती है।


डेटा माइनिंग तकनीकों को विभिन्न मानदंडों द्वारा वर्गीकृत किया जा सकता है, जो निम्नानुसार हैं:


  • खनन किए गए डेटा स्रोतों के प्रकार के अनुसार डेटा माइनिंग फ्रेमवर्क का वर्गीकरण [Classification of Data mining frameworks as per the type of data sources mined:]

यह वर्गीकरण संभाले गए डेटा के प्रकार के अनुसार है। उदाहरण के लिए, मल्टीमीडिया, स्थानिक डेटा, टेक्स्ट डेटा, समय-श्रृंखला डेटा, वर्ल्ड वाइड वेब, आदि।

  • शामिल डेटाबेस के अनुसार डेटा माइनिंग फ्रेमवर्क का वर्गीकरण:

यह वर्गीकरण शामिल डेटा मॉडल पर आधारित है। उदाहरण के लिए। ऑब्जेक्ट-ओरिएंटेड डेटाबेस, ट्रांजेक्शनल डेटाबेस, रिलेशनल डेटाबेस, इत्यादि।

  • खोजे गए ज्ञान के प्रकार के अनुसार डेटा माइनिंग फ्रेमवर्क का वर्गीकरण:

यह वर्गीकरण खोजे गए ज्ञान के प्रकार या डेटा माइनिंग कार्यात्मकताओं पर निर्भर करता है। उदाहरण के लिए, भेदभाव, वर्गीकरण, क्लस्टरिंग, लक्षण वर्णन, आदि। कुछ ढांचे व्यापक ढांचे होते हैं जो कुछ डेटा खनन कार्यात्मकताओं को एक साथ पेश करते हैं।

  • इस्तेमाल की गई डेटा माइनिंग तकनीकों के अनुसार डेटा माइनिंग फ्रेमवर्क का वर्गीकरण:

यह वर्गीकरण उपयोग किए गए डेटा विश्लेषण दृष्टिकोण के अनुसार है, जैसे तंत्रिका नेटवर्क, मशीन लर्निंग, जेनेटिक एल्गोरिदम, विज़ुअलाइज़ेशन, सांख्यिकी, डेटा वेयरहाउस-ओरिएंटेड या डेटाबेस-ओरिएंटेड, आदि।

वर्गीकरण डेटा माइनिंग प्रक्रिया में शामिल उपयोगकर्ता इंटरैक्शन के स्तर को भी ध्यान में रख सकता है, जैसे क्वेरी-संचालित सिस्टम, स्वायत्त सिस्टम, या इंटरेक्टिव एक्सप्लोरेटरी सिस्टम।


2. data mining techniques in Hindi : Clustering

क्लस्टरिंग जानकारी का एक विभाजन है जो जुड़ी हुई वस्तुओं के समूहों में होता है। कुछ समूहों द्वारा डेटा का वर्णन करना मुख्य रूप से कुछ निश्चित विवरण खो देता है, लेकिन सुधार को पूरा करता है। यह अपने समूहों द्वारा डेटा मॉडल करता है।


 डेटा मॉडलिंग सांख्यिकी, गणित और संख्यात्मक विश्लेषण में निहित ऐतिहासिक दृष्टिकोण से क्लस्टरिंग करता है। मशीन सीखने के दृष्टिकोण से, क्लस्टर छिपे हुए पैटर्न से संबंधित होते हैं, क्लस्टर की खोज अप्रशिक्षित शिक्षण है, और बाद की रूपरेखा एक डेटा अवधारणा का प्रतिनिधित्व करती है। व्यावहारिक दृष्टिकोण से, क्लस्टरिंग डेटा माइनिंग अनुप्रयोगों में एक असाधारण कार्य करता है।


 उदाहरण के लिए, वैज्ञानिक डेटा अन्वेषण, पाठ खनन, सूचना पुनर्प्राप्ति, स्थानिक डेटाबेस अनुप्रयोग, सीआरएम, वेब विश्लेषण, कम्प्यूटेशनल जीव विज्ञान, चिकित्सा निदान, और बहुत कुछ।


दूसरे शब्दों में, हम कह सकते हैं कि क्लस्टरिंग विश्लेषण समान डेटा की पहचान करने के लिए डेटा माइनिंग तकनीक है। यह तकनीक डेटा के बीच अंतर और समानता को पहचानने में मदद करती है। क्लस्टरिंग वर्गीकरण के समान ही है, लेकिन इसमें डेटा के समूह को उनकी समानता के आधार पर समूहीकृत करना शामिल है।


3. Regression:

प्रतिगमन विश्लेषण डेटा माइनिंग प्रक्रिया है जिसका उपयोग अन्य कारकों की उपस्थिति के कारण चर के बीच संबंधों की पहचान और विश्लेषण करने के लिए किया जाता है। इसका उपयोग विशिष्ट चर की संभावना को परिभाषित करने के लिए किया जाता है। प्रतिगमन, मुख्य रूप से योजना और मॉडलिंग का एक रूप। उदाहरण के लिए, उपलब्धता, उपभोक्ता मांग और प्रतिस्पर्धा जैसे अन्य कारकों के आधार पर, हम कुछ लागतों को प्रोजेक्ट करने के लिए इसका इस्तेमाल कर सकते हैं। मुख्य रूप से यह दिए गए डेटा सेट में दो या दो से अधिक चर के बीच सटीक संबंध देता है।


4. Association Rules:

यह डेटा माइनिंग तकनीक दो या दो से अधिक वस्तुओं के बीच एक लिंक खोजने में मदद करती है। यह डेटा सेट में एक छिपा हुआ पैटर्न ढूंढता है।


एसोसिएशन के नियम अगर-तो बयान हैं जो विभिन्न प्रकार के डेटाबेस में बड़े डेटा सेट के भीतर डेटा आइटम के बीच बातचीत की संभावना दिखाने के लिए समर्थन करते हैं। एसोसिएशन रूल माइनिंग के कई अनुप्रयोग हैं और आमतौर पर डेटा या मेडिकल डेटा सेट में बिक्री सहसंबंधों में मदद करने के लिए इसका उपयोग किया जाता है।


एल्गोरिदम काम करने का तरीका यह है कि आपके पास विभिन्न डेटा हैं, उदाहरण के लिए, किराने की वस्तुओं की एक सूची जो आप पिछले छह महीनों से खरीद रहे हैं। यह एक साथ खरीदी जा रही वस्तुओं के प्रतिशत की गणना करता है।


ये तीन प्रमुख माप तकनीक हैं:


  • Lift:

यह माप तकनीक इस विश्वास की सटीकता को मापती है कि कितनी बार आइटम बी खरीदा जाता है।

                  (Confidence) / (item B)/ (Entire dataset)

  • Support:

यह मापन तकनीक मापती है कि कितनी बार एक से अधिक आइटम खरीदे जाते हैं और इसकी तुलना समग्र डेटासेट से की जाती है।

                   (Item A + Item B) / (Entire dataset)

  • Confidence:

यह मापन तकनीक मापती है कि आइटम ए को भी खरीदे जाने पर आइटम बी कितनी बार खरीदा जाता है।

                  (Item A + Item B)/ (Item A)

5. data mining techniques in Hindi : Outer detection

इस प्रकार की डेटा माइनिंग तकनीक डेटा सेट में डेटा आइटम के अवलोकन से संबंधित है, जो अपेक्षित पैटर्न या अपेक्षित व्यवहार से मेल नहीं खाती है। इस तकनीक का उपयोग विभिन्न डोमेन जैसे घुसपैठ, पता लगाने, धोखाधड़ी का पता लगाने आदि में किया जा सकता है। इसे बाहरी विश्लेषण या बाहरी खनन के रूप में भी जाना जाता है। 


बाहरी एक डेटा बिंदु है जो बाकी डेटासेट से बहुत अधिक भिन्न होता है। वास्तविक दुनिया के अधिकांश डेटासेट में एक बाहरी है। डेटा माइनिंग क्षेत्र में बाहरी पहचान एक महत्वपूर्ण भूमिका निभाती है। नेटवर्क रुकावट की पहचान, क्रेडिट या डेबिट कार्ड धोखाधड़ी का पता लगाने, वायरलेस सेंसर नेटवर्क डेटा में बाहरी का पता लगाने आदि जैसे कई क्षेत्रों में बाहरी पहचान मूल्यवान है।


6. Sequential Patterns:

अनुक्रमिक पैटर्न एक डेटा माइनिंग तकनीक है जो अनुक्रमिक पैटर्न की खोज के लिए अनुक्रमिक डेटा के मूल्यांकन के लिए विशिष्ट है। इसमें अनुक्रमों के एक सेट में दिलचस्प बाद की खोज शामिल है, जहां एक अनुक्रम की हिस्सेदारी को विभिन्न मानदंडों जैसे लंबाई, घटना आवृत्ति, आदि के संदर्भ में मापा जा सकता है।


दूसरे शब्दों में, डेटा माइनिंग की यह तकनीक कुछ समय में लेन-देन डेटा में समान पैटर्न को खोजने या पहचानने में मदद करती है।


7. Prediction:

भविष्यवाणी ने अन्य डेटा माइनिंग तकनीकों जैसे कि रुझान, क्लस्टरिंग, वर्गीकरण आदि के संयोजन का उपयोग किया। यह भविष्य की घटना की भविष्यवाणी करने के लिए पिछली घटनाओं या उदाहरणों का सही क्रम में विश्लेषण करता है।

What is data warehouse architecture in Hindi - Data warehouse notes

October 26, 2021 0
What is data warehouse architecture in Hindi - Data warehouse notes

data warehouse architecture in data mining

डेटा वेयरहाउस आर्किटेक्चर डेटा संचार प्रसंस्करण और प्रस्तुति के समग्र आर्किटेक्चर को परिभाषित करने का एक तरीका है जो उद्यम के भीतर एंड-क्लाइंट कंप्यूटिंग के लिए मौजूद है। प्रत्येक डेटा वेयरहाउस अलग है, लेकिन सभी को मानक महत्वपूर्ण घटकों की विशेषता है।


उत्पादन अनुप्रयोग जैसे पेरोल खाते देय उत्पाद खरीद और सूची नियंत्रण ऑनलाइन लेनदेन प्रसंस्करण (ओएलटीपी) के लिए डिज़ाइन किए गए हैं। इस तरह के एप्लिकेशन दिन-प्रतिदिन के कार्यों से विस्तृत डेटा एकत्र करते हैं।


Check also :- What is data warehouse in Hindi


डेटा वेयरहाउस अनुप्रयोगों को उपयोगकर्ता तदर्थ डेटा आवश्यकताओं का समर्थन करने के लिए डिज़ाइन किया गया है, एक गतिविधि जिसे हाल ही में ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) करार दिया गया है। इनमें पूर्वानुमान, रूपरेखा, सारांश रिपोर्टिंग और प्रवृत्ति विश्लेषण जैसे अनुप्रयोग शामिल हैं।


उत्पादन डेटाबेस को या तो हाथ से या OLTP अनुप्रयोगों के माध्यम से लगातार अद्यतन किया जाता है। इसके विपरीत, एक वेयरहाउस डेटाबेस को समय-समय पर परिचालन प्रणालियों से अद्यतन किया जाता है, आमतौर पर ऑफ-आवर्स के दौरान। चूंकि OLTP डेटा उत्पादन डेटाबेस में जमा होता है, इसे नियमित रूप से निकाला जाता है, फ़िल्टर किया जाता है, और फिर एक समर्पित वेयरहाउस सर्वर में लोड किया जाता है जो उपयोगकर्ताओं के लिए सुलभ होता है। जैसे ही वेयरहाउस आबाद होता है, इसे पुनर्गठित तालिकाओं को डी-सामान्यीकृत किया जाना चाहिए, डेटा को त्रुटियों और अतिरेक से मुक्त किया जाना चाहिए और डेटा को सॉर्ट करने, संयोजन करने और सारांशित करने के लिए उपयोगकर्ता की आवश्यकताओं को प्रतिबिंबित करने के लिए नए फ़ील्ड और कुंजियाँ जोड़ी जानी चाहिए।


डेटा वेयरहाउस और उनके आर्किटेक्चर किसी organization's की स्थिति के elements पर निर्भर करते हैं।


Types of data warehouse architecture in Hindi


तीन सामान्य आर्किटेक्चर हैं:


  • डेटा वेयरहाउस आर्किटेक्चर: बेसिक
  • डेटा वेयरहाउस आर्किटेक्चर: स्टेजिंग एरिया के साथ
  • डेटा वेयरहाउस आर्किटेक्चर: स्टेजिंग एरिया और डेटा मार्ट के साथ

Data Warehouse Architecture: Basic

data warehouse architecture in Hindi
data warehouse architecture in Hindi




  • Operational System


एक ऑपरेशनल सिस्टम एक सिस्टम को संदर्भित करने के लिए डेटा वेयरहाउसिंग में उपयोग की जाने वाली एक विधि है जिसका उपयोग किसी संगठन के दिन-प्रतिदिन के लेनदेन को संसाधित करने के लिए किया जाता है।


  • Flat Files


एक फ्लैट फाइल सिस्टम फाइलों की एक प्रणाली है जिसमें लेनदेन संबंधी डेटा संग्रहीत किया जाता है, और सिस्टम में प्रत्येक फाइल का एक अलग नाम होना चाहिए।


  • Meta Data


डेटा का एक सेट जो परिभाषित करता है और अन्य डेटा के बारे में जानकारी देता है।


विभिन्न उद्देश्यों के लिए डेटा वेयरहाउस में उपयोग किया जाने वाला मेटा डेटा, जिसमें शामिल हैं:


मेटा डेटा डेटा के बारे में आवश्यक जानकारी को सारांशित करता है, जो डेटा के विशेष उदाहरणों के साथ खोजने और काम करने को अधिक सुलभ बना सकता है। उदाहरण के लिए, लेखक, डेटा निर्माण, और डेटा परिवर्तित, और फ़ाइल का आकार बहुत ही बुनियादी दस्तावेज़ मेटाडेटा के उदाहरण हैं।


मेटाडेटा का उपयोग किसी क्वेरी को सबसे उपयुक्त डेटा स्रोत तक निर्देशित करने के लिए किया जाता है।


  • Lightly and highly summarized data


डेटा वेयरहाउस का क्षेत्र वेयरहाउस मैनेजर द्वारा उत्पन्न सभी पूर्वनिर्धारित हल्के और अत्यधिक सारांशित (एकत्रित) डेटा को बचाता है।


सारांशित जानकारी का लक्ष्य क्वेरी प्रदर्शन को गति देना है। जैसे ही नई जानकारी वेयरहाउस में लोड की जाती है, सारांशित रिकॉर्ड को लगातार अपडेट किया जाता है।


  • End-User access Tools


डेटा वेयरहाउस का मुख्य उद्देश्य व्यापार प्रबंधकों को रणनीतिक निर्णय लेने के लिए जानकारी प्रदान करना है। ये ग्राहक एंड-क्लाइंट एक्सेस टूल का उपयोग करके वेयरहाउस के साथ इंटरैक्ट करते हैं।


कुछ एंड-यूज़र एक्सेस टूल के उदाहरण हो सकते हैं:


  • रिपोर्टिंग और क्वेरी टूल
  • अनुप्रयोग विकास उपकरण
  • कार्यकारी सूचना प्रणाली उपकरण
  • ऑनलाइन विश्लेषणात्मक प्रसंस्करण उपकरण
  • डाटा माइनिंग टूल्स


Data Warehouse Architecture: With Staging Area

वेयरहाउस में डालने से पहले हमें आपकी परिचालन जानकारी को साफ और संसाधित करना चाहिए।


W

ई इसे प्रोग्रामेटिक रूप से कर सकता है, हालांकि डेटा वेयरहाउस एक  staging area का उपयोग करता है (एक ऐसा स्थान जहां डेटा को वेयरहाउस में प्रवेश करने से पहले संसाधित किया जाता है)।


एक  staging area कई स्रोत प्रणालियों से आने वाली परिचालन पद्धति के लिए डेटा सफाई और समेकन को सरल बनाता है, विशेष रूप से एंटरप्राइज़ डेटा वेयरहाउस के लिए जहां एक उद्यम के सभी प्रासंगिक डेटा समेकित होते हैं।


data warehouse architecture in data mining
data warehouse architecture in data mining



Data Warehouse Staging Area एक अस्थायी स्थान है जहां स्रोत सिस्टम से रिकॉर्ड की प्रतिलिपि बनाई जाती है।


Data Warehouse Architecture in Hindi: With Staging Area and Data Marts

हम अपने संगठन के भीतर कई समूहों के लिए अपने गोदाम की वास्तुकला को अनुकूलित करना चाह सकते हैं।


हम डेटा मार्ट जोड़कर ऐसा कर सकते हैं। डेटा मार्ट एक डेटा वेयरहाउस का एक खंड है जो कंपनी में एक अनुभाग, इकाई, विभाग या संचालन पर रिपोर्टिंग और विश्लेषण के लिए जानकारी प्रदान कर सकता है, जैसे, बिक्री, पेरोल, उत्पादन, आदि।


यह आंकड़ा एक उदाहरण दिखाता है जहां खरीद, बिक्री और स्टॉक अलग हो जाते हैं। इस उदाहरण में, एक वित्तीय विश्लेषक ग्राहक व्यवहार के बारे में भविष्यवाणियां करने के लिए खरीद और बिक्री या मेरी ऐतिहासिक जानकारी के लिए ऐतिहासिक डेटा का विश्लेषण करना चाहता है।


data warehouse architecture pdf
data warehouse architecture pdf



Properties of Data Warehouse Architectures in Hindi

डेटा वेयरहाउस सिस्टम के लिए निम्नलिखित आर्किटेक्चर गुण आवश्यक हैं:


1.  Separation : विश्लेषणात्मक और लेन-देन संबंधी प्रसंस्करण को यथासंभव अलग रखा जाना चाहिए।


2. Scalability:  हार्डवेयर और सॉफ्टवेयर आर्किटेक्चर डेटा वॉल्यूम को अपग्रेड करने के लिए सरल होना चाहिए, जिसे प्रबंधित और संसाधित किया जाना है, और उपयोगकर्ता की आवश्यकताओं की संख्या, जिन्हें पूरा किया जाना है, उत्तरोत्तर वृद्धि होती है।


3.Extensibility: आर्किटेक्चर पूरे सिस्टम को फिर से डिजाइन किए बिना नए संचालन और प्रौद्योगिकियों को करने में सक्षम होना चाहिए।


4. Security: डेटा वेयरहाउस में संग्रहीत रणनीतिक डेटा के कारण निगरानी पहुंच आवश्यक है।


5. Administerability: डेटा वेयरहाउस प्रबंधन जटिल नहीं होना चाहिए।


डेटा वेयरहाउस आर्किटेक्चर के प्रकार


Types of Data Warehouse Architectures in Hindi


  • Single-Tier data warehouse architecture in data mining

एकल-स्तरीय वास्तुकला का समय-समय पर अभ्यास में उपयोग नहीं किया जाता है। इसका उद्देश्य इस लक्ष्य तक पहुंचने के लिए संग्रहीत डेटा की मात्रा को कम करना है; यह डेटा अतिरेक को हटा देता है।


यह आंकड़ा दिखाता है कि भौतिक रूप से उपलब्ध एकमात्र परत स्रोत परत है। इस पद्धति में, डेटा वेयरहाउस वर्चुअल होते हैं। इसका मतलब है कि डेटा वेयरहाउस विशिष्ट मिडलवेयर, या एक मध्यवर्ती प्रसंस्करण परत द्वारा बनाए गए परिचालन डेटा के बहुआयामी दृश्य के रूप में कार्यान्वित किया जाता है।


इस वास्तुकला की भेद्यता विश्लेषणात्मक और लेन-देन प्रसंस्करण के बीच अलगाव की आवश्यकता को पूरा करने में इसकी विफलता में निहित है। मिडलवेयर द्वारा व्याख्या किए जाने के बाद विश्लेषण प्रश्नों को परिचालन डेटा के लिए सहमति दी जाती है। इस तरह, प्रश्न लेनदेन संबंधी कार्यभार को प्रभावित करते हैं।


  • Two-Tier data warehouse architecture in Hindi

डेटा वेयरहाउस सिस्टम के लिए दो-स्तरीय आर्किटेक्चर को परिभाषित करने में पृथक्करण की आवश्यकता एक आवश्यक भूमिका निभाती है, जैसा कि अंजीर में दिखाया गया है:


यद्यपि भौतिक रूप से उपलब्ध स्रोतों और डेटा वेयरहाउस के बीच अलगाव को उजागर करने के लिए इसे आम तौर पर दो-परत वास्तुकला कहा जाता है, वास्तव में, इसमें चार बाद के डेटा प्रवाह चरण होते हैं:


Source layer:  डेटा वेयरहाउस सिस्टम डेटा के विषम स्रोत का उपयोग करता है। वह डेटा शुरू में कॉर्पोरेट रिलेशनल डेटाबेस या लीगेसी डेटाबेस में संग्रहीत किया जाता है, या यह कॉर्पोरेट दीवारों के बाहर एक सूचना प्रणाली से आ सकता है।


Data Staging:  स्रोत में संग्रहीत डेटा को निकाला जाना चाहिए, विसंगतियों को दूर करने और अंतराल को भरने के लिए साफ किया जाना चाहिए, और विषम स्रोतों को एक मानक स्कीमा में मर्ज करने के लिए एकीकृत किया जाना चाहिए। तथाकथित एक्सट्रैक्शन, ट्रांसफॉर्मेशन, और लोडिंग टूल्स (ईटीएल) विषम स्कीमाटा, एक्सट्रैक्ट, ट्रांसफॉर्म, क्लीन, वैलिडेट, फिल्टर और लोड सोर्स डेटा को डेटा वेयरहाउस में जोड़ सकते हैं।


Data Warehouse layer:  सूचना एक तार्किक रूप से केंद्रीकृत व्यक्तिगत भंडार में सहेजी जाती है: एक डेटा वेयरहाउस। डेटा वेयरहाउस को सीधे एक्सेस किया जा सकता है, लेकिन इसका उपयोग डेटा मार्ट बनाने के लिए एक स्रोत के रूप में भी किया जा सकता है, जो डेटा वेयरहाउस सामग्री को आंशिक रूप से दोहराता है और विशिष्ट उद्यम विभागों के लिए डिज़ाइन किया गया है। मेटा-डेटा रिपॉजिटरी स्रोतों, एक्सेस प्रक्रियाओं, डेटा स्टेजिंग, उपयोगकर्ताओं, डेटा मार्ट स्कीमा आदि पर जानकारी संग्रहीत करती है।


Analysis: इस परत में, एकीकृत डेटा कुशलता से है, और रिपोर्ट जारी करने, गतिशील रूप से जानकारी का विश्लेषण करने और काल्पनिक व्यावसायिक परिदृश्यों का अनुकरण करने के लिए लचीला उपयोग किया जाता है। इसमें समग्र सूचना नेविगेटर, जटिल क्वेरी ऑप्टिमाइज़र और ग्राहक-अनुकूल GUI की सुविधा होनी चाहिए।


  • Three-Tier data warehouse architecture in Hindi

थ्री-टियर आर्किटेक्चर में सोर्स लेयर (मल्टीपल सोर्स सिस्टम युक्त), समेटी हुई लेयर और डेटा वेयरहाउस लेयर (डेटा वेयरहाउस और डेटा मार्ट दोनों शामिल हैं) शामिल हैं। समेटा हुआ परत स्रोत डेटा और डेटा वेयरहाउस के बीच बैठता है।


समाधान परत का मुख्य लाभ यह है कि यह पूरे उद्यम के लिए एक मानक संदर्भ डेटा मॉडल बनाता है। साथ ही, यह डेटा वेयरहाउस आबादी से स्रोत डेटा निष्कर्षण और एकीकरण की समस्याओं को अलग करता है। कुछ मामलों में, समेटी हुई परत का उपयोग कुछ परिचालन कार्यों को बेहतर ढंग से पूरा करने के लिए भी किया जाता है, जैसे कि दैनिक रिपोर्ट तैयार करना जो कॉर्पोरेट अनुप्रयोगों का उपयोग करके संतोषजनक रूप से तैयार नहीं किया जा सकता है या सफाई और एकीकरण से लाभ के लिए समय-समय पर बाहरी प्रक्रियाओं को खिलाने के लिए डेटा प्रवाह उत्पन्न करना।


Three-Tier data warehouse architecture in Hindi
Three-Tier data warehouse architecture in Hindi



यह वास्तुकला व्यापक, उद्यम-व्यापी प्रणालियों के लिए विशेष रूप से उपयोगी है। इस संरचना का एक नुकसान अतिरिक्त फ़ाइल संग्रहण स्थान है जिसका उपयोग अतिरिक्त अनावश्यक समाधान परत के माध्यम से किया जाता है। यह विश्लेषणात्मक उपकरणों को रीयल-टाइम होने से थोड़ा और दूर भी बनाता है।

Sunday, October 24, 2021

What is data warehouse in Hindi - Data warehousing notes

October 24, 2021 0
What is data warehouse in Hindi - Data warehousing notes

 डेटा वेयरहाउस एक relational database management system (RDBMS) है जो ट्रांजेक्शन प्रोसेसिंग सिस्टम की आवश्यकता को पूरा करने के लिए बनाया गया है। इसे किसी भी केंद्रीकृत डेटा भंडार के रूप में वर्णित किया जा सकता है जिसे व्यावसायिक लाभों के लिए पूछताछ की जा सकती है। यह एक डेटाबेस है जो निर्णय लेने के अनुरोधों को पूरा करने के लिए उन्मुख जानकारी संग्रहीत करता है। 


यह निर्णय समर्थन प्रौद्योगिकियों का एक समूह है, जिसका लक्ष्य ज्ञान कार्यकर्ता (कार्यकारी, प्रबंधक और विश्लेषक) को बेहतर और उच्च निर्णय लेने में सक्षम बनाना है। इसलिए, डेटा वेयरहाउसिंग व्यावसायिक अधिकारियों के लिए रणनीतिक निर्णय लेने के लिए उनकी जानकारी को व्यवस्थित रूप से व्यवस्थित करने, समझने और उपयोग करने के लिए आर्किटेक्चर और टूल का समर्थन करता है।


डेटा वेयरहाउस वातावरण में एक निष्कर्षण, परिवहन और लोडिंग (ETL) समाधान, एक ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) इंजन, ग्राहक विश्लेषण उपकरण और अन्य अनुप्रयोग शामिल हैं जो जानकारी एकत्र करने और इसे व्यावसायिक उपयोगकर्ताओं तक पहुंचाने की प्रक्रिया को संभालते हैं।


data warehouse in Hindi

डेटा वेयरहाउस (DW) एक रिलेशनल डेटाबेस है जिसे लेनदेन प्रसंस्करण के बजाय क्वेरी और विश्लेषण के लिए डिज़ाइन किया गया है। इसमें एकल और एकाधिक स्रोतों से लेन-देन डेटा से प्राप्त ऐतिहासिक डेटा शामिल है।


डेटा वेयरहाउस एकीकृत, उद्यम-व्यापी, ऐतिहासिक डेटा प्रदान करता है और डेटा मॉडलिंग और विश्लेषण के लिए निर्णय लेने वालों के लिए सहायता प्रदान करने पर केंद्रित है।


डेटा वेयरहाउस डेटा का एक समूह है जो पूरे संगठन के लिए विशिष्ट है, न कि केवल उपयोगकर्ताओं के एक विशेष समूह के लिए।


इसका उपयोग दैनिक संचालन और लेनदेन प्रसंस्करण के लिए नहीं बल्कि निर्णय लेने के लिए किया जाता है।


डेटा वेयरहाउस को निम्नलिखित विशेषताओं के साथ डेटा सिस्टम के रूप में देखा जा सकता है:


  • यह एक डेटाबेस है जिसे विभिन्न applications के डेटा का उपयोग करके खोजी कार्यों के लिए डिज़ाइन किया गया है।
  • यह अपेक्षाकृत लंबी बातचीत के साथ अपेक्षाकृत कम संख्या में ग्राहकों का समर्थन करता है।
  • इसमें सूचना का ऐतिहासिक परिप्रेक्ष्य प्रदान करने के लिए वर्तमान और ऐतिहासिक डेटा शामिल हैं।
  • इसका उपयोग पठनीय है।
  • इसमें कुछ बड़े टेबल हैं।

"डेटा वेयरहाउस प्रबंधन के निर्णयों के समर्थन में सूचना का एक विषय-उन्मुख, एकीकृत और समय-भिन्न संग्रह है।"


Characteristics of Data Warehouse in Hindi


Subject-Oriented

निर्णय लेने वालों के लिए डेटा के मॉडलिंग और विश्लेषण (analysis) पर एक डेटा वेयरहाउस लक्ष्य। इसलिए, डेटा वेयरहाउस आमतौर पर वैश्विक संगठन ( global organization's )के चल रहे संचालन के बजाय किसी विशेष विषय, जैसे ग्राहक, उत्पाद या बिक्री के बारे में एक संक्षिप्त और सीधा दृश्य प्रदान करते हैं। यह उन डेटा को छोड़कर किया जाता है जो विषय से संबंधित उपयोगी नहीं हैं और इसमें विषय को समझने के लिए उपयोगकर्ताओं द्वारा आवश्यक सभी डेटा शामिल हैं।


Integrated

एक डेटा वेयरहाउस विभिन्न विषम डेटा स्रोतों जैसे आरडीबीएमएस, फ्लैट फाइलों और ऑनलाइन लेनदेन रिकॉर्ड को एकीकृत करता है। विभिन्न डेटा स्रोतों के बीच नामकरण सम्मेलनों, विशेषताओं के प्रकारों आदि में स्थिरता सुनिश्चित करने के लिए डेटा वेयरहाउसिंग के दौरान डेटा की सफाई और एकीकरण करने की आवश्यकता होती है।


Time-Variant

ऐतिहासिक जानकारी को डेटा वेयरहाउस में रखा जाता है। उदाहरण के लिए, कोई डेटा वेयरहाउस से 3 महीने, 6 महीने, 12 महीने या यहां तक ​​कि पिछले डेटा की फ़ाइलों को पुनः प्राप्त कर सकता है। लेन-देन प्रणाली के साथ ये बदलाव, जहां अक्सर केवल सबसे वर्तमान फ़ाइल रखी जाती है।


Non-Volatile

डेटा वेयरहाउस एक भौतिक रूप से अलग डेटा संग्रहण है, जो स्रोत परिचालन RDBMS से रूपांतरित होता है। डेटा का परिचालन अद्यतन डेटा वेयरहाउस में नहीं होता है, अर्थात, अद्यतन, सम्मिलित और हटाने का कार्य नहीं किया जाता है। डेटा एक्सेस करने में आमतौर पर केवल दो प्रक्रियाओं की आवश्यकता होती है: डेटा की प्रारंभिक लोडिंग और डेटा तक पहुंच। इसलिए, डीडब्ल्यू को लेनदेन प्रसंस्करण, पुनर्प्राप्ति और समवर्ती क्षमताओं की आवश्यकता नहीं होती है, जो डेटा पुनर्प्राप्ति की पर्याप्त गति के लिए अनुमति देता है। गैर-वाष्पशील परिभाषित करता है कि एक बार गोदाम में प्रवेश करने के बाद, और डेटा नहीं बदलना चाहिए।


data warehouse in Hindi
 data warehouse in Hindi 



History of Data Warehouse in Hindi

डेटा वेयरहाउसिंग का विचार 1980 के दशक के अंत में आया जब आईबीएम के शोधकर्ता बैरी डेवलिन और पॉल मर्फी ने "बिजनेस डेटा वेयरहाउस" की स्थापना की।


संक्षेप में, डेटा वेयरहाउसिंग विचार की योजना परिचालन प्रणाली से निर्णयात्मक समर्थन वातावरण तक सूचना के प्रवाह के लिए एक वास्तुशिल्प मॉडल का समर्थन करने के लिए की गई थी। अवधारणा प्रवाह से जुड़ी विभिन्न समस्याओं को संबोधित करने का प्रयास करती है, मुख्य रूप से इससे जुड़ी उच्च लागत।


डेटा वेयरहाउसिंग आर्किटेक्चर की अनुपस्थिति में, कई निर्णय समर्थन वातावरणों का समर्थन करने के लिए बड़ी मात्रा में स्थान की आवश्यकता होती है। बड़े निगमों में, विभिन्न निर्णय समर्थन वातावरणों का स्वतंत्र रूप से संचालन करना सामान्य था।


Goals of Data Warehousing in Hindi

रिपोर्टिंग और विश्लेषण में मदद करने के लिए

संगठन की ऐतिहासिक जानकारी को बनाए रखें

निर्णय लेने की नींव बनें।

Need for Data Warehouse in Hindi

निम्नलिखित कारणों से डेटा वेयरहाउस की आवश्यकता है:


1) व्यावसायिक उपयोगकर्ता: व्यावसायिक उपयोगकर्ताओं को अतीत से सारांशित डेटा देखने के लिए डेटा वेयरहाउस की आवश्यकता होती है। चूंकि ये लोग गैर-तकनीकी हैं, इसलिए उन्हें प्राथमिक रूप में डेटा प्रस्तुत किया जा सकता है।


2) ऐतिहासिक डेटा स्टोर करें: डेटा वेयरहाउस को अतीत से समय परिवर्तनीय डेटा स्टोर करने की आवश्यकता होती है। इस इनपुट का उपयोग विभिन्न उद्देश्यों के लिए किया जाता है।


3) रणनीतिक निर्णय लें: कुछ रणनीतियाँ डेटा वेयरहाउस में डेटा के आधार पर हो सकती हैं। इसलिए, डेटा वेयरहाउस रणनीतिक निर्णय लेने में योगदान देता है।


4) डेटा स्थिरता और गुणवत्ता के लिए: विभिन्न स्रोतों से डेटा को एक सामान्य स्थान पर लाना, उपयोगकर्ता डेटा में एकरूपता और स्थिरता लाने के लिए प्रभावी ढंग से कार्य कर सकता है।


5) उच्च प्रतिक्रिया समय: डेटा वेयरहाउस को कुछ अप्रत्याशित भार और प्रश्नों के प्रकार के लिए तैयार रहना पड़ता है, जो लचीलेपन और त्वरित प्रतिक्रिया समय की एक महत्वपूर्ण डिग्री की मांग करता है।


Benefits of Data Warehouse in Hindi

व्यावसायिक रुझानों को समझें और बेहतर पूर्वानुमान निर्णय लें।

  • डेटा वेयरहाउस को डेटा की भारी मात्रा में अच्छा प्रदर्शन करने के लिए डिज़ाइन किया गया है।
  • अंतिम उपयोगकर्ताओं के लिए नेविगेट करने, समझने और क्वेरी करने के लिए डेटा वेयरहाउस की संरचना अधिक सुलभ है।
  • कई सामान्यीकृत डेटाबेस में जटिल प्रश्न डेटा वेयरहाउस में निर्माण और रखरखाव करना आसान हो सकता है।
  • डेटा वेयरहाउसिंग बहुत सारे उपयोगकर्ताओं से बहुत सारी जानकारी की मांग को प्रबंधित करने का एक कुशल तरीका है।
  • डेटा वेयरहाउसिंग ऐतिहासिक डेटा की एक बड़ी मात्रा का विश्लेषण करने की क्षमता प्रदान करता है।

आवश्यक शर्तें [Prerequisites]

डेटा वेयरहाउस के बारे में सीखने से पहले, आपको बुनियादी डेटाबेस अवधारणाओं जैसे कि स्कीमा, ईआर मॉडल, संरचित क्वेरी भाषा आदि का मूलभूत ज्ञान होना चाहिए।


दर्शक [Audience]

यह ट्यूटोरियल कंप्यूटर विज्ञान के छात्रों को डेटा वेयरहाउसिंग से जुड़ी बुनियादी-से-उन्नत अवधारणाओं को समझने में मदद करेगा।


समस्या [Problems]

हम विश्वास दिलाते हैं कि आपको इस डेटा वेयरहाउस ट्यूटोरियल में कोई समस्या नहीं मिलेगी। लेकिन अगर कोई गलती है, तो कृपया संपर्क फ़ॉर्म में समस्या पोस्ट करें।