Computer in Hindi | Business in Hindi: data warehousing notes
Showing posts with label data warehousing notes. Show all posts
Showing posts with label data warehousing notes. Show all posts

Monday, October 25, 2021

What is Data Mining in Hindi - data warehousing and data mining notes

October 25, 2021 0
What is Data Mining in Hindi - data warehousing and data mining notes

data mining tutorialडेटा माइनिंग की basic और advanced अवधारणाएँ प्रदान करता है। हमारा डेटा माइनिंग ट्यूटोरियल शिक्षार्थियों और विशेषज्ञों के लिए बनाया गया है।


डेटा माइनिंग सबसे उपयोगी तकनीकों में से एक है जो उद्यमियों, शोधकर्ताओं और व्यक्तियों को डेटा के विशाल सेट से मूल्यवान जानकारी निकालने में मदद करती है। डेटा माइनिंग को Knowledge Discovery in Database (KDD) भी कहा जाता है। ज्ञान की खोज प्रक्रिया में डेटा सफाई, डेटा एकीकरण, डेटा चयन, डेटा परिवर्तन, डेटा खनन, पैटर्न मूल्यांकन और ज्ञान प्रस्तुति शामिल है।


हमारे डेटा माइनिंग ट्यूटोरियल में डेटा माइनिंग के सभी विषय शामिल हैं जैसे कि एप्लिकेशन, डेटा माइनिंग बनाम मशीन लर्निंग, डेटा माइनिंग टूल, सोशल मीडिया डेटा माइनिंग, डेटा माइनिंग तकनीक, डेटा माइनिंग में क्लस्टरिंग, डेटा माइनिंग में चुनौतियाँ आदि।


What is Data Mining in Hindi | Data Mining Tutorial

पैटर्न, प्रवृत्तियों और उपयोगी डेटा की पहचान करने के लिए जानकारी निकालने की प्रक्रिया जो व्यवसाय को डेटा के विशाल सेट से डेटा-संचालित निर्णय लेने की अनुमति देती है, डेटा माइनिंग कहलाती है।


दूसरे शब्दों में, हम कह सकते हैं कि डेटा माइनिंग उपयोगी डेटा में वर्गीकरण के लिए विभिन्न दृष्टिकोणों के लिए सूचना के छिपे हुए पैटर्न की जांच करने की प्रक्रिया है, जिसे डेटा वेयरहाउस, कुशल विश्लेषण, डेटा माइनिंग एल्गोरिदम, निर्णय में मदद करने जैसे विशेष क्षेत्रों में एकत्र और इकट्ठा किया जाता है। अंततः लागत में कटौती और राजस्व उत्पन्न करने के लिए बनाने और अन्य डेटा आवश्यकता।


डेटा माइनिंग सरल विश्लेषण प्रक्रियाओं से परे जाने वाले रुझानों और पैटर्न को खोजने के लिए सूचनाओं के बड़े भंडार की स्वचालित रूप से खोज करने का कार्य है। डेटा माइनिंग डेटा सेगमेंट के लिए जटिल गणितीय एल्गोरिदम का उपयोग करता है और भविष्य की घटनाओं की संभावना का मूल्यांकन करता है। डेटा माइनिंग को डेटा की नॉलेज डिस्कवरी (KDD) भी कहा जाता है।


डेटा माइनिंग एक ऐसी प्रक्रिया है जिसका उपयोग संगठनों द्वारा व्यावसायिक समस्याओं को हल करने के लिए विशाल डेटाबेस से विशिष्ट डेटा निकालने के लिए किया जाता है। यह मुख्य रूप से कच्चे डेटा को उपयोगी जानकारी में बदल देता है।


डेटा माइनिंग एक व्यक्ति द्वारा एक विशिष्ट स्थिति में, एक विशेष डेटा सेट पर, एक उद्देश्य के साथ किए गए डेटा साइंस के समान है। इस प्रक्रिया में टेक्स्ट माइनिंग, वेब माइनिंग, ऑडियो और वीडियो माइनिंग, सचित्र डेटा माइनिंग और सोशल मीडिया माइनिंग जैसी विभिन्न प्रकार की सेवाएँ शामिल हैं। यह सॉफ्टवेयर के माध्यम से किया जाता है जो सरल या अत्यधिक विशिष्ट होता है। डेटा माइनिंग को आउटसोर्स करके, कम परिचालन लागत के साथ सभी काम तेजी से किए जा सकते हैं। विशिष्ट फर्म डेटा एकत्र करने के लिए नई तकनीकों का भी उपयोग कर सकती हैं जिन्हें मैन्युअल रूप से ढूंढना असंभव है। विभिन्न प्लेटफार्मों पर ढेर सारी जानकारी उपलब्ध है, लेकिन बहुत कम जानकारी उपलब्ध है। सबसे बड़ी चुनौती महत्वपूर्ण जानकारी निकालने के लिए डेटा का विश्लेषण करना है जिसका उपयोग किसी समस्या को हल करने या कंपनी के विकास के लिए किया जा सकता है। माइन डेटा के लिए कई शक्तिशाली उपकरण और तकनीक उपलब्ध हैं और इससे बेहतर अंतर्दृष्टि प्राप्त होती है।


Types of data mining in Hindi

डेटा माइनिंग निम्न प्रकार के डेटा पर किया जा सकता है:


Relational Database:


एक रिलेशनल डेटाबेस टेबल, रिकॉर्ड और कॉलम द्वारा औपचारिक रूप से व्यवस्थित कई डेटा सेट का एक संग्रह है, जिससे डेटाबेस टेबल को पहचानने के बिना डेटा को विभिन्न तरीकों से एक्सेस किया जा सकता है। टेबल्स जानकारी को व्यक्त और साझा करते हैं, जो डेटा खोज योग्यता, रिपोर्टिंग और संगठन की सुविधा प्रदान करती है।


Data warehouses:


डेटा वेयरहाउस वह तकनीक है जो सार्थक व्यावसायिक अंतर्दृष्टि प्रदान करने के लिए संगठन के भीतर विभिन्न स्रोतों से डेटा एकत्र करती है। बड़ी मात्रा में डेटा मार्केटिंग और वित्त जैसे कई स्थानों से आता है। निकाले गए डेटा का उपयोग विश्लेषणात्मक उद्देश्यों के लिए किया जाता है और एक व्यावसायिक संगठन के लिए निर्णय लेने में मदद करता है। डेटा वेयरहाउस को लेनदेन प्रसंस्करण के बजाय डेटा के विश्लेषण के लिए डिज़ाइन किया गया है।


Data Repositories:


डेटा रिपोजिटरी आमतौर पर डेटा स्टोरेज के लिए एक गंतव्य को संदर्भित करता है। हालांकि, कई आईटी पेशेवर आईटी संरचना के भीतर एक विशिष्ट प्रकार के सेटअप को संदर्भित करने के लिए इस शब्द का अधिक स्पष्ट रूप से उपयोग करते हैं। उदाहरण के लिए, डेटाबेस का एक समूह, जहां एक संगठन ने विभिन्न प्रकार की जानकारी रखी है।


Object-Relational Database:


ऑब्जेक्ट-ओरिएंटेड डेटाबेस मॉडल और रिलेशनल डेटाबेस मॉडल के संयोजन को ऑब्जेक्ट-रिलेशनल मॉडल कहा जाता है। यह कक्षाओं, वस्तुओं, विरासत आदि का समर्थन करता है।


ऑब्जेक्ट-रिलेशनल डेटा मॉडल के प्राथमिक उद्देश्यों में से एक रिलेशनल डेटाबेस और ऑब्जेक्ट-ओरिएंटेड मॉडल प्रथाओं के बीच की खाई को बंद करना है जो अक्सर कई प्रोग्रामिंग भाषाओं में उपयोग किया जाता है, उदाहरण के लिए, सी ++, जावा, सी #, और इसी तरह। .


Transactional Database:


एक लेन-देन संबंधी डेटाबेस एक डेटाबेस प्रबंधन प्रणाली (DBMS) को संदर्भित करता है जिसमें डेटाबेस लेनदेन को पूर्ववत करने की क्षमता होती है यदि यह उचित रूप से नहीं किया जाता है। भले ही यह बहुत समय पहले एक अनूठी क्षमता थी, आज, अधिकांश रिलेशनल डेटाबेस सिस्टम ट्रांजेक्शनल डेटाबेस गतिविधियों का समर्थन करते हैं।


Advantages of Data Mining in Hindi

  • डेटा माइनिंग तकनीक संगठनों को ज्ञान-आधारित डेटा प्राप्त करने में सक्षम बनाती है।

  • डेटा माइनिंग संगठनों को संचालन और उत्पादन में आकर्षक संशोधन करने में सक्षम बनाता है।

  • अन्य सांख्यिकीय डेटा अनुप्रयोगों की तुलना में, डेटा माइनिंग एक लागत-कुशल है।

  • डेटा माइनिंग किसी संगठन की निर्णय लेने की प्रक्रिया में मदद करता है।

  • यह छिपे हुए पैटर्न की स्वचालित खोज के साथ-साथ प्रवृत्तियों और व्यवहारों की भविष्यवाणी की सुविधा प्रदान करता है।

  • इसे नई प्रणाली के साथ-साथ मौजूदा प्लेटफार्मों में भी प्रेरित किया जा सकता है।

  • यह एक त्वरित प्रक्रिया है जो नए उपयोगकर्ताओं के लिए कम समय में भारी मात्रा में डेटा का विश्लेषण करना आसान बनाती है।


Disadvantages of Data Mining in Hindi

  • एक संभावना है कि संगठन ग्राहकों के उपयोगी डेटा को पैसे के लिए अन्य संगठनों को बेच सकते हैं। रिपोर्ट के मुताबिक, अमेरिकन एक्सप्रेस ने अपने ग्राहकों के क्रेडिट कार्ड से खरीदारी को अन्य संगठनों को बेच दिया है।

  • कई डेटा माइनिंग एनालिटिक्स सॉफ़्टवेयर को संचालित करना मुश्किल है और इस पर काम करने के लिए अग्रिम प्रशिक्षण की आवश्यकता होती है।

  • अलग-अलग डेटा माइनिंग इंस्ट्रूमेंट अपने डिजाइन में इस्तेमाल किए गए अलग-अलग एल्गोरिदम के कारण अलग-अलग तरीकों से काम करते हैं। इसलिए, सही डेटा माइनिंग टूल का चयन एक बहुत ही चुनौतीपूर्ण कार्य है।

  • डेटा माइनिंग तकनीक सटीक नहीं है, जिससे कुछ स्थितियों में इसके गंभीर परिणाम हो सकते हैं।

Applications of Data Mining in Hindi

डेटा माइनिंग का उपयोग मुख्य रूप से गहन उपभोक्ता मांगों वाले संगठनों द्वारा किया जाता है- खुदरा, संचार, वित्तीय, विपणन कंपनी, मूल्य, उपभोक्ता प्राथमिकताएं, उत्पाद की स्थिति, और बिक्री, ग्राहकों की संतुष्टि और कॉर्पोरेट लाभ पर प्रभाव का निर्धारण। डेटा माइनिंग एक रिटेलर को उत्पाद और प्रचार विकसित करने के लिए ग्राहक खरीद के पॉइंट-ऑफ-सेल रिकॉर्ड का उपयोग करने में सक्षम बनाता है जो संगठन को ग्राहक को आकर्षित करने में मदद करता है।


Data Mining in Hindi
Data Mining in Hindi



ये निम्नलिखित क्षेत्र हैं जहाँ डेटा माइनिंग का व्यापक रूप से उपयोग किया जाता है:


data mining applications in healthcare


स्वास्थ्य सेवा में डेटा माइनिंग में स्वास्थ्य प्रणाली में सुधार की उत्कृष्ट क्षमता है। यह बेहतर अंतर्दृष्टि के लिए डेटा और एनालिटिक्स का उपयोग करता है और सर्वोत्तम प्रथाओं की पहचान करता है जो स्वास्थ्य देखभाल सेवाओं को बढ़ाएंगे और लागत को कम करेंगे। विश्लेषक डेटा माइनिंग दृष्टिकोण जैसे मशीन लर्निंग, बहु-आयामी डेटाबेस, डेटा विज़ुअलाइज़ेशन, सॉफ्ट कंप्यूटिंग और सांख्यिकी का उपयोग करते हैं। डेटा माइनिंग का उपयोग प्रत्येक श्रेणी में रोगियों की भविष्यवाणी करने के लिए किया जा सकता है। प्रक्रियाएं सुनिश्चित करती हैं कि मरीजों को सही जगह और सही समय पर गहन देखभाल मिले। डेटा माइनिंग स्वास्थ्य बीमा कंपनियों को धोखाधड़ी और दुरुपयोग को पहचानने में भी सक्षम बनाता है।


Data Mining in Market Basket Analysis:


बाजार टोकरी विश्लेषण एक परिकल्पना पर आधारित एक मॉडलिंग पद्धति है। यदि आप उत्पादों का एक विशिष्ट समूह खरीदते हैं, तो आप उत्पादों के दूसरे समूह को खरीदने की अधिक संभावना रखते हैं। यह तकनीक खुदरा विक्रेता को खरीदार के खरीद व्यवहार को समझने में सक्षम बनाती है। यह डेटा खुदरा विक्रेता को खरीदार की आवश्यकताओं को समझने और उसके अनुसार स्टोर के लेआउट को बदलने में सहायता कर सकता है। विभिन्न जनसांख्यिकीय समूहों में ग्राहकों के बीच विभिन्न स्टोरों के बीच परिणामों की एक अलग विश्लेषणात्मक तुलना का उपयोग करके किया जा सकता है।


Data mining in Education:


शिक्षा डेटा माइनिंग एक नया उभरता हुआ क्षेत्र है, जो विकासशील तकनीकों से संबंधित है जो शैक्षिक वातावरण से उत्पन्न डेटा से ज्ञान का पता लगाते हैं। ईडीएम उद्देश्यों को छात्र के भविष्य के सीखने के व्यवहार की पुष्टि करने, शैक्षिक समर्थन के प्रभाव का अध्ययन करने और विज्ञान सीखने को बढ़ावा देने के रूप में मान्यता प्राप्त है। एक संगठन सटीक निर्णय लेने और छात्र के परिणामों की भविष्यवाणी करने के लिए डेटा माइनिंग का उपयोग कर सकता है। परिणामों के साथ, संस्थान इस बात पर ध्यान केंद्रित कर सकता है कि क्या पढ़ाया जाए और कैसे पढ़ाया जाए।


Data Mining in Manufacturing Engineering:


ज्ञान एक निर्माण कंपनी के पास सबसे अच्छी संपत्ति है। एक जटिल निर्माण प्रक्रिया में पैटर्न खोजने के लिए डेटा माइनिंग टूल फायदेमंद हो सकते हैं। डेटा माइनिंग का उपयोग सिस्टम-स्तरीय डिजाइनिंग में उत्पाद वास्तुकला, उत्पाद पोर्टफोलियो और ग्राहकों की डेटा आवश्यकताओं के बीच संबंध प्राप्त करने के लिए किया जा सकता है। इसका उपयोग अन्य कार्यों के बीच उत्पाद विकास अवधि, लागत और अपेक्षाओं का पूर्वानुमान लगाने के लिए भी किया जा सकता है।


Data Mining in CRM (Customer Relationship Management):


ग्राहक संबंध प्रबंधन (सीआरएम) ग्राहकों को प्राप्त करने और धारण करने, ग्राहक वफादारी बढ़ाने और ग्राहक-उन्मुख रणनीतियों को लागू करने के बारे में है। ग्राहक के साथ अच्छे संबंध बनाने के लिए, एक व्यावसायिक संगठन को डेटा एकत्र करने और डेटा का विश्लेषण करने की आवश्यकता होती है। डेटा माइनिंग तकनीकों के साथ, एकत्रित डेटा का उपयोग विश्लेषण के लिए किया जा सकता है।


Data Mining in Fraud detection:


धोखाधड़ी की कार्रवाई में अरबों डॉलर का नुकसान होता है। धोखाधड़ी का पता लगाने के पारंपरिक तरीके थोड़े समय लेने वाले और परिष्कृत हैं। डेटा माइनिंग सार्थक पैटर्न प्रदान करता है और डेटा को सूचना में बदल देता है। एक आदर्श धोखाधड़ी का पता लगाने वाली प्रणाली को सभी उपयोगकर्ताओं के डेटा की रक्षा करनी चाहिए। पर्यवेक्षित विधियों में नमूना अभिलेखों का संग्रह होता है, और इन अभिलेखों को धोखाधड़ी या गैर-धोखाधड़ी के रूप में वर्गीकृत किया जाता है। इस डेटा का उपयोग करके एक मॉडल का निर्माण किया जाता है, और यह पहचानने के लिए तकनीक बनाई जाती है कि दस्तावेज़ धोखाधड़ी है या नहीं।


Data Mining in Lie Detection:


अपराधी को पकड़ना कोई बड़ी बात नहीं है, लेकिन उससे सच्चाई को सामने लाना बहुत ही चुनौतीपूर्ण कार्य है। कानून प्रवर्तन डेटा खनन तकनीकों का उपयोग अपराधों की जांच करने, संदिग्ध आतंकवादी संचार की निगरानी आदि के लिए कर सकता है। इस तकनीक में टेक्स्ट माइनिंग भी शामिल है, और यह डेटा में सार्थक पैटर्न की तलाश करती है, जो आमतौर पर असंरचित टेक्स्ट होता है। पिछली जांच से एकत्र की गई जानकारी की तुलना की जाती है, और झूठ का पता लगाने के लिए एक मॉडल का निर्माण किया जाता है।


Data Mining Financial Banking:


माना जाता है कि बैंकिंग प्रणाली के डिजिटलीकरण से हर नए लेनदेन के साथ भारी मात्रा में डेटा उत्पन्न होता है। डेटा माइनिंग तकनीक बैंकिंग और वित्त में व्यवसाय से संबंधित समस्याओं को हल करने में मदद कर सकती है, व्यापार की जानकारी और बाजार की लागतों में रुझानों, हताहतों और सहसंबंधों की पहचान करके जो प्रबंधकों या अधिकारियों के लिए तुरंत स्पष्ट नहीं होते हैं क्योंकि डेटा की मात्रा बहुत बड़ी है या उत्पादित की जाती है विशेषज्ञों द्वारा स्क्रीन पर बहुत तेज़। एक लाभदायक ग्राहक को बेहतर लक्ष्यीकरण, प्राप्त करने, बनाए रखने, खंडित करने और बनाए रखने के लिए प्रबंधक को ये डेटा मिल सकता है।


Challenges of Implementation in Data mining in Hindi

हालाँकि डेटा माइनिंग बहुत शक्तिशाली है, लेकिन इसके निष्पादन के दौरान इसे कई चुनौतियों का सामना करना पड़ता है। प्रदर्शन, डेटा, विधियों और तकनीकों आदि से संबंधित विभिन्न चुनौतियाँ हो सकती हैं। डेटा माइनिंग की प्रक्रिया प्रभावी हो जाती है जब चुनौतियों या समस्याओं को सही ढंग से पहचाना जाता है और पर्याप्त रूप से हल किया जाता है।


Incomplete and noisy data:


बड़ी मात्रा में डेटा से उपयोगी डेटा निकालने की प्रक्रिया डेटा माइनिंग है। वास्तविक दुनिया में डेटा विषम, अपूर्ण और शोरगुल वाला है। बड़ी मात्रा में डेटा आमतौर पर गलत या अविश्वसनीय होगा। ये समस्याएँ डेटा मापने के उपकरण के कारण या मानवीय त्रुटियों के कारण हो सकती हैं। मान लीजिए कि एक खुदरा श्रृंखला उन ग्राहकों के फोन नंबर एकत्र करती है जो $ 500 से अधिक खर्च करते हैं, और लेखा कर्मचारी जानकारी को अपने सिस्टम में डालते हैं। फ़ोन नंबर दर्ज करते समय व्यक्ति एक अंक की गलती कर सकता है, जिसके परिणामस्वरूप गलत डेटा होता है। यहां तक ​​कि कुछ ग्राहक अपने फोन नंबरों का खुलासा करने के लिए तैयार नहीं हो सकते हैं, जिसके परिणामस्वरूप अधूरा डेटा होता है। मानव या सिस्टम त्रुटि के कारण डेटा परिवर्तित हो सकता है। ये सभी परिणाम (शोर और अधूरा डेटा) डेटा माइनिंग को चुनौतीपूर्ण बनाते हैं।


Data Distribution:


वास्तविक दुनिया का डेटा आमतौर पर एक वितरित कंप्यूटिंग वातावरण में विभिन्न प्लेटफार्मों पर संग्रहीत किया जाता है। यह एक डेटाबेस, व्यक्तिगत सिस्टम या इंटरनेट पर भी हो सकता है। व्यावहारिक रूप से, मुख्य रूप से संगठनात्मक और तकनीकी चिंताओं के कारण सभी डेटा को एक केंद्रीकृत डेटा रिपॉजिटरी में बनाना काफी कठिन काम है। उदाहरण के लिए, विभिन्न क्षेत्रीय कार्यालयों में अपना डेटा स्टोर करने के लिए उनके सर्वर हो सकते हैं। एक केंद्रीय सर्वर पर सभी कार्यालयों के सभी डेटा को स्टोर करना संभव नहीं है। इसलिए, डेटा माइनिंग के लिए उपकरण और एल्गोरिदम के विकास की आवश्यकता होती है जो वितरित डेटा के खनन की अनुमति देते हैं।


Complex Data:


वास्तविक दुनिया का डेटा विषम है, और यह मल्टीमीडिया डेटा हो सकता है, जिसमें ऑडियो और वीडियो, चित्र, जटिल डेटा, स्थानिक डेटा, समय श्रृंखला आदि शामिल हैं। इन विभिन्न प्रकार के डेटा को प्रबंधित करना और उपयोगी जानकारी निकालना एक कठिन कार्य है। अधिकांश समय, विशिष्ट जानकारी प्राप्त करने के लिए नई तकनीकों, नए उपकरणों और कार्यप्रणाली को परिष्कृत करना होगा।


Performance:


डेटा माइनिंग सिस्टम का प्रदर्शन मुख्य रूप से उपयोग किए गए एल्गोरिदम और तकनीकों की दक्षता पर निर्भर करता है। यदि डिज़ाइन किए गए एल्गोरिदम और तकनीक निशान तक नहीं हैं, तो डेटा माइनिंग प्रक्रिया की दक्षता पर प्रतिकूल प्रभाव पड़ेगा।


Data Privacy and Security:


डेटा माइनिंग आमतौर पर डेटा सुरक्षा, शासन और गोपनीयता के मामले में गंभीर मुद्दों की ओर जाता है। उदाहरण के लिए, यदि कोई खुदरा विक्रेता खरीदी गई वस्तुओं के विवरण का विश्लेषण करता है, तो यह बिना उनकी अनुमति के ग्राहकों की खरीदारी की आदतों और वरीयताओं के बारे में डेटा प्रकट करता है।


Data Visualization:


डेटा माइनिंग में, डेटा विज़ुअलाइज़ेशन एक बहुत ही महत्वपूर्ण प्रक्रिया है क्योंकि यह प्राथमिक विधि है जो उपयोगकर्ता को आउटपुट को प्रस्तुत करने योग्य तरीके से दिखाती है। निकाले गए डेटा को इसका सटीक अर्थ बताना चाहिए कि वह क्या व्यक्त करना चाहता है। लेकिन कई बार, अंतिम उपयोगकर्ता को सटीक और आसान तरीके से जानकारी का प्रतिनिधित्व करना मुश्किल होता है। इनपुट डेटा और आउटपुट जानकारी जटिल, बहुत कुशल और सफल डेटा विज़ुअलाइज़ेशन प्रक्रियाओं को इसे सफल बनाने के लिए लागू करने की आवश्यकता है।


 Problems

हम आपको विश्वास दिलाते हैं कि हमारे डेटा माइनिंग ट्यूटोरियल को सीखते समय आपको कोई कठिनाई नहीं होगी। लेकिन अगर इस ट्यूटोरियल में कोई गलती है, तो कृपया संपर्क फ़ॉर्म में समस्या या त्रुटि पोस्ट करें ताकि हम इसे सुधार सकें।

Sunday, October 24, 2021

What is data warehouse in Hindi - Data warehousing notes

October 24, 2021 0
What is data warehouse in Hindi - Data warehousing notes

 डेटा वेयरहाउस एक relational database management system (RDBMS) है जो ट्रांजेक्शन प्रोसेसिंग सिस्टम की आवश्यकता को पूरा करने के लिए बनाया गया है। इसे किसी भी केंद्रीकृत डेटा भंडार के रूप में वर्णित किया जा सकता है जिसे व्यावसायिक लाभों के लिए पूछताछ की जा सकती है। यह एक डेटाबेस है जो निर्णय लेने के अनुरोधों को पूरा करने के लिए उन्मुख जानकारी संग्रहीत करता है। 


यह निर्णय समर्थन प्रौद्योगिकियों का एक समूह है, जिसका लक्ष्य ज्ञान कार्यकर्ता (कार्यकारी, प्रबंधक और विश्लेषक) को बेहतर और उच्च निर्णय लेने में सक्षम बनाना है। इसलिए, डेटा वेयरहाउसिंग व्यावसायिक अधिकारियों के लिए रणनीतिक निर्णय लेने के लिए उनकी जानकारी को व्यवस्थित रूप से व्यवस्थित करने, समझने और उपयोग करने के लिए आर्किटेक्चर और टूल का समर्थन करता है।


डेटा वेयरहाउस वातावरण में एक निष्कर्षण, परिवहन और लोडिंग (ETL) समाधान, एक ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) इंजन, ग्राहक विश्लेषण उपकरण और अन्य अनुप्रयोग शामिल हैं जो जानकारी एकत्र करने और इसे व्यावसायिक उपयोगकर्ताओं तक पहुंचाने की प्रक्रिया को संभालते हैं।


data warehouse in Hindi

डेटा वेयरहाउस (DW) एक रिलेशनल डेटाबेस है जिसे लेनदेन प्रसंस्करण के बजाय क्वेरी और विश्लेषण के लिए डिज़ाइन किया गया है। इसमें एकल और एकाधिक स्रोतों से लेन-देन डेटा से प्राप्त ऐतिहासिक डेटा शामिल है।


डेटा वेयरहाउस एकीकृत, उद्यम-व्यापी, ऐतिहासिक डेटा प्रदान करता है और डेटा मॉडलिंग और विश्लेषण के लिए निर्णय लेने वालों के लिए सहायता प्रदान करने पर केंद्रित है।


डेटा वेयरहाउस डेटा का एक समूह है जो पूरे संगठन के लिए विशिष्ट है, न कि केवल उपयोगकर्ताओं के एक विशेष समूह के लिए।


इसका उपयोग दैनिक संचालन और लेनदेन प्रसंस्करण के लिए नहीं बल्कि निर्णय लेने के लिए किया जाता है।


डेटा वेयरहाउस को निम्नलिखित विशेषताओं के साथ डेटा सिस्टम के रूप में देखा जा सकता है:


  • यह एक डेटाबेस है जिसे विभिन्न applications के डेटा का उपयोग करके खोजी कार्यों के लिए डिज़ाइन किया गया है।
  • यह अपेक्षाकृत लंबी बातचीत के साथ अपेक्षाकृत कम संख्या में ग्राहकों का समर्थन करता है।
  • इसमें सूचना का ऐतिहासिक परिप्रेक्ष्य प्रदान करने के लिए वर्तमान और ऐतिहासिक डेटा शामिल हैं।
  • इसका उपयोग पठनीय है।
  • इसमें कुछ बड़े टेबल हैं।

"डेटा वेयरहाउस प्रबंधन के निर्णयों के समर्थन में सूचना का एक विषय-उन्मुख, एकीकृत और समय-भिन्न संग्रह है।"


Characteristics of Data Warehouse in Hindi


Subject-Oriented

निर्णय लेने वालों के लिए डेटा के मॉडलिंग और विश्लेषण (analysis) पर एक डेटा वेयरहाउस लक्ष्य। इसलिए, डेटा वेयरहाउस आमतौर पर वैश्विक संगठन ( global organization's )के चल रहे संचालन के बजाय किसी विशेष विषय, जैसे ग्राहक, उत्पाद या बिक्री के बारे में एक संक्षिप्त और सीधा दृश्य प्रदान करते हैं। यह उन डेटा को छोड़कर किया जाता है जो विषय से संबंधित उपयोगी नहीं हैं और इसमें विषय को समझने के लिए उपयोगकर्ताओं द्वारा आवश्यक सभी डेटा शामिल हैं।


Integrated

एक डेटा वेयरहाउस विभिन्न विषम डेटा स्रोतों जैसे आरडीबीएमएस, फ्लैट फाइलों और ऑनलाइन लेनदेन रिकॉर्ड को एकीकृत करता है। विभिन्न डेटा स्रोतों के बीच नामकरण सम्मेलनों, विशेषताओं के प्रकारों आदि में स्थिरता सुनिश्चित करने के लिए डेटा वेयरहाउसिंग के दौरान डेटा की सफाई और एकीकरण करने की आवश्यकता होती है।


Time-Variant

ऐतिहासिक जानकारी को डेटा वेयरहाउस में रखा जाता है। उदाहरण के लिए, कोई डेटा वेयरहाउस से 3 महीने, 6 महीने, 12 महीने या यहां तक ​​कि पिछले डेटा की फ़ाइलों को पुनः प्राप्त कर सकता है। लेन-देन प्रणाली के साथ ये बदलाव, जहां अक्सर केवल सबसे वर्तमान फ़ाइल रखी जाती है।


Non-Volatile

डेटा वेयरहाउस एक भौतिक रूप से अलग डेटा संग्रहण है, जो स्रोत परिचालन RDBMS से रूपांतरित होता है। डेटा का परिचालन अद्यतन डेटा वेयरहाउस में नहीं होता है, अर्थात, अद्यतन, सम्मिलित और हटाने का कार्य नहीं किया जाता है। डेटा एक्सेस करने में आमतौर पर केवल दो प्रक्रियाओं की आवश्यकता होती है: डेटा की प्रारंभिक लोडिंग और डेटा तक पहुंच। इसलिए, डीडब्ल्यू को लेनदेन प्रसंस्करण, पुनर्प्राप्ति और समवर्ती क्षमताओं की आवश्यकता नहीं होती है, जो डेटा पुनर्प्राप्ति की पर्याप्त गति के लिए अनुमति देता है। गैर-वाष्पशील परिभाषित करता है कि एक बार गोदाम में प्रवेश करने के बाद, और डेटा नहीं बदलना चाहिए।


data warehouse in Hindi
 data warehouse in Hindi 



History of Data Warehouse in Hindi

डेटा वेयरहाउसिंग का विचार 1980 के दशक के अंत में आया जब आईबीएम के शोधकर्ता बैरी डेवलिन और पॉल मर्फी ने "बिजनेस डेटा वेयरहाउस" की स्थापना की।


संक्षेप में, डेटा वेयरहाउसिंग विचार की योजना परिचालन प्रणाली से निर्णयात्मक समर्थन वातावरण तक सूचना के प्रवाह के लिए एक वास्तुशिल्प मॉडल का समर्थन करने के लिए की गई थी। अवधारणा प्रवाह से जुड़ी विभिन्न समस्याओं को संबोधित करने का प्रयास करती है, मुख्य रूप से इससे जुड़ी उच्च लागत।


डेटा वेयरहाउसिंग आर्किटेक्चर की अनुपस्थिति में, कई निर्णय समर्थन वातावरणों का समर्थन करने के लिए बड़ी मात्रा में स्थान की आवश्यकता होती है। बड़े निगमों में, विभिन्न निर्णय समर्थन वातावरणों का स्वतंत्र रूप से संचालन करना सामान्य था।


Goals of Data Warehousing in Hindi

रिपोर्टिंग और विश्लेषण में मदद करने के लिए

संगठन की ऐतिहासिक जानकारी को बनाए रखें

निर्णय लेने की नींव बनें।

Need for Data Warehouse in Hindi

निम्नलिखित कारणों से डेटा वेयरहाउस की आवश्यकता है:


1) व्यावसायिक उपयोगकर्ता: व्यावसायिक उपयोगकर्ताओं को अतीत से सारांशित डेटा देखने के लिए डेटा वेयरहाउस की आवश्यकता होती है। चूंकि ये लोग गैर-तकनीकी हैं, इसलिए उन्हें प्राथमिक रूप में डेटा प्रस्तुत किया जा सकता है।


2) ऐतिहासिक डेटा स्टोर करें: डेटा वेयरहाउस को अतीत से समय परिवर्तनीय डेटा स्टोर करने की आवश्यकता होती है। इस इनपुट का उपयोग विभिन्न उद्देश्यों के लिए किया जाता है।


3) रणनीतिक निर्णय लें: कुछ रणनीतियाँ डेटा वेयरहाउस में डेटा के आधार पर हो सकती हैं। इसलिए, डेटा वेयरहाउस रणनीतिक निर्णय लेने में योगदान देता है।


4) डेटा स्थिरता और गुणवत्ता के लिए: विभिन्न स्रोतों से डेटा को एक सामान्य स्थान पर लाना, उपयोगकर्ता डेटा में एकरूपता और स्थिरता लाने के लिए प्रभावी ढंग से कार्य कर सकता है।


5) उच्च प्रतिक्रिया समय: डेटा वेयरहाउस को कुछ अप्रत्याशित भार और प्रश्नों के प्रकार के लिए तैयार रहना पड़ता है, जो लचीलेपन और त्वरित प्रतिक्रिया समय की एक महत्वपूर्ण डिग्री की मांग करता है।


Benefits of Data Warehouse in Hindi

व्यावसायिक रुझानों को समझें और बेहतर पूर्वानुमान निर्णय लें।

  • डेटा वेयरहाउस को डेटा की भारी मात्रा में अच्छा प्रदर्शन करने के लिए डिज़ाइन किया गया है।
  • अंतिम उपयोगकर्ताओं के लिए नेविगेट करने, समझने और क्वेरी करने के लिए डेटा वेयरहाउस की संरचना अधिक सुलभ है।
  • कई सामान्यीकृत डेटाबेस में जटिल प्रश्न डेटा वेयरहाउस में निर्माण और रखरखाव करना आसान हो सकता है।
  • डेटा वेयरहाउसिंग बहुत सारे उपयोगकर्ताओं से बहुत सारी जानकारी की मांग को प्रबंधित करने का एक कुशल तरीका है।
  • डेटा वेयरहाउसिंग ऐतिहासिक डेटा की एक बड़ी मात्रा का विश्लेषण करने की क्षमता प्रदान करता है।

आवश्यक शर्तें [Prerequisites]

डेटा वेयरहाउस के बारे में सीखने से पहले, आपको बुनियादी डेटाबेस अवधारणाओं जैसे कि स्कीमा, ईआर मॉडल, संरचित क्वेरी भाषा आदि का मूलभूत ज्ञान होना चाहिए।


दर्शक [Audience]

यह ट्यूटोरियल कंप्यूटर विज्ञान के छात्रों को डेटा वेयरहाउसिंग से जुड़ी बुनियादी-से-उन्नत अवधारणाओं को समझने में मदद करेगा।


समस्या [Problems]

हम विश्वास दिलाते हैं कि आपको इस डेटा वेयरहाउस ट्यूटोरियल में कोई समस्या नहीं मिलेगी। लेकिन अगर कोई गलती है, तो कृपया संपर्क फ़ॉर्म में समस्या पोस्ट करें।