Computer in Hindi | Business in Hindi: data warehousing and data mining notes
Showing posts with label data warehousing and data mining notes. Show all posts
Showing posts with label data warehousing and data mining notes. Show all posts

Monday, October 25, 2021

What is Data Mining in Hindi - data warehousing and data mining notes

October 25, 2021 0
What is Data Mining in Hindi - data warehousing and data mining notes

data mining tutorialडेटा माइनिंग की basic और advanced अवधारणाएँ प्रदान करता है। हमारा डेटा माइनिंग ट्यूटोरियल शिक्षार्थियों और विशेषज्ञों के लिए बनाया गया है।


डेटा माइनिंग सबसे उपयोगी तकनीकों में से एक है जो उद्यमियों, शोधकर्ताओं और व्यक्तियों को डेटा के विशाल सेट से मूल्यवान जानकारी निकालने में मदद करती है। डेटा माइनिंग को Knowledge Discovery in Database (KDD) भी कहा जाता है। ज्ञान की खोज प्रक्रिया में डेटा सफाई, डेटा एकीकरण, डेटा चयन, डेटा परिवर्तन, डेटा खनन, पैटर्न मूल्यांकन और ज्ञान प्रस्तुति शामिल है।


हमारे डेटा माइनिंग ट्यूटोरियल में डेटा माइनिंग के सभी विषय शामिल हैं जैसे कि एप्लिकेशन, डेटा माइनिंग बनाम मशीन लर्निंग, डेटा माइनिंग टूल, सोशल मीडिया डेटा माइनिंग, डेटा माइनिंग तकनीक, डेटा माइनिंग में क्लस्टरिंग, डेटा माइनिंग में चुनौतियाँ आदि।


What is Data Mining in Hindi | Data Mining Tutorial

पैटर्न, प्रवृत्तियों और उपयोगी डेटा की पहचान करने के लिए जानकारी निकालने की प्रक्रिया जो व्यवसाय को डेटा के विशाल सेट से डेटा-संचालित निर्णय लेने की अनुमति देती है, डेटा माइनिंग कहलाती है।


दूसरे शब्दों में, हम कह सकते हैं कि डेटा माइनिंग उपयोगी डेटा में वर्गीकरण के लिए विभिन्न दृष्टिकोणों के लिए सूचना के छिपे हुए पैटर्न की जांच करने की प्रक्रिया है, जिसे डेटा वेयरहाउस, कुशल विश्लेषण, डेटा माइनिंग एल्गोरिदम, निर्णय में मदद करने जैसे विशेष क्षेत्रों में एकत्र और इकट्ठा किया जाता है। अंततः लागत में कटौती और राजस्व उत्पन्न करने के लिए बनाने और अन्य डेटा आवश्यकता।


डेटा माइनिंग सरल विश्लेषण प्रक्रियाओं से परे जाने वाले रुझानों और पैटर्न को खोजने के लिए सूचनाओं के बड़े भंडार की स्वचालित रूप से खोज करने का कार्य है। डेटा माइनिंग डेटा सेगमेंट के लिए जटिल गणितीय एल्गोरिदम का उपयोग करता है और भविष्य की घटनाओं की संभावना का मूल्यांकन करता है। डेटा माइनिंग को डेटा की नॉलेज डिस्कवरी (KDD) भी कहा जाता है।


डेटा माइनिंग एक ऐसी प्रक्रिया है जिसका उपयोग संगठनों द्वारा व्यावसायिक समस्याओं को हल करने के लिए विशाल डेटाबेस से विशिष्ट डेटा निकालने के लिए किया जाता है। यह मुख्य रूप से कच्चे डेटा को उपयोगी जानकारी में बदल देता है।


डेटा माइनिंग एक व्यक्ति द्वारा एक विशिष्ट स्थिति में, एक विशेष डेटा सेट पर, एक उद्देश्य के साथ किए गए डेटा साइंस के समान है। इस प्रक्रिया में टेक्स्ट माइनिंग, वेब माइनिंग, ऑडियो और वीडियो माइनिंग, सचित्र डेटा माइनिंग और सोशल मीडिया माइनिंग जैसी विभिन्न प्रकार की सेवाएँ शामिल हैं। यह सॉफ्टवेयर के माध्यम से किया जाता है जो सरल या अत्यधिक विशिष्ट होता है। डेटा माइनिंग को आउटसोर्स करके, कम परिचालन लागत के साथ सभी काम तेजी से किए जा सकते हैं। विशिष्ट फर्म डेटा एकत्र करने के लिए नई तकनीकों का भी उपयोग कर सकती हैं जिन्हें मैन्युअल रूप से ढूंढना असंभव है। विभिन्न प्लेटफार्मों पर ढेर सारी जानकारी उपलब्ध है, लेकिन बहुत कम जानकारी उपलब्ध है। सबसे बड़ी चुनौती महत्वपूर्ण जानकारी निकालने के लिए डेटा का विश्लेषण करना है जिसका उपयोग किसी समस्या को हल करने या कंपनी के विकास के लिए किया जा सकता है। माइन डेटा के लिए कई शक्तिशाली उपकरण और तकनीक उपलब्ध हैं और इससे बेहतर अंतर्दृष्टि प्राप्त होती है।


Types of data mining in Hindi

डेटा माइनिंग निम्न प्रकार के डेटा पर किया जा सकता है:


Relational Database:


एक रिलेशनल डेटाबेस टेबल, रिकॉर्ड और कॉलम द्वारा औपचारिक रूप से व्यवस्थित कई डेटा सेट का एक संग्रह है, जिससे डेटाबेस टेबल को पहचानने के बिना डेटा को विभिन्न तरीकों से एक्सेस किया जा सकता है। टेबल्स जानकारी को व्यक्त और साझा करते हैं, जो डेटा खोज योग्यता, रिपोर्टिंग और संगठन की सुविधा प्रदान करती है।


Data warehouses:


डेटा वेयरहाउस वह तकनीक है जो सार्थक व्यावसायिक अंतर्दृष्टि प्रदान करने के लिए संगठन के भीतर विभिन्न स्रोतों से डेटा एकत्र करती है। बड़ी मात्रा में डेटा मार्केटिंग और वित्त जैसे कई स्थानों से आता है। निकाले गए डेटा का उपयोग विश्लेषणात्मक उद्देश्यों के लिए किया जाता है और एक व्यावसायिक संगठन के लिए निर्णय लेने में मदद करता है। डेटा वेयरहाउस को लेनदेन प्रसंस्करण के बजाय डेटा के विश्लेषण के लिए डिज़ाइन किया गया है।


Data Repositories:


डेटा रिपोजिटरी आमतौर पर डेटा स्टोरेज के लिए एक गंतव्य को संदर्भित करता है। हालांकि, कई आईटी पेशेवर आईटी संरचना के भीतर एक विशिष्ट प्रकार के सेटअप को संदर्भित करने के लिए इस शब्द का अधिक स्पष्ट रूप से उपयोग करते हैं। उदाहरण के लिए, डेटाबेस का एक समूह, जहां एक संगठन ने विभिन्न प्रकार की जानकारी रखी है।


Object-Relational Database:


ऑब्जेक्ट-ओरिएंटेड डेटाबेस मॉडल और रिलेशनल डेटाबेस मॉडल के संयोजन को ऑब्जेक्ट-रिलेशनल मॉडल कहा जाता है। यह कक्षाओं, वस्तुओं, विरासत आदि का समर्थन करता है।


ऑब्जेक्ट-रिलेशनल डेटा मॉडल के प्राथमिक उद्देश्यों में से एक रिलेशनल डेटाबेस और ऑब्जेक्ट-ओरिएंटेड मॉडल प्रथाओं के बीच की खाई को बंद करना है जो अक्सर कई प्रोग्रामिंग भाषाओं में उपयोग किया जाता है, उदाहरण के लिए, सी ++, जावा, सी #, और इसी तरह। .


Transactional Database:


एक लेन-देन संबंधी डेटाबेस एक डेटाबेस प्रबंधन प्रणाली (DBMS) को संदर्भित करता है जिसमें डेटाबेस लेनदेन को पूर्ववत करने की क्षमता होती है यदि यह उचित रूप से नहीं किया जाता है। भले ही यह बहुत समय पहले एक अनूठी क्षमता थी, आज, अधिकांश रिलेशनल डेटाबेस सिस्टम ट्रांजेक्शनल डेटाबेस गतिविधियों का समर्थन करते हैं।


Advantages of Data Mining in Hindi

  • डेटा माइनिंग तकनीक संगठनों को ज्ञान-आधारित डेटा प्राप्त करने में सक्षम बनाती है।

  • डेटा माइनिंग संगठनों को संचालन और उत्पादन में आकर्षक संशोधन करने में सक्षम बनाता है।

  • अन्य सांख्यिकीय डेटा अनुप्रयोगों की तुलना में, डेटा माइनिंग एक लागत-कुशल है।

  • डेटा माइनिंग किसी संगठन की निर्णय लेने की प्रक्रिया में मदद करता है।

  • यह छिपे हुए पैटर्न की स्वचालित खोज के साथ-साथ प्रवृत्तियों और व्यवहारों की भविष्यवाणी की सुविधा प्रदान करता है।

  • इसे नई प्रणाली के साथ-साथ मौजूदा प्लेटफार्मों में भी प्रेरित किया जा सकता है।

  • यह एक त्वरित प्रक्रिया है जो नए उपयोगकर्ताओं के लिए कम समय में भारी मात्रा में डेटा का विश्लेषण करना आसान बनाती है।


Disadvantages of Data Mining in Hindi

  • एक संभावना है कि संगठन ग्राहकों के उपयोगी डेटा को पैसे के लिए अन्य संगठनों को बेच सकते हैं। रिपोर्ट के मुताबिक, अमेरिकन एक्सप्रेस ने अपने ग्राहकों के क्रेडिट कार्ड से खरीदारी को अन्य संगठनों को बेच दिया है।

  • कई डेटा माइनिंग एनालिटिक्स सॉफ़्टवेयर को संचालित करना मुश्किल है और इस पर काम करने के लिए अग्रिम प्रशिक्षण की आवश्यकता होती है।

  • अलग-अलग डेटा माइनिंग इंस्ट्रूमेंट अपने डिजाइन में इस्तेमाल किए गए अलग-अलग एल्गोरिदम के कारण अलग-अलग तरीकों से काम करते हैं। इसलिए, सही डेटा माइनिंग टूल का चयन एक बहुत ही चुनौतीपूर्ण कार्य है।

  • डेटा माइनिंग तकनीक सटीक नहीं है, जिससे कुछ स्थितियों में इसके गंभीर परिणाम हो सकते हैं।

Applications of Data Mining in Hindi

डेटा माइनिंग का उपयोग मुख्य रूप से गहन उपभोक्ता मांगों वाले संगठनों द्वारा किया जाता है- खुदरा, संचार, वित्तीय, विपणन कंपनी, मूल्य, उपभोक्ता प्राथमिकताएं, उत्पाद की स्थिति, और बिक्री, ग्राहकों की संतुष्टि और कॉर्पोरेट लाभ पर प्रभाव का निर्धारण। डेटा माइनिंग एक रिटेलर को उत्पाद और प्रचार विकसित करने के लिए ग्राहक खरीद के पॉइंट-ऑफ-सेल रिकॉर्ड का उपयोग करने में सक्षम बनाता है जो संगठन को ग्राहक को आकर्षित करने में मदद करता है।


Data Mining in Hindi
Data Mining in Hindi



ये निम्नलिखित क्षेत्र हैं जहाँ डेटा माइनिंग का व्यापक रूप से उपयोग किया जाता है:


data mining applications in healthcare


स्वास्थ्य सेवा में डेटा माइनिंग में स्वास्थ्य प्रणाली में सुधार की उत्कृष्ट क्षमता है। यह बेहतर अंतर्दृष्टि के लिए डेटा और एनालिटिक्स का उपयोग करता है और सर्वोत्तम प्रथाओं की पहचान करता है जो स्वास्थ्य देखभाल सेवाओं को बढ़ाएंगे और लागत को कम करेंगे। विश्लेषक डेटा माइनिंग दृष्टिकोण जैसे मशीन लर्निंग, बहु-आयामी डेटाबेस, डेटा विज़ुअलाइज़ेशन, सॉफ्ट कंप्यूटिंग और सांख्यिकी का उपयोग करते हैं। डेटा माइनिंग का उपयोग प्रत्येक श्रेणी में रोगियों की भविष्यवाणी करने के लिए किया जा सकता है। प्रक्रियाएं सुनिश्चित करती हैं कि मरीजों को सही जगह और सही समय पर गहन देखभाल मिले। डेटा माइनिंग स्वास्थ्य बीमा कंपनियों को धोखाधड़ी और दुरुपयोग को पहचानने में भी सक्षम बनाता है।


Data Mining in Market Basket Analysis:


बाजार टोकरी विश्लेषण एक परिकल्पना पर आधारित एक मॉडलिंग पद्धति है। यदि आप उत्पादों का एक विशिष्ट समूह खरीदते हैं, तो आप उत्पादों के दूसरे समूह को खरीदने की अधिक संभावना रखते हैं। यह तकनीक खुदरा विक्रेता को खरीदार के खरीद व्यवहार को समझने में सक्षम बनाती है। यह डेटा खुदरा विक्रेता को खरीदार की आवश्यकताओं को समझने और उसके अनुसार स्टोर के लेआउट को बदलने में सहायता कर सकता है। विभिन्न जनसांख्यिकीय समूहों में ग्राहकों के बीच विभिन्न स्टोरों के बीच परिणामों की एक अलग विश्लेषणात्मक तुलना का उपयोग करके किया जा सकता है।


Data mining in Education:


शिक्षा डेटा माइनिंग एक नया उभरता हुआ क्षेत्र है, जो विकासशील तकनीकों से संबंधित है जो शैक्षिक वातावरण से उत्पन्न डेटा से ज्ञान का पता लगाते हैं। ईडीएम उद्देश्यों को छात्र के भविष्य के सीखने के व्यवहार की पुष्टि करने, शैक्षिक समर्थन के प्रभाव का अध्ययन करने और विज्ञान सीखने को बढ़ावा देने के रूप में मान्यता प्राप्त है। एक संगठन सटीक निर्णय लेने और छात्र के परिणामों की भविष्यवाणी करने के लिए डेटा माइनिंग का उपयोग कर सकता है। परिणामों के साथ, संस्थान इस बात पर ध्यान केंद्रित कर सकता है कि क्या पढ़ाया जाए और कैसे पढ़ाया जाए।


Data Mining in Manufacturing Engineering:


ज्ञान एक निर्माण कंपनी के पास सबसे अच्छी संपत्ति है। एक जटिल निर्माण प्रक्रिया में पैटर्न खोजने के लिए डेटा माइनिंग टूल फायदेमंद हो सकते हैं। डेटा माइनिंग का उपयोग सिस्टम-स्तरीय डिजाइनिंग में उत्पाद वास्तुकला, उत्पाद पोर्टफोलियो और ग्राहकों की डेटा आवश्यकताओं के बीच संबंध प्राप्त करने के लिए किया जा सकता है। इसका उपयोग अन्य कार्यों के बीच उत्पाद विकास अवधि, लागत और अपेक्षाओं का पूर्वानुमान लगाने के लिए भी किया जा सकता है।


Data Mining in CRM (Customer Relationship Management):


ग्राहक संबंध प्रबंधन (सीआरएम) ग्राहकों को प्राप्त करने और धारण करने, ग्राहक वफादारी बढ़ाने और ग्राहक-उन्मुख रणनीतियों को लागू करने के बारे में है। ग्राहक के साथ अच्छे संबंध बनाने के लिए, एक व्यावसायिक संगठन को डेटा एकत्र करने और डेटा का विश्लेषण करने की आवश्यकता होती है। डेटा माइनिंग तकनीकों के साथ, एकत्रित डेटा का उपयोग विश्लेषण के लिए किया जा सकता है।


Data Mining in Fraud detection:


धोखाधड़ी की कार्रवाई में अरबों डॉलर का नुकसान होता है। धोखाधड़ी का पता लगाने के पारंपरिक तरीके थोड़े समय लेने वाले और परिष्कृत हैं। डेटा माइनिंग सार्थक पैटर्न प्रदान करता है और डेटा को सूचना में बदल देता है। एक आदर्श धोखाधड़ी का पता लगाने वाली प्रणाली को सभी उपयोगकर्ताओं के डेटा की रक्षा करनी चाहिए। पर्यवेक्षित विधियों में नमूना अभिलेखों का संग्रह होता है, और इन अभिलेखों को धोखाधड़ी या गैर-धोखाधड़ी के रूप में वर्गीकृत किया जाता है। इस डेटा का उपयोग करके एक मॉडल का निर्माण किया जाता है, और यह पहचानने के लिए तकनीक बनाई जाती है कि दस्तावेज़ धोखाधड़ी है या नहीं।


Data Mining in Lie Detection:


अपराधी को पकड़ना कोई बड़ी बात नहीं है, लेकिन उससे सच्चाई को सामने लाना बहुत ही चुनौतीपूर्ण कार्य है। कानून प्रवर्तन डेटा खनन तकनीकों का उपयोग अपराधों की जांच करने, संदिग्ध आतंकवादी संचार की निगरानी आदि के लिए कर सकता है। इस तकनीक में टेक्स्ट माइनिंग भी शामिल है, और यह डेटा में सार्थक पैटर्न की तलाश करती है, जो आमतौर पर असंरचित टेक्स्ट होता है। पिछली जांच से एकत्र की गई जानकारी की तुलना की जाती है, और झूठ का पता लगाने के लिए एक मॉडल का निर्माण किया जाता है।


Data Mining Financial Banking:


माना जाता है कि बैंकिंग प्रणाली के डिजिटलीकरण से हर नए लेनदेन के साथ भारी मात्रा में डेटा उत्पन्न होता है। डेटा माइनिंग तकनीक बैंकिंग और वित्त में व्यवसाय से संबंधित समस्याओं को हल करने में मदद कर सकती है, व्यापार की जानकारी और बाजार की लागतों में रुझानों, हताहतों और सहसंबंधों की पहचान करके जो प्रबंधकों या अधिकारियों के लिए तुरंत स्पष्ट नहीं होते हैं क्योंकि डेटा की मात्रा बहुत बड़ी है या उत्पादित की जाती है विशेषज्ञों द्वारा स्क्रीन पर बहुत तेज़। एक लाभदायक ग्राहक को बेहतर लक्ष्यीकरण, प्राप्त करने, बनाए रखने, खंडित करने और बनाए रखने के लिए प्रबंधक को ये डेटा मिल सकता है।


Challenges of Implementation in Data mining in Hindi

हालाँकि डेटा माइनिंग बहुत शक्तिशाली है, लेकिन इसके निष्पादन के दौरान इसे कई चुनौतियों का सामना करना पड़ता है। प्रदर्शन, डेटा, विधियों और तकनीकों आदि से संबंधित विभिन्न चुनौतियाँ हो सकती हैं। डेटा माइनिंग की प्रक्रिया प्रभावी हो जाती है जब चुनौतियों या समस्याओं को सही ढंग से पहचाना जाता है और पर्याप्त रूप से हल किया जाता है।


Incomplete and noisy data:


बड़ी मात्रा में डेटा से उपयोगी डेटा निकालने की प्रक्रिया डेटा माइनिंग है। वास्तविक दुनिया में डेटा विषम, अपूर्ण और शोरगुल वाला है। बड़ी मात्रा में डेटा आमतौर पर गलत या अविश्वसनीय होगा। ये समस्याएँ डेटा मापने के उपकरण के कारण या मानवीय त्रुटियों के कारण हो सकती हैं। मान लीजिए कि एक खुदरा श्रृंखला उन ग्राहकों के फोन नंबर एकत्र करती है जो $ 500 से अधिक खर्च करते हैं, और लेखा कर्मचारी जानकारी को अपने सिस्टम में डालते हैं। फ़ोन नंबर दर्ज करते समय व्यक्ति एक अंक की गलती कर सकता है, जिसके परिणामस्वरूप गलत डेटा होता है। यहां तक ​​कि कुछ ग्राहक अपने फोन नंबरों का खुलासा करने के लिए तैयार नहीं हो सकते हैं, जिसके परिणामस्वरूप अधूरा डेटा होता है। मानव या सिस्टम त्रुटि के कारण डेटा परिवर्तित हो सकता है। ये सभी परिणाम (शोर और अधूरा डेटा) डेटा माइनिंग को चुनौतीपूर्ण बनाते हैं।


Data Distribution:


वास्तविक दुनिया का डेटा आमतौर पर एक वितरित कंप्यूटिंग वातावरण में विभिन्न प्लेटफार्मों पर संग्रहीत किया जाता है। यह एक डेटाबेस, व्यक्तिगत सिस्टम या इंटरनेट पर भी हो सकता है। व्यावहारिक रूप से, मुख्य रूप से संगठनात्मक और तकनीकी चिंताओं के कारण सभी डेटा को एक केंद्रीकृत डेटा रिपॉजिटरी में बनाना काफी कठिन काम है। उदाहरण के लिए, विभिन्न क्षेत्रीय कार्यालयों में अपना डेटा स्टोर करने के लिए उनके सर्वर हो सकते हैं। एक केंद्रीय सर्वर पर सभी कार्यालयों के सभी डेटा को स्टोर करना संभव नहीं है। इसलिए, डेटा माइनिंग के लिए उपकरण और एल्गोरिदम के विकास की आवश्यकता होती है जो वितरित डेटा के खनन की अनुमति देते हैं।


Complex Data:


वास्तविक दुनिया का डेटा विषम है, और यह मल्टीमीडिया डेटा हो सकता है, जिसमें ऑडियो और वीडियो, चित्र, जटिल डेटा, स्थानिक डेटा, समय श्रृंखला आदि शामिल हैं। इन विभिन्न प्रकार के डेटा को प्रबंधित करना और उपयोगी जानकारी निकालना एक कठिन कार्य है। अधिकांश समय, विशिष्ट जानकारी प्राप्त करने के लिए नई तकनीकों, नए उपकरणों और कार्यप्रणाली को परिष्कृत करना होगा।


Performance:


डेटा माइनिंग सिस्टम का प्रदर्शन मुख्य रूप से उपयोग किए गए एल्गोरिदम और तकनीकों की दक्षता पर निर्भर करता है। यदि डिज़ाइन किए गए एल्गोरिदम और तकनीक निशान तक नहीं हैं, तो डेटा माइनिंग प्रक्रिया की दक्षता पर प्रतिकूल प्रभाव पड़ेगा।


Data Privacy and Security:


डेटा माइनिंग आमतौर पर डेटा सुरक्षा, शासन और गोपनीयता के मामले में गंभीर मुद्दों की ओर जाता है। उदाहरण के लिए, यदि कोई खुदरा विक्रेता खरीदी गई वस्तुओं के विवरण का विश्लेषण करता है, तो यह बिना उनकी अनुमति के ग्राहकों की खरीदारी की आदतों और वरीयताओं के बारे में डेटा प्रकट करता है।


Data Visualization:


डेटा माइनिंग में, डेटा विज़ुअलाइज़ेशन एक बहुत ही महत्वपूर्ण प्रक्रिया है क्योंकि यह प्राथमिक विधि है जो उपयोगकर्ता को आउटपुट को प्रस्तुत करने योग्य तरीके से दिखाती है। निकाले गए डेटा को इसका सटीक अर्थ बताना चाहिए कि वह क्या व्यक्त करना चाहता है। लेकिन कई बार, अंतिम उपयोगकर्ता को सटीक और आसान तरीके से जानकारी का प्रतिनिधित्व करना मुश्किल होता है। इनपुट डेटा और आउटपुट जानकारी जटिल, बहुत कुशल और सफल डेटा विज़ुअलाइज़ेशन प्रक्रियाओं को इसे सफल बनाने के लिए लागू करने की आवश्यकता है।


 Problems

हम आपको विश्वास दिलाते हैं कि हमारे डेटा माइनिंग ट्यूटोरियल को सीखते समय आपको कोई कठिनाई नहीं होगी। लेकिन अगर इस ट्यूटोरियल में कोई गलती है, तो कृपया संपर्क फ़ॉर्म में समस्या या त्रुटि पोस्ट करें ताकि हम इसे सुधार सकें।