Computer in Hindi | Business in Hindi: algorithm
Showing posts with label algorithm. Show all posts
Showing posts with label algorithm. Show all posts

Friday, March 11, 2022

linear regression in machine learning Hindi

March 11, 2022 0
linear regression in machine learning Hindi

Linear regression सबसे आसान और सबसे लोकप्रिय मशीन लर्निंग एल्गोरिदम में से एक है। यह एक सांख्यिकीय पद्धति है जिसका उपयोग भविष्य कहनेवाला विश्लेषण के लिए किया जाता है। रैखिक प्रतिगमन  sales, salary, age, product price, उत्पाद की कीमत आदि जैसे निरंतर / वास्तविक या संख्यात्मक चर के लिए भविष्यवाणियां करता है।


linear regression algorithm एक आश्रित (y) और एक या अधिक स्वतंत्र (y) चर के बीच एक रैखिक संबंध दिखाता है, इसलिए इसे रैखिक प्रतिगमन कहा जाता है। चूंकि रेखीय प्रतिगमन रैखिक संबंध को दर्शाता है, जिसका अर्थ है कि यह पता लगाता है कि स्वतंत्र चर के मूल्य के अनुसार निर्भर चर का मूल्य कैसे बदल रहा है।



linear regression in machine learning

linear regression model चर के बीच संबंधों का प्रतिनिधित्व करने वाली एक ढलान वाली सीधी रेखा प्रदान करता है। नीचे दी गई छवि पर विचार करें


यहां,

y= a0+a1x+ ε

Y= आश्रित चर (लक्ष्य चर)

= स्वतंत्र चर (भविष्यवक्ता चर)

a0= रेखा का अवरोधन (स्वतंत्रता की एक अतिरिक्त डिग्री देता है)

a1 = रैखिक प्रतिगमन गुणांक (प्रत्येक इनपुट मान के लिए स्केल कारक)।

ε = random error


x और y चर के मान रैखिक प्रतिगमन मॉडल प्रतिनिधित्व के लिए प्रशिक्षण डेटासेट हैं।


types of linear regression in machine learning in Hindi

रैखिक प्रतिगमन को आगे दो प्रकार के एल्गोरिथ्म में विभाजित किया जा सकता है:


  • Simple Linear Regression:

यदि किसी एकल स्वतंत्र चर का उपयोग किसी संख्यात्मक आश्रित चर के मूल्य की भविष्यवाणी करने के लिए किया जाता है, तो ऐसे रैखिक प्रतिगमन एल्गोरिथ्म को सरल रैखिक प्रतिगमन कहा जाता है।

  • Multiple Linear regression:

यदि किसी संख्यात्मक आश्रित चर के मान का अनुमान लगाने के लिए एक से अधिक स्वतंत्र चर का उपयोग किया जाता है, तो ऐसे रैखिक प्रतिगमन एल्गोरिथ्म को एकाधिक रैखिक प्रतिगमन कहा जाता है।

Linear Regression Line

आश्रित और स्वतंत्र चरों के बीच संबंध दर्शाने वाली रैखिक रेखा को समाश्रयण रेखा कहते हैं। प्रतिगमन रेखा दो प्रकार के संबंध दिखा सकती है:


  • Positive Linear Relationship:

यदि आश्रित चर Y-अक्ष पर बढ़ता है और स्वतंत्र चर X-अक्ष पर बढ़ता है, तो ऐसे संबंध को धनात्मक रैखिक संबंध कहा जाता है।


linear regression in machine learning
linear regression in machine learning in hindi



Negative Linear Relationship:

यदि आश्रित चर Y-अक्ष पर घटता है और स्वतंत्र चर X-अक्ष पर बढ़ता है, तो ऐसे संबंध को ऋणात्मक रैखिक संबंध कहा जाता है।


Negative Linear Relationship
Negative Linear Relationship



Finding the best fit line:

रैखिक प्रतिगमन के साथ काम करते समय, हमारा मुख्य लक्ष्य सबसे अच्छी फिट लाइन ढूंढना है, जिसका अर्थ है कि अनुमानित मूल्यों और वास्तविक मूल्यों के बीच त्रुटि को कम किया जाना चाहिए। सबसे अच्छी फिट लाइन में कम से कम त्रुटि होगी।


भार या रेखाओं के गुणांक (a0, a1) के लिए अलग-अलग मान प्रतिगमन की एक अलग रेखा देते हैं, इसलिए हमें सर्वोत्तम फिट लाइन खोजने के लिए a0 और a1 के लिए सर्वोत्तम मानों की गणना करने की आवश्यकता है, इसलिए इसकी गणना करने के लिए हम लागत फ़ंक्शन का उपयोग करते हैं।


Cost function-

  • भार या रेखाओं के गुणांक (a0, a1) के लिए अलग-अलग मान प्रतिगमन की अलग-अलग रेखा देते हैं, और सर्वोत्तम फिट लाइन के लिए गुणांक के मूल्यों का अनुमान लगाने के लिए लागत फ़ंक्शन का उपयोग किया जाता है।
  • लागत फ़ंक्शन प्रतिगमन गुणांक या भार का अनुकूलन करता है। यह मापता है कि एक रेखीय प्रतिगमन मॉडल कैसा प्रदर्शन कर रहा है।
  • हम मैपिंग फ़ंक्शन की सटीकता का पता लगाने के लिए लागत फ़ंक्शन का उपयोग कर सकते हैं, जो इनपुट चर को आउटपुट चर में मैप करता है। इस मैपिंग फ़ंक्शन को हाइपोथीसिस फ़ंक्शन के रूप में भी जाना जाता है।

रैखिक प्रतिगमन के लिए, हम Mean Squared Error (MSE)  लागत फ़ंक्शन का उपयोग करते हैं, जो अनुमानित मानों और वास्तविक मानों के बीच हुई चुकता त्रुटि का औसत है। इसे इस प्रकार लिखा जा सकता है:


उपरोक्त रैखिक समीकरण के लिए, MSE की गणना इस प्रकार की जा सकती है:


linear regression in machine learning python
linear regression in machine learning python



कहां,


N=Total number of observation

Yi = Actual value

(a1xi+a0)= Predicted value.


Residuals:  वास्तविक मूल्य और अनुमानित मूल्यों के बीच की दूरी को अवशिष्ट कहा जाता है। यदि देखे गए बिंदु प्रतिगमन रेखा से दूर हैं, तो अवशिष्ट अधिक होगा, और इसलिए लागत कार्य अधिक होगा। यदि प्रकीर्णन बिंदु प्रतीपगमन रेखा के निकट हैं, तो अवशिष्ट छोटा होगा और इसलिए लागत फलन होगा।


Gradient Descent:

  • लागत फ़ंक्शन के ग्रेडिएंट की गणना करके MSE को कम करने के लिए ग्रेडिएंट डिसेंट का उपयोग किया जाता है।
  • एक प्रतिगमन मॉडल लागत फ़ंक्शन को कम करके लाइन के गुणांक को अद्यतन करने के लिए ग्रेडिएंट डिसेंट का उपयोग करता है।
  • यह गुणांक के मूल्यों के यादृच्छिक चयन द्वारा किया जाता है और फिर न्यूनतम लागत फ़ंक्शन तक पहुंचने के लिए मूल्यों को पुनरावृत्त रूप से अद्यतन करता है।

Model Performance:

फिट की अच्छाई यह निर्धारित करती है कि प्रतिगमन की रेखा अवलोकनों के सेट में कैसे फिट होती है। विभिन्न मॉडलों में से सर्वश्रेष्ठ मॉडल खोजने की प्रक्रिया को अनुकूलन कहा जाता है। इसे निम्न विधि द्वारा प्राप्त किया जा सकता है:


1. R-squared method:


  • आर-स्क्वेर्ड एक सांख्यिकीय पद्धति है जो फिट की अच्छाई को निर्धारित करती है।
  • यह 0-100% के पैमाने पर आश्रित और स्वतंत्र चर के बीच संबंधों की ताकत को मापता है।
  • आर-स्क्वायर का उच्च मूल्य अनुमानित मूल्यों और वास्तविक मूल्यों के बीच कम अंतर को निर्धारित करता है और इसलिए एक अच्छे मॉडल का प्रतिनिधित्व करता है।
  • इसे कई प्रतिगमन के लिए निर्धारण का गुणांक, या एकाधिक निर्धारण का गुणांक भी कहा जाता है।

इसकी गणना निम्न सूत्र से की जा सकती है:


linear regression in machine learning in hindi
linear regression in machine learning in hindi



Assumptions of Linear Regression in Machine Learning in Hindi

रैखिक प्रतिगमन की कुछ महत्वपूर्ण मान्यताएँ नीचे दी गई हैं। रैखिक प्रतिगमन मॉडल का निर्माण करते समय ये कुछ औपचारिक जाँचें हैं, जो दिए गए डेटासेट से सर्वोत्तम संभव परिणाम प्राप्त करना सुनिश्चित करती हैं।


  • Linear relationship between the features and target:

रैखिक प्रतिगमन आश्रित और स्वतंत्र चर के बीच रैखिक संबंध मानता है।

  • Small or no multicollinearity between the features:

बहुसंरेखण का अर्थ है स्वतंत्र चरों के बीच उच्च-सहसंबंध। बहुसंस्कृति के कारण, भविष्यवक्ताओं और लक्ष्य चर के बीच सही संबंध खोजना मुश्किल हो सकता है। या हम कह सकते हैं, यह निर्धारित करना मुश्किल है कि कौन सा भविष्यवक्ता चर लक्ष्य चर को प्रभावित कर रहा है और कौन सा नहीं। तो, मॉडल सुविधाओं या स्वतंत्र चर के बीच या तो बहुत कम या कोई बहुसंस्कृति नहीं मानता है।

  • Homoscedasticity Assumption:

Homoscedasticity एक ऐसी स्थिति है जब त्रुटि शब्द स्वतंत्र चर के सभी मानों के लिए समान होता है। समरूपता के साथ, स्कैटर प्लॉट में डेटा का कोई स्पष्ट पैटर्न वितरण नहीं होना चाहिए।

  • Normal distribution of error terms:

रैखिक प्रतिगमन मानता है कि त्रुटि शब्द को सामान्य वितरण पैटर्न का पालन करना चाहिए। यदि त्रुटि शर्तों को सामान्य रूप से वितरित नहीं किया जाता है, तो आत्मविश्वास अंतराल या तो बहुत व्यापक या बहुत संकीर्ण हो जाएगा, जिससे गुणांक खोजने में कठिनाई हो सकती है।

इसे q-q प्लॉट का उपयोग करके चेक किया जा सकता है। यदि प्लॉट बिना किसी विचलन के एक सीधी रेखा दिखाता है, जिसका अर्थ है कि त्रुटि सामान्य रूप से वितरित की जाती है।

  • No autocorrelations:

रैखिक प्रतिगमन मॉडल त्रुटि शर्तों में कोई स्वत: सहसंबंध नहीं मानता है। यदि त्रुटि अवधि में कोई सहसंबंध होगा, तो यह मॉडल की सटीकता को काफी कम कर देगा। ऑटोसहसंबंध आमतौर पर तब होता है जब अवशिष्ट त्रुटियों के बीच निर्भरता होती है।


application of linear regression in machine learning in Hindi


मशीन लर्निंग में लीनियर रिग्रेशन मॉडल का उपयोग करने का एक शीर्ष लाभ रुझानों की भविष्यवाणी करने और भविष्यवाणियां करने की क्षमता है जो व्यवहार्य हैं। डेटा वैज्ञानिक इन भविष्यवाणियों का उपयोग कर सकते हैं और मशीन लर्निंग के आधार पर और कटौती कर सकते हैं। यह त्वरित, कुशल और सटीक है। यह मुख्य रूप से है क्योंकि मशीनें बड़ी मात्रा में डेटा को संसाधित करती हैं और इसमें न्यूनतम मानवीय हस्तक्षेप होता है। एक बार एल्गोरिथम स्थापित हो जाने के बाद, सीखने की प्रक्रिया सरल हो जाती है।


छोटे व्यवसायों के लिए फायदेमंद [Beneficial to small businesses]

एक या दो चरों को बदलकर, मशीनें बिक्री पर पड़ने वाले प्रभाव को समझ सकती हैं। चूंकि रैखिक प्रतिगमन की तैनाती लागत प्रभावी है, इसलिए यह छोटे व्यवसायों के लिए बहुत फायदेमंद है क्योंकि बिक्री के समय लघु और दीर्घकालिक पूर्वानुमान किए जा सकते हैं। इसका मतलब है कि छोटे व्यवसाय अपने संसाधनों की अच्छी तरह से योजना बना सकते हैं और अपने लिए विकास पथ तैयार कर सकते हैं। उन्हें बाजार और उसकी प्राथमिकताओं को समझना होगा और आपूर्ति और मांग के बारे में सीखना होगा।


रणनीति तैयार करना [Preparing Strategies]

चूंकि मशीन लर्निंग भविष्यवाणी को सक्षम बनाता है, इसमें एक रैखिक प्रतिगमन मॉडल के सबसे बड़े लाभों में से एक किसी दिए गए स्थिति के लिए एक रणनीति तैयार करने की क्षमता है, और विभिन्न परिणामों का विश्लेषण करना है। पूर्वानुमान के प्रतिगमन मॉडल से सार्थक जानकारी प्राप्त की जा सकती है जिससे कंपनियों को रणनीतिक योजना बनाने और कार्यकारी निर्णय लेने में मदद मिलती है।

Thursday, March 10, 2022

back propagation algorithm in neural network Hindi

March 10, 2022 0
back propagation algorithm in neural network Hindi

What is Artificial Neural Networks in Hindi?

एक तंत्रिका नेटवर्क कनेक्टेड I/O इकाइयों का एक समूह है जहां प्रत्येक कनेक्शन का अपने कंप्यूटर प्रोग्राम से जुड़ा वजन होता है। यह आपको बड़े डेटाबेस से भविष्य कहनेवाला मॉडल बनाने में मदद करता है। यह मॉडल मानव तंत्रिका तंत्र पर बनाता है। यह आपको छवि समझ, मानव शिक्षा, कंप्यूटर भाषण आदि का संचालन करने में मदद करता है।


back propagation algorithm in neural network in Hindi

बैकप्रोपेगेशन तंत्रिका नेटवर्क प्रशिक्षण का सार है। यह पिछले युग (यानी, पुनरावृत्ति) में प्राप्त त्रुटि दर के आधार पर एक तंत्रिका नेटवर्क के वजन को ठीक करने की विधि है। वज़न की उचित ट्यूनिंग आपको त्रुटि दर को कम करने और इसके सामान्यीकरण को बढ़ाकर मॉडल को विश्वसनीय बनाने की अनुमति देती है।


तंत्रिका नेटवर्क में बैकप्रोपेगेशन "त्रुटियों के पिछड़े प्रसार" के लिए एक संक्षिप्त रूप है। यह कृत्रिम तंत्रिका नेटवर्क को प्रशिक्षित करने का एक मानक तरीका है। यह विधि नेटवर्क में सभी भारों के संबंध में हानि फ़ंक्शन के ग्रेडिएंट की गणना करने में मदद करती है।


Working For back propagation algorithm in neural network

तंत्रिका नेटवर्क में बैक प्रोपेगेशन एल्गोरिथम श्रृंखला नियम द्वारा एकल भार के लिए हानि फ़ंक्शन के ग्रेडिएंट की गणना करता है। यह एक देशी प्रत्यक्ष गणना के विपरीत, एक समय में एक परत की कुशलता से गणना करता है। यह ग्रेडिएंट की गणना करता है, लेकिन यह परिभाषित नहीं करता है कि ग्रेडिएंट का उपयोग कैसे किया जाता है। यह डेल्टा नियम में गणना को सामान्य करता है।


समझने के लिए निम्नलिखित बैक प्रोपेगेशन न्यूरल नेटवर्क उदाहरण आरेख पर विचार करें:


back propagation algorithm in neural network
back propagation algorithm in neural network



  • इनपुट एक्स, पहले से जुड़े पथ के माध्यम से पहुंचें
  • इनपुट को वास्तविक वज़न W का उपयोग करके तैयार किया जाता है। वज़न को आमतौर पर बेतरतीब ढंग से चुना जाता है।
  • इनपुट लेयर से लेकर हिडन लेयर्स तक, आउटपुट लेयर तक हर न्यूरॉन के आउटपुट की गणना करें।
  • आउटपुट में त्रुटि की गणना करें

ErrorB= Actual Output – Desired Output

  • वज़न को समायोजित करने के लिए आउटपुट लेयर से हिडन लेयर तक वापस यात्रा करें ताकि त्रुटि कम हो।

वांछित आउटपुट प्राप्त होने तक प्रक्रिया को दोहराते रहें


Need For back propagation algorithm in neural network

Backpropagation के सबसे प्रमुख लाभ हैं:


  • बैकप्रॉपैगैशन तेज, सरल और प्रोग्राम करने में आसान है
  • इसमें इनपुट की संख्या के अलावा ट्यून करने के लिए कोई पैरामीटर नहीं है
  • यह एक लचीला तरीका है क्योंकि इसमें नेटवर्क के बारे में पूर्व ज्ञान की आवश्यकता नहीं होती है
  • यह एक मानक विधि है जो आम तौर पर अच्छी तरह से काम करती है
  • इसे सीखने के लिए फ़ंक्शन की विशेषताओं के किसी विशेष उल्लेख की आवश्यकता नहीं है।

What is a Feed Forward Network in Hindi

फीडफॉरवर्ड न्यूरल नेटवर्क एक कृत्रिम तंत्रिका नेटवर्क है जहां नोड्स कभी भी एक चक्र नहीं बनाते हैं। इस प्रकार के तंत्रिका नेटवर्क में एक इनपुट परत, छिपी हुई परतें और एक आउटपुट परत होती है। यह कृत्रिम तंत्रिका नेटवर्क का पहला और सरलतम प्रकार है।


Types of Backpropagation Networks in Hindi

दो प्रकार के बैकप्रोपेगेशन नेटवर्क हैं:


  • Static Back-propagation
  • Recurrent Backpropagation

Static back-propagation:

यह एक तरह का बैकप्रोपेगेशन नेटवर्क है जो स्टैटिक आउटपुट के लिए स्टैटिक इनपुट की मैपिंग करता है। यह ऑप्टिकल कैरेक्टर रिकग्निशन जैसे स्थिर वर्गीकरण मुद्दों को हल करने के लिए उपयोगी है।


Recurrent Backpropagation:

डेटा माइनिंग में आवर्तक बैक प्रोपेगेशन को तब तक आगे बढ़ाया जाता है जब तक कि एक निश्चित मूल्य प्राप्त नहीं हो जाता। उसके बाद, त्रुटि की गणना की जाती है और पीछे की ओर प्रचारित की जाती है।


इन दोनों विधियों के बीच मुख्य अंतर यह है कि मानचित्रण स्थैतिक बैक-प्रोपेगेशन में तेजी से होता है जबकि यह आवर्तक बैकप्रोपेगेशन में नॉनस्टैटिक होता है।


History of back propagation algorithm in neural network

  • 1961 में, निरंतर बैकप्रोपेगेशन की मूल अवधारणा को जे. केली, हेनरी आर्थर और ई. ब्रायसन द्वारा नियंत्रण सिद्धांत के संदर्भ में प्राप्त किया गया था।
  • 1969 में, ब्रायसन और हो ने एक बहु-चरण गतिशील प्रणाली अनुकूलन विधि दी।
  • 1974 में, वर्बोस ने कृत्रिम तंत्रिका नेटवर्क में इस सिद्धांत को लागू करने की संभावना बताई।
  • 1982 में, हॉपफील्ड ने एक तंत्रिका नेटवर्क का अपना विचार लाया।
  • 1986 में, डेविड ई. रुमेलहार्ट, जेफ्री ई. हिंटन, रोनाल्ड जे. विलियम्स के प्रयास से, बैकप्रॉपैगैशन को मान्यता मिली।
  • 1993 में, वान पहले व्यक्ति थे जिन्होंने बैकप्रॉपैगेशन पद्धति की मदद से अंतर्राष्ट्रीय पैटर्न मान्यता प्रतियोगिता जीती।

Backpropagation Key Points

  • प्रशिक्षित नेटवर्क पर कम से कम प्रभाव डालने वाले तत्वों के भारित लिंक द्वारा नेटवर्क संरचना को सरल बनाता है
  • इनपुट और छिपी इकाई परतों के बीच संबंध विकसित करने के लिए आपको इनपुट और सक्रियण मूल्यों के समूह का अध्ययन करने की आवश्यकता है।
  • यह उस प्रभाव का आकलन करने में मदद करता है जो किसी दिए गए इनपुट चर का नेटवर्क आउटपुट पर होता है। इस विश्लेषण से प्राप्त ज्ञान को नियमों में दर्शाया जाना चाहिए।
  • बैकप्रोपेगेशन विशेष रूप से त्रुटि-प्रवण परियोजनाओं, जैसे छवि या वाक् पहचान पर काम करने वाले गहरे तंत्रिका नेटवर्क के लिए उपयोगी है।
  • बैकप्रोपेगेशन श्रृंखला का लाभ उठाता है और पावर नियम बैकप्रोपेगेशन को किसी भी आउटपुट के साथ कार्य करने की अनुमति देता है।


Best practice Backpropagation

तंत्रिका नेटवर्क में बैकप्रॉपैगैशन को "जूता फीता" सादृश्य की सहायता से समझाया जा सकता है


बहुत कम तनाव =

पर्याप्त विवश नहीं और बहुत ढीला

बहुत ज्यादा टेंशन =

बहुत अधिक बाधा (ओवरट्रेनिंग)

बहुत अधिक समय लेना (अपेक्षाकृत धीमी प्रक्रिया)

टूटने की अधिक संभावना

Pulling one lace more than other =

बेचैनी (पूर्वाग्रह)

Disadvantages of using Backpropagation

  • किसी विशिष्ट समस्या पर बैकप्रॉपैगैशन का वास्तविक प्रदर्शन इनपुट डेटा पर निर्भर करता है।
  • डेटा माइनिंग में बैक प्रोपेगेशन एल्गोरिथम शोर डेटा के प्रति काफी संवेदनशील हो सकता है
  • आपको मिनी-बैच के बजाय बैकप्रोपेगेशन के लिए मैट्रिक्स-आधारित दृष्टिकोण का उपयोग करने की आवश्यकता है।

Summary of back propagation algorithm in neural network

  • एक तंत्रिका नेटवर्क कनेक्टेड I/O इकाइयों का एक समूह है जहां प्रत्येक कनेक्शन का अपने कंप्यूटर प्रोग्राम से जुड़ा वजन होता है।
  • Backpropagation "त्रुटियों के पिछड़े प्रसार" के लिए एक संक्षिप्त रूप है। यह कृत्रिम तंत्रिका नेटवर्क को प्रशिक्षित करने का एक मानक तरीका है
  • मशीन लर्निंग में बैक प्रोपेगेशन एल्गोरिथम तेज, सरल और प्रोग्राम में आसान है
  • एक फीडफॉरवर्ड बीपीएन नेटवर्क एक कृत्रिम तंत्रिका नेटवर्क है।
  • दो प्रकार के बैकप्रोपेगेशन नेटवर्क हैं 1) स्टेटिक बैक-प्रोपेगेशन 2) आवर्तक बैकप्रोपेगेशन
  • 1961 में, निरंतर बैकप्रोपेगेशन की मूल अवधारणा को जे. केली, हेनरी आर्थर और ई. ब्रायसन द्वारा नियंत्रण सिद्धांत के संदर्भ में प्राप्त किया गया था।
  • डेटा माइनिंग में बैक प्रोपेगेशन भारित लिंक को हटाकर नेटवर्क संरचना को सरल बनाता है जिसका प्रशिक्षित नेटवर्क पर न्यूनतम प्रभाव पड़ता है।
  • यह विशेष रूप से छवि या भाषण पहचान जैसे त्रुटि-प्रवण परियोजनाओं पर काम करने वाले गहरे तंत्रिका नेटवर्क के लिए उपयोगी है।
  • Backpropagation का सबसे बड़ा दोष यह है कि यह शोर डेटा के लिए संवेदनशील हो सकता है।

Wednesday, March 31, 2021

What is k means clustering in hindi

March 31, 2021 0
What is k means clustering in hindi

K-Means clustering n ऑब्जेक्ट्स को k क्लस्टर्स में विभाजित करने का इरादा रखता है जिसमें प्रत्येक ऑब्जेक्ट निकटतम अर्थ के साथ क्लस्टर से संबंधित होता है। यह विधि सबसे अधिक संभव अंतर के बिल्कुल अलग समूहों का उत्पादन करती है। सबसे बड़ी पृथक्करण (दूरी) के लिए समूहों की सबसे अच्छी संख्या को प्राथमिकता के रूप में नहीं जाना जाता है और इसे डेटा से गणना की जानी चाहिए। K-Means क्लस्टरिंग का उद्देश्य कुल इंट्रा-क्लस्टर संस्करण को कम करना है, या, चुकता त्रुटि फ़ंक्शन:

K-Means Algorithm in Hindi


    डेटा को k समूहों में बाँटता है जहाँ k पूर्वनिर्धारित है।
    क्लस्टर केंद्रों के रूप में यादृच्छिक पर k अंक चुनें।
    यूक्लिडियन डिस्टेंस फंक्शन के अनुसार वस्तुओं को उनके निकटतम क्लस्टर सेंटर में असाइन करें।
    प्रत्येक क्लस्टर में सभी ऑब्जेक्ट्स के केंद्रक या माध्य की गणना करें।
    चरण 2, 3 और 4 को दोहराएं जब तक कि एक ही अंक लगातार दौर में प्रत्येक क्लस्टर को न सौंपा जाए।



 

k means clustering in hindi
k means clustering in hindi

के-मीन्स अपेक्षाकृत एक कुशल विधि है। हालांकि, हमें पहले से ही समूहों की संख्या निर्दिष्ट करने की आवश्यकता है, और अंतिम परिणाम आरंभीकरण के प्रति संवेदनशील हैं और अक्सर एक स्थानीय इष्टतम पर समाप्त होते हैं। दुर्भाग्य से समूहों की इष्टतम संख्या का पता लगाने के लिए कोई वैश्विक सैद्धांतिक विधि नहीं है। एक व्यावहारिक दृष्टिकोण विभिन्न रों के साथ कई रनों के परिणामों की तुलना करना है और पूर्वनिर्धारित मानदंड के आधार पर सबसे अच्छा चुनना है। सामान्य तौर पर, एक बड़ा k शायद error को कम करता है लेकिन ओवरफिटिंग का खतरा बढ़ जाता है।

Example for k means clustering in hindi 

 

k means algorithm in hindi
K means in hindi

 

k means clustering example
k means clustering example