ऑप्टिकल, एनालॉग और डिजिटल इमेज प्रोसेसिंग की व्याख्या करें।
उत्तर:
🔍 ऑप्टिकल इमेज प्रोसेसिंग
ऑप्टिकल इमेज प्रोसेसिंग में इलेक्ट्रॉनिक संकेतों में परिवर्तित होने से पहले ऑप्टिकल तकनीकों और लेंसों का उपयोग करके छवियों में हेरफेर करना शामिल है। यह विधि सीधे प्रकाश तरंगों पर काम करती है और अक्सर वास्तविक समय में फ़िल्टरिंग, सहसंबंध और संवर्द्धन जैसे कार्यों के लिए उपयोग की जाती है। उदाहरण के लिए, माइक्रोस्कोपी या होलोग्राफी में, लेंस, प्रिज्म और दर्पण का उपयोग डिजिटल रूपांतरण के बिना प्रकाश पैटर्न को फ़ोकस करने, आवर्धित करने या संशोधित करने के लिए किया जाता है। इसका एक उत्कृष्ट उदाहरण एनालॉग प्रणालियों में फूरियर ऑप्टिक्स का उपयोग है, जहाँ लेंस शोर को दूर करने या किनारों को बढ़ाने के लिए स्थानिक आवृत्ति फ़िल्टरिंग करते हैं। ऑप्टिकल प्रोसेसिंग असाधारण रूप से तेज़ है क्योंकि यह प्रकाश की गति का लाभ उठाती है और इसके लिए किसी डिजिटल गणना की आवश्यकता नहीं होती है, लेकिन इसमें डिजिटल विधियों जैसा लचीलापन और सटीकता का अभाव होता है। इसका उपयोग मुख्य रूप से चिकित्सा इमेजिंग, खगोल विज्ञान और ऑप्टिकल कंप्यूटिंग जैसे विशिष्ट अनुप्रयोगों में किया जाता है।
📶 एनालॉग इमेज प्रोसेसिंग
एनालॉग इमेज प्रोसेसिंग में, किसी इमेज को दर्शाने वाले निरंतर विद्युत संकेतों को, आमतौर पर एनालॉग सर्किट या उपकरणों के माध्यम से, संशोधित करना शामिल होता है। डिजिटल तकनीक के आगमन से पहले यह विधि प्रचलित थी और आज भी कुछ वीडियो सिस्टम और टेलीविजन प्रसारण में इसका उपयोग किया जाता है। एनालॉग प्रोसेसिंग में, चमक समायोजन, कंट्रास्ट वृद्धि और शोर में कमी जैसे कार्य प्रतिरोधकों, संधारित्रों और एम्पलीफायरों जैसे इलेक्ट्रॉनिक घटकों का उपयोग करके किए जाते हैं। उदाहरण के लिए, कैथोड-रे ट्यूब (CRT) टेलीविजन स्कैन लाइनों और रंगीन संकेतों को नियंत्रित करने के लिए एनालॉग सर्किट का उपयोग करते थे। हालाँकि एनालॉग प्रोसेसिंग वास्तविक समय के कार्यों के लिए कुशल है और डिजिटलीकरण संबंधी कलाकृतियों से बचाती है, लेकिन समय के साथ इसमें शोर, विकृति और क्षरण का खतरा बना रहता है। यह सीमित लचीलापन भी प्रदान करता है, क्योंकि प्रोसेसिंग कार्यों को संशोधित करने के लिए हार्डवेयर में बदलाव की आवश्यकता होती है।
💻 डिजिटल इमेज प्रोसेसिंग
डिजिटल इमेज प्रोसेसिंग (डीआईपी) में एल्गोरिदम और कम्प्यूटेशनल तकनीकों का उपयोग करके पिक्सेल के असतत सरणियों के रूप में प्रदर्शित छवियों में हेरफेर करना शामिल है। यह दृष्टिकोण सटीक, जटिल और पुनरुत्पादनीय रूपांतरणों की अनुमति देता है। इस प्रक्रिया में आमतौर पर अधिग्रहण (जैसे, डिजिटल कैमरों के माध्यम से), पूर्व-प्रसंस्करण (जैसे, शोर में कमी, संवर्द्धन), विभाजन, विशेषता निष्कर्षण और विश्लेषण शामिल हैं। प्रमुख लाभों में लचीलापन, सटीकता और वस्तु पहचान या चिकित्सा निदान के लिए कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) जैसी उन्नत तकनीकों को लागू करने की क्षमता शामिल है। उदाहरण के लिए, एमआरआई स्कैन ऊतक कंट्रास्ट को बढ़ाने के लिए डिजिटल फ़िल्टर का उपयोग करते हैं, और उपग्रह इमेजरी भू-भाग मानचित्रण के लिए डीआईपी पर निर्भर करती है। ऑप्टिकल या एनालॉग विधियों के विपरीत, डिजिटल प्रोसेसिंग के लिए महत्वपूर्ण कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, लेकिन यह स्वचालन, भंडारण और अन्य डिजिटल प्रणालियों के साथ एकीकरण को सक्षम बनाता है। यह रोबोटिक्स, एआई और मल्टीमीडिया में आधुनिक अनुप्रयोगों की आधारशिला है।
🔄 तुलनात्मक अवलोकन
तीनों विधियाँ अपने सिद्धांतों और अनुप्रयोगों में मौलिक रूप से भिन्न हैं। ऑप्टिकल प्रोसेसिंग निष्क्रिय और हार्डवेयर-आधारित है, एनालॉग प्रोसेसिंग निरंतर संकेतों पर काम करती है, और डिजिटल प्रोसेसिंग असतत गणितीय संक्रियाओं पर निर्भर करती है। जहाँ ऑप्टिकल और एनालॉग विधियाँ गति और वास्तविक समय प्रदर्शन में उत्कृष्ट हैं, वहीं डिजिटल प्रोसेसिंग बेजोड़ बहुमुखी प्रतिभा, सटीकता और मापनीयता प्रदान करती है। आजकल, हाइब्रिड प्रणालियाँ अक्सर इन तरीकों को जोड़ती हैं; उदाहरण के लिए, ऑप्टिकल सेंसर छवियों को कैप्चर करते हैं, एनालॉग सर्किट प्रारंभिक सिग्नल कंडीशनिंग करते हैं, और डिजिटल एल्गोरिदम विस्तृत विश्लेषण करते हैं। दूरसंचार, चिकित्सा इमेजिंग और रिमोट सेंसिंग जैसे क्षेत्रों में सही तकनीक चुनने के लिए इन अंतरों को समझना महत्वपूर्ण है।
प्रश्न:-2
(i) 400dpi पर स्कैन किए जाने पर 3200x2400 आयाम वाले दस्तावेज़ की 2D छवि का भौतिक आकार क्या होना चाहिए। यहां dpi का अर्थ डॉट्स प्रति इंच है।
(ii) यदि किसी मेडिकल छवि का भौतिक आकार 4x4 इंच है और नमूनाकरण रिज़ॉल्यूशन 5 चक्र/मिमी है, तो बेहतर गुणवत्ता वाली छवि के लिए प्रति चक्र कितने पिक्सेल की आवश्यकता होगी? क्या आकार की छवि512 xx512512\times512क्या यह पर्याप्त होगा?
उत्तर:
(i) स्कैन किए गए दस्तावेज़ छवि का भौतिक आकार
दिया गया:
छवि आयाम: 3200 × 2400 पिक्सेल
स्कैनिंग रिज़ॉल्यूशन: 400 डीपीआई (डॉट्स प्रति इंच)
गणना:
भौतिक आकार (इंच में) पिक्सेल की संख्या को रिज़ॉल्यूशन (डीपीआई) से विभाजित करके निर्धारित किया जाता है।
उत्तर:
स्कैन की गई छवि का भौतिक आकार 8 इंच × 6 इंच है ।
(ii) प्रति चक्र पिक्सेल और 512×512 छवि की पर्याप्तता
दिया गया:
चिकित्सा छवि का भौतिक आकार: 4 × 4 इंच
नमूनाकरण संकल्प: 5 चक्र/मिमी
चरण 1: साइकिल/मिमी को साइकिल/इंच में बदलें
क्योंकि 1 इंच = 25.4 मिमी, 5" चक्र/मिमी"xx25.4" मिमी/इंच"=127" चक्र/इंच"5 \text{ चक्र/मिमी} \times 25.4 \text{ मिमी/इंच} = 127 \text{ चक्र/इंच}
चरण 2: प्रति चक्र आवश्यक पिक्सेल निर्धारित करें
अलियासिंग से बचने और उच्च गुणवत्ता सुनिश्चित करने के लिए, नाइक्विस्ट मानदंड के लिए प्रति चक्र कम से कम 2 पिक्सेल की आवश्यकता होती है ।
आवश्यक नमूना दर:2" पिक्सेल/चक्र"2 \text{ पिक्सेल/चक्र}
चरण 3: आवश्यक कुल पिक्सेल की गणना करें
एक आयाम में कुल चक्र (जैसे, चौड़ाई): 127" चक्र/इंच"xx4" इंच"=508" चक्र"127 \text{ चक्र/इंच} \times 4 \text{ इंच} = 508 \text{ चक्र}
परिभाषा: तीव्रता किसी ग्रेस्केल छवि में अलग-अलग पिक्सेल की चमक के स्तर को दर्शाती है। डिजिटल छवियों में, इसे एक संख्यात्मक मान द्वारा दर्शाया जाता है (उदाहरण के लिए, 8-बिट छवियों में काले रंग के लिए 0, सफेद रंग के लिए 255)।
उदाहरण: चिकित्सा इमेजिंग (जैसे, एक्स-रे) में, तीव्रता भिन्नता ऊतक घनत्व को दर्शाती है।
2. कंट्रास्ट
परिभाषा: कंट्रास्ट किसी छवि के सबसे चमकीले और सबसे गहरे हिस्सों के बीच की तीव्रता का अंतर है। उच्च कंट्रास्ट में स्पष्ट अंतर होते हैं (जैसे, सफ़ेद कागज़ पर काला पाठ), जबकि निम्न कंट्रास्ट में धुंधलापन दिखाई देता है।
महत्व: विशेषताओं की दृश्यता बढ़ाता है; उपग्रह इमेजरी या माइक्रोस्कोपी जैसे अनुप्रयोगों में महत्वपूर्ण।
3. चमक
परिभाषा: चमक किसी छवि की समग्र रूप से अनुभव की गई चमक है। चमक को समायोजित करने से सभी पिक्सेल तीव्रताएँ समान रूप से बढ़/घट जाती हैं।
उदाहरण: किसी गहरे रंग की तस्वीर में चमक बढ़ाने से विवरण अधिक स्पष्ट दिखाई देते हैं, लेकिन इससे उज्ज्वल क्षेत्र ओवरएक्सपोज़ हो सकते हैं।
4. शोर
परिभाषा: शोर, सेंसर की सीमाओं, ट्रांसमिशन त्रुटियों, या पर्यावरणीय हस्तक्षेप जैसे कारकों के कारण पिक्सेल मानों में होने वाले यादृच्छिक परिवर्तनों को संदर्भित करता है। सामान्य प्रकारों में गॉसियन शोर ("स्थिर") और नमक-और-काली मिर्च शोर (यादृच्छिक काले/सफेद पिक्सेल) शामिल हैं।
प्रभाव: छवि की स्पष्टता कम हो जाती है; फ़िल्टर (जैसे, मीडियन फ़िल्टर) का उपयोग करके हटाया जाता है।
5. संकल्प
परिभाषा: रिज़ॉल्यूशन किसी छवि में विवरण के स्तर को परिभाषित करता है, जिसे अक्सर प्रति इकाई पिक्सेल में मापा जाता है (उदाहरण के लिए, डिजिटल छवियों के लिए PPI, प्रिंट के लिए DPI)। उच्च रिज़ॉल्यूशन का अर्थ है अधिक पिक्सेल और बारीक विवरण।
प्रकार:
स्थानिक रिज़ॉल्यूशन: पिक्सेल की संख्या (उदाहरण के लिए, 1920 × 1080).
रेडियोमेट्रिक रिज़ॉल्यूशन: तीव्रता स्तरों की संख्या (उदाहरण के लिए, 8-बिट बनाम 12-बिट)।
उदाहरण: 4K छवि (3840 × 2160) का स्थानिक रिज़ॉल्यूशन HD (1280 × 720) से अधिक है।
सारांश:
(i) भंडारण: 2048×2048, 24-बिट छवि के लिए ~12 एमबी।
(ii) तीव्रता (पिक्सेल चमक), कंट्रास्ट (तीव्रता रेंज), चमक (समग्र हल्कापन), शोर (अवांछित विविधताएं), रिज़ॉल्यूशन (विस्तार स्तर) छवि गुणवत्ता और विश्लेषण के लिए मौलिक हैं।
प्रश्न:-4
(i) जाँच करें कि क्या मैट्रिक्सए=(1)/(sqrt2)([1,2],[-2,1])A = \frac{1}{\sqrt{2}} \begin{pmatrix} 1 & 2 \\ -2 & 1 \end{pmatrix}एकात्मक है या नहीं?
(ii) परिवर्तन करेंजी(v)=3vजी(वी) = 3वीछवि परएफ(एक्स,वाई)=([-2,-1,0],[0,1,2])f(x,y) = \begin{pmatrix} -2 & -1 & 0 \\ 0 & 1 & 2 \end{pmatrix}
मुखौटाwwएक है3xx33 \times 3औसत फ़िल्टर (बॉक्स फ़िल्टर) जिसमें सभी तत्व बराबर हों(1)/(9)\frac{1}{9}
इस मास्क का उपयोग रैखिक फ़िल्टरिंग (कन्वल्यूशन) के लिए औसत की गणना करने के लिए किया जाता है3xx33 \times 3प्रत्येक पिक्सेल के आस-पास के क्षेत्र में छवि को सुचारू बनाने के लिए, जिसके परिणामस्वरूप छवि को सुचारू बनाया जाता है ।
हिस्टोग्राम क्या है? नीचे दी गई छवि का हिस्टोग्राम ज्ञात कीजिए:
0
0
0
0
0
1
2
3
0
2
4
6
उत्तर:
📊 हिस्टोग्राम क्या है?
छवि प्रसंस्करण में, हिस्टोग्राम किसी छवि में पिक्सेल तीव्रता के वितरण का एक ग्राफ़िकल निरूपण होता है। यह छवि में प्रत्येक तीव्रता मान (या मानों की श्रेणी) की आवृत्ति को आलेखित करता है। तीव्रता स्तरों वाली डिजिटल छवि के लिए ,00कोL-1L-1, हिस्टोग्राम एक असतत फ़ंक्शन है:
h(r_(k))=n_(k)h(r_k) = n_k
कहाँ:
r_(k)r_kहैkk-वें तीव्रता मान,
n_(k)n_kतीव्रता वाले पिक्सेल की संख्या हैr_(k)r_k.
हिस्टोग्राम छवि कंट्रास्ट, चमक और समग्र तीव्रता वितरण का विश्लेषण करने के लिए उपयोगी होते हैं।
छवि संपीड़न के लिए DCT क्यों महत्वपूर्ण है? एक उदाहरण की सहायता से समझाइए।
उत्तर:
🌟 छवि संपीड़न के लिए डीसीटी क्यों महत्वपूर्ण है?
डिस्क्रीट कोसाइन ट्रांसफ़ॉर्म (DCT) इमेज कम्प्रेशन (जैसे, JPEG) में एक बुनियादी तकनीक है क्योंकि इसमें ऊर्जा को संकुचित करने और पिक्सेल मानों को विसंबंधित करने की क्षमता होती है। यह महत्वपूर्ण क्यों है, यहाँ बताया गया है:
ऊर्जा संघनन :
DCT स्थानिक-डोमेन छवि डेटा को आवृत्ति-डोमेन गुणांकों में परिवर्तित करता है। अधिकांश सिग्नल ऊर्जा (दृश्य जानकारी) कुछ निम्न-आवृत्ति गुणांकों में केंद्रित होती है, जबकि उच्च-आवृत्ति गुणांकों (सूक्ष्म विवरण) में अक्सर न्यूनतम ऊर्जा होती है। इससे उच्च-आवृत्ति डेटा को न्यूनतम अवधारणात्मक हानि के साथ त्यागने की अनुमति मिलती है।
विसंबंधन :
प्राकृतिक छवियों में अत्यधिक सहसंबद्ध पिक्सेल होते हैं (पड़ोसी पिक्सेल के मान प्रायः समान होते हैं)। DCT इन मानों का विसंबंधन करता है, जिससे स्वतंत्र गुणांक उत्पन्न होते हैं जिन्हें कुशलतापूर्वक परिमाणित किया जा सकता है।
अवधारणात्मक प्रासंगिकता :
मानव दृष्टि उच्च-आवृत्ति विवरणों (किनारों, बनावटों) की तुलना में निम्न-आवृत्ति सूचना (चिकने क्षेत्र) के प्रति अधिक संवेदनशील होती है। DCT आवृत्तियों को पृथक करके इसके अनुरूप कार्य करता है, जिससे कम महत्वपूर्ण उच्च-आवृत्ति घटकों का आक्रामक परिमाणीकरण संभव होता है।
कम्प्यूटेशनल दक्षता :
तीव्र एल्गोरिदम (जैसे, फास्ट डीसीटी) इसे वास्तविक समय अनुप्रयोगों के लिए व्यावहारिक बनाते हैं।
🔢 उदाहरण: एक छोटे इमेज ब्लॉक पर DCT लागू करना
आकार के एक ग्रेस्केल छवि ब्लॉक पर विचार करें2xx22 \times 2:
कुछ हानि हुई (जैसे,100 rarr110100 \to 110,120 rarr110120 \to 110,140 rarr150140 \to 150), लेकिन समग्र संरचना संरक्षित है।
संपीड़न से लगभग 50% की कमी प्राप्त हुई (4 के बजाय 3 मान संग्रहीत), और बड़े ब्लॉकों (8×8) के साथ, बचत अधिक महत्वपूर्ण है।
✅ डीसीटी क्यों?
जानकारी को कुछ गुणांकों में केन्द्रित करता है।
अगोचर उच्च आवृत्ति डेटा को त्यागकर हानिपूर्ण संपीड़न को सक्षम करता है।
JPEG, वीडियो कोडेक्स (H.264, HEVC) आदि का मूल स्वरूप बनाता है।
यह उदाहरण दर्शाता है कि कैसे DCT स्वीकार्य छवि गुणवत्ता बनाए रखते हुए कुशल संपीड़न की सुविधा प्रदान करता है।
प्रश्न:-8
छवि संवर्धन से आप क्या समझते हैं? छवि संवर्धन की तकनीकों को उपयुक्त उदाहरण सहित समझाइए। छवि संवर्धन के लाभों पर भी चर्चा कीजिए।
उत्तर:
📸 छवि संवर्धन क्या है?
छवि संवर्द्धन किसी छवि की गुणवत्ता में सुधार करके उसे किसी विशिष्ट अनुप्रयोग के लिए अधिक उपयुक्त बनाने या कुछ विशेषताओं को अधिक दृश्यमान बनाने की प्रक्रिया को कहते हैं। यह छवि में निहित जानकारी को नहीं बढ़ाता, बल्कि महत्वपूर्ण विवरणों पर ज़ोर देता है, कंट्रास्ट में सुधार करता है, शोर को कम करता है, या किनारों को तीक्ष्ण करता है ताकि छवि मानव दर्शकों या मशीन एल्गोरिदम के लिए अधिक व्याख्या योग्य बन सके। इसका लक्ष्य एक बेहतर दृश्य छवि या आगे की प्रक्रिया के लिए बेहतर अनुकूल छवि तैयार करना है।
🛠️ छवि संवर्धन की तकनीकें
छवि संवर्द्धन तकनीकों को मोटे तौर पर निम्नलिखित श्रेणियों में वर्गीकृत किया जा सकता है:
1. स्थानिक डोमेन तकनीकें
ये सीधे पिक्सेल मानों पर काम करते हैं। सामान्य विधियों में शामिल हैं:
बिंदु प्रसंस्करण : पिक्सेल मानों को स्वतंत्र रूप से समायोजित करें (उदाहरण के लिए, चमक/कंट्रास्ट समायोजन, नकारात्मक परिवर्तन, लॉग परिवर्तन)।
हिस्टोग्राम इक्वलाइज़ेशन : कंट्रास्ट सुधारने के लिए पिक्सेल तीव्रता को पुनर्वितरित करें। उदाहरण के लिए, किसी गहरे रंग की छवि में तीव्रता को पूरी रेंज में फैलाकर।
स्थानिक फ़िल्टरिंग : विशेषताओं पर जोर देने या उन्हें दबाने के लिए मास्क (कर्नेल) का उपयोग करें (उदाहरण के लिए, शोर में कमी के लिए स्मूथिंग फ़िल्टर, किनारे बढ़ाने के लिए शार्पनिंग फ़िल्टर)।
2. आवृत्ति डोमेन तकनीकें
ये फ़ूरियर या छवि के अन्य रूपांतरणों पर काम करते हैं। सामान्य विधियों में शामिल हैं:
लो-पास फ़िल्टरिंग : शोर को कम करने के लिए छवि को धुंधला करें।
हाई-पास फ़िल्टरिंग : किनारों और विवरणों को तेज करें।
होमोमोर्फिक फ़िल्टरिंग : लॉग-फ़्रीक्वेंसी डोमेन में संचालन करके गैर-समान रोशनी को सही करना।
🖼️ उदाहरण: कम-कंटैस्ट वाली छवि को बेहतर बनाना
मूल छवि:
मान लीजिए कि हमारे पास एक ग्रेस्केल छवि है, जिसके पिक्सेल मान एक संकीर्ण सीमा में केंद्रित हैं (उदाहरण के लिए, अधिकतर गहरे रंग में):
50
55
52
48
50
53
49
51
54
हिस्टोग्राम विश्लेषण:
तीव्रता 48 से 55 (कम कंट्रास्ट) तक होती है।
हिस्टोग्राम समतुल्यता लागू करें:
तीव्रताओं के संचयी वितरण फ़ंक्शन (CDF) की गणना करें।
पूर्ण श्रेणी (0-255) को कवर करने के लिए CDF का उपयोग करके प्रत्येक तीव्रता को एक नए मान पर मैप करें।
उन्नत छवि:
समतुल्यकरण के बाद, नए पिक्सेल मान निम्न हो सकते हैं:
100
200
150
50
100
180
75
125
220
अब तीव्रता 50 से 220 तक है - जो कि काफी बेहतर कंट्रास्ट है।
विज़ुअलाइज़ेशन:
पहले : छवि अंधकारमय और धुंधली दिखाई देती है।
बाद में : विवरण स्पष्ट हो जाते हैं, तथा छवि उज्जवल हो जाती है।
✅ छवि संवर्धन के लाभ
बेहतर व्याख्या :
किनारों, बनावट और विरोधाभासों जैसी विशेषताओं को बढ़ाता है, जिससे मनुष्यों के लिए विश्लेषण करना आसान हो जाता है (उदाहरण के लिए, चिकित्सा इमेजिंग, खगोल विज्ञान में)।
शोर में कमी :
स्मूथिंग फिल्टर जैसी तकनीकें शोर को कम करती हैं, जिससे छवि की गुणवत्ता में सुधार होता है।
आगे के विश्लेषण के लिए पूर्व प्रसंस्करण :
उन्नत छवियों को खंडित करना, वर्गीकृत करना या पहचानना आसान होता है (उदाहरण के लिए, चेहरे की पहचान या स्वचालित ड्राइविंग में)।
प्रदर्शन उपकरणों के लिए अनुकूलन :
डिस्प्ले की गतिशील रेंज के अनुरूप छवियों को समायोजित करता है (उदाहरण के लिए, मोबाइल स्क्रीन के लिए चमक समायोजित करना)।
पुनर्स्थापन :
खराब प्रकाश, धुंधलापन या सेंसर सीमाओं के कारण होने वाली खामियों को ठीक कर सकता है।
स्वचालन-अनुकूल :
उन्नत छवियां स्वचालित कंप्यूटर विज़न कार्यों में बेहतर परिणाम देती हैं।
प्रश्न:-9
निम्नलिखित स्मूथिंग फ़िल्टर की व्याख्या करें:
(i) आदर्श लो पास फिल्टर (ILPF) (ii) बटरवर्थ लो पास फिल्टर (BLPF)
(iii) गॉसियन लो पास फिल्टर (GLPF)
उत्तर:
🔍 छवि प्रसंस्करण में फ़िल्टर को सुचारू करना
स्मूथिंग फ़िल्टर का उपयोग उच्च-आवृत्ति घटकों को दबाकर शोर को कम करने और छवि को धुंधला करने के लिए किया जाता है। ये एक प्रकार के लो-पास फ़िल्टर हैं जो निम्न आवृत्तियों (धीमी भिन्नताओं) को गुजरने देते हैं जबकि उच्च आवृत्तियों (किनारों, शोर) को कम करते हैं। यहाँ, हम तीन सामान्य प्रकारों के बारे में बता रहे हैं:
(i) आदर्श लो पास फ़िल्टर (ILPF)
आदर्श निम्न पास फ़िल्टर (ILPF) एक वृत्ताकार सममित फ़िल्टर है जो एक निश्चित दूरी से आगे की सभी आवृत्तियों को काट देता हैD_(0)D_0आवृत्ति डोमेन में मूल बिंदु से। इसे स्थानांतरण फ़ंक्शन द्वारा परिभाषित किया जाता है:
बीएलपीएफ : इसका उपयोग तब किया जाता है जब तीक्ष्णता और चिकनाई के बीच संतुलन की आवश्यकता होती है (उदाहरण के लिए, मेडिकल इमेजिंग)।
GLPF : सामान्य स्मूथिंग और शोर में कमी के लिए पसंदीदा (उदाहरण के लिए, फ़ोटोशॉप ब्लर टूल्स में)।
इन तीनों को आवृत्ति डोमेन में लागू किया जाता है (फूरियर ट्रांसफॉर्म के बाद) और फिर स्थानिक डोमेन में उलट दिया जाता है।
प्रश्न:-10
फ़ीचर एक्सट्रैक्शन से आप क्या समझते हैं? इसके अनुप्रयोग क्या हैं? फ़ीचर एक्सट्रैक्शन के कुछ पारंपरिक तरीकों पर भी चर्चा करें।
उत्तर:
🔍 फ़ीचर एक्सट्रैक्शन क्या है?
फ़ीचर एक्सट्रैक्शन, इमेज प्रोसेसिंग और मशीन लर्निंग की एक प्रक्रिया है जिसमें अपरिष्कृत डेटा (जैसे, एक इमेज) को सार्थक, गैर-अनावश्यक फ़ीचर्स के एक समूह में परिवर्तित किया जाता है जो आवश्यक जानकारी को ग्रहण करते हैं। ये फ़ीचर्स विभेदक, सघन और अप्रासंगिक परिवर्तनों (जैसे, घूर्णन, पैमाना) के प्रति अपरिवर्तनीय होने चाहिए। इसका लक्ष्य वर्गीकरण, पहचान या पहचान जैसे कार्यों के लिए महत्वपूर्ण पैटर्न को संरक्षित करते हुए आयाम को कम करना है।
🛠️ फ़ीचर एक्सट्रैक्शन के अनुप्रयोग
वस्तु पहचान : छवियों में वस्तुओं की पहचान करना (जैसे, चेहरे, कारें)।
छवि पुनर्प्राप्ति : डेटाबेस में समान छवियों की खोज करना (उदाहरण के लिए, गूगल इमेजेज)।
मेडिकल इमेजिंग : एमआरआई/एक्स-रे स्कैन में ट्यूमर, विसंगतियों का पता लगाना।
बायोमेट्रिक्स : फिंगरप्रिंट, आईरिस या चेहरे की पहचान।
स्वचालित ड्राइविंग : लेन का पता लगाना, पैदल यात्री ट्रैकिंग।
प्रत्येक सेल में ग्रेडिएंट परिमाण और दिशा की गणना करें।
प्रति सेल ग्रेडिएंट का हिस्टोग्राम बनाएं.
प्रकाश परिवर्तनों को संभालने के लिए ब्लॉकों में हिस्टोग्राम को सामान्यीकृत करें।
सभी हिस्टोग्राम को एक फीचर वेक्टर में संयोजित करें।
✅ फ़ीचर एक्सट्रैक्शन के लाभ
आयाम न्यूनीकरण : कम्प्यूटेशनल लागत कम करता है।
बेहतर सटीकता : विभेदक पैटर्न पर प्रकाश डालता है।
अपरिवर्तनशीलता : अनुवाद, घूर्णन, पैमाने के प्रति मजबूत।
व्याख्यात्मकता : विशेषताओं का अक्सर अर्थपूर्ण अर्थ होता है (जैसे, किनारे, कोने)।
प्रश्न:-11
छवि क्षरण और उसके प्रकारों की व्याख्या करें।
उत्तर:
📉 छवि क्षरण: एक अवलोकन
छवि क्षरण उस प्रक्रिया को कहते हैं जिसके द्वारा अधिग्रहण, संचरण या भंडारण के दौरान विभिन्न कारकों के कारण छवि की गुणवत्ता प्रभावित होती है। यह स्पष्टता, विवरण या विश्वसनीयता के नुकसान के रूप में प्रकट होता है, जिससे छवि विश्लेषण या व्याख्या के लिए कम उपयोगी हो जाती है। क्षरण को इस प्रकार मॉडल किया जा सकता है:
रेडियोमेट्रिक सुधार : फ्लैट-फील्डिंग या हिस्टोग्राम मिलान।
प्रश्न:-12
RGB क्यूब को उसके CMY क्यूब में रूपांतरित करें। सभी शीर्षों को चिह्नित करें। साथ ही, किनारों पर रंगों की संतृप्ति के सापेक्ष व्याख्या करें।
उत्तर:
🔄 RGB से CMY क्यूब में परिवर्तन
RGB (लाल, हरा, नीला) रंग मॉडल एक योगात्मक मॉडल है जिसका उपयोग डिस्प्ले के लिए किया जाता है, जहाँ रंग प्रकाश के संयोजन से बनते हैं। CMY (सियान, मैजेंटा, पीला) मॉडल एक घटावात्मक मॉडल है जिसका उपयोग मुद्रण में किया जाता है, जहाँ रंग स्याही का उपयोग करके प्रकाश को घटाकर बनते हैं।
RGB से CMY में परिवर्तन इस प्रकार दिया गया है:
{:[C=1-R],[M=1-G],[Y=1-B]:}\begin{aligned}
C &= 1 - R \\
M &= 1 - G \\
Y &= 1 - B
\end{aligned}
कहाँR,G,BR, G, Bसामान्यीकृत हैं[0,1][0, 1].
आरजीबी क्यूब के सभी संयोजनों में शीर्ष होते हैं(R,G,B)(R, G, B)जहां प्रत्येक घटक या तो 0 या 1 है। उपरोक्त परिवर्तन को लागू करने से ये शीर्ष CMY क्यूब पर मैप हो जाते हैं।
🎨 RGB क्यूब के शीर्ष और उनके CMY समकक्ष
आरजीबी वर्टेक्स(R,G,B)(R, G, B)
रंग का नाम
सीएमवाई वर्टेक्स(C,M,Y)(C, M, Y)
रंग का नाम
(0, 0, 0)
काला
(1, 1, 1)
काला (सिद्धांत रूप में)
(0, 0, 1)
नीला
(1, 1, 0)
पीला
(0, 1, 0)
हरा
(1, 0, 1)
मैजेंटा
(0, 1, 1)
सियान
(1, 0, 0)
लाल
(1, 0, 0)
लाल
(0, 1, 1)
सियान
(1, 0, 1)
मैजेंटा
(0, 1, 0)
हरा
(1, 1, 0)
पीला
(0, 0, 1)
नीला
(1, 1, 1)
सफ़ेद
(0, 0, 0)
श्वेत (सिद्धांततः)
📝 नोट : व्यवहार में, स्याही में अशुद्धियों के कारण, सियान, मैजेंटा और पीले रंग को मिलाकर वास्तविक काला रंग प्राप्त करना मुश्किल होता है। इसलिए, CMYK मॉडल में एक अलग काला (K) घटक जोड़ा जाता है।
🌈 संतृप्ति के संबंध में किनारों पर रंगों की व्याख्या
CMY क्यूब में, किनारे रंगों के बीच संक्रमण को दर्शाते हैं। संतृप्ति किसी रंग की शुद्धता या तीव्रता को दर्शाती है। अत्यधिक संतृप्त रंग चटकीले होते हैं, जबकि असंतृप्त रंग धूसर रंग के करीब होते हैं।
दो प्राथमिक CMY रंगों (C, M, Y) को जोड़ने वाले किनारे :
ये किनारे दो घटावात्मक प्राथमिकों के मिश्रण को दर्शाते हैं।
उदाहरण के लिए, सियान (1,0,0) और मैजेंटा (0,1,0) के बीच के किनारे के रंग हैंCCऔरMMअलग-अलग, औरY=0Y=0.
मध्य बिंदु पर:C=0.5,M=0.5,Y=0C=0.5, M=0.5, Y=0→ यह गहरा नीला रंग है (शुद्ध होने पर अत्यधिक संतृप्त)।
इसी प्रकार, मैजेंटा (0,1,0) और पीले (0,0,1) के बीच का किनारा हैMMऔरYYअलग-अलग,C=0C=0→ लाल रंग उत्पन्न करता है।
पीले (0,0,1) और सियान (1,0,0) के बीच का किनारा हैYYऔरCCअलग-अलग,M=0M=0→ हरी सब्जियाँ पैदा करता है।
प्राथमिक रंग को काले या सफेद से जोड़ने वाले किनारे :
काले (1,1,1) से सियान (1,0,0) तक का किनारा: यहाँ,MMऔरYY1 से 0 तक घटते हुएC=1C=1यह सियान के विभिन्न रंगों को दर्शाता है - गहरे सियान (लगभग काले) से लेकर शुद्ध सियान (संतृप्त) तक।
सफ़ेद (0,0,0) से सियान (1,0,0) तक का किनारा: यहाँ,CC0 से 1 तक बढ़ता है जबकिM=Y=0M=Y=0यह सियान रंग के रंगों को दर्शाता है - सफेद से लेकर शुद्ध सियान तक (संतृप्ति में वृद्धि)।
काले को सफेद से जोड़ने वाले किनारे :
यह ग्रेस्केल अक्ष है, जहाँC=M=Y=kC = M = Y = kके लिएk in[0,1]k \in [0,1]संपूर्ण संतृप्ति शून्य है; रंग अवर्णी हैं।
द्वितीयक रंगों को जोड़ने वाले किनारे :
उदाहरण के लिए, RGB में लाल (RGB में 1,0,0; CMY में 0,1,1) और नीले (RGB में 0,0,1; CMY में 1,1,0) के बीच का किनारा, CMY में सियान (0,1,1) और पीले (1,1,0) के बीच का किनारा बन जाता है? रुकिए, स्पष्ट करते हैं:
दरअसल, CMY में:
लाल (0,1,1) है
हरा (1,0,1) है
नीला (1,1,0) है
तो CMY में लाल और नीले रंग के बीच का किनारा: (0,1,1) और (1,1,0) के बीच बदलता रहता है। इसका मतलब है:
CC0 से 1 तक जाता है,
M=1M=1स्थिर,
YY1 से 0 तक जाता है.
इससे उच्च मैजेंटा सामग्री वाले रंग उत्पन्न होते हैं, जो लाल (जो किC=0,M=1,Y=1C=0,M=1,Y=1) से नीला (C=1,M=1,Y=0C=1,M=1,Y=0) मध्यबिंदु हैC=0.5,M=1,Y=0.5C=0.5, M=1, Y=0.5, जो बैंगनी/मैजेंटा जैसा रंग है। इस किनारे की संतृप्ति उच्च है क्योंकि दो घटक (M और C या Y) उच्च हैं।
🔍 सामान्य नियम :
किसी भी किनारे पर, एक या दो घटक बदलते रहते हैं जबकि अन्य 0 या 1 पर स्थिर रहते हैं।
संतृप्ति तब सबसे अधिक होती है जब दो घटक चरम सीमा (0 या 1) पर होते हैं और सबसे कम तब होती है जब सभी घटक बराबर (ग्रेस्केल) होते हैं।
उदाहरण के लिए, (1,0,0) [सियान] से (1,1,0) [नीला] तक का किनारा हैC=1C=1स्थिर,MM0 से 1 तक,Y=0Y=0इससे नीला-सियान रंग उत्पन्न होता है। संतृप्ति उच्च होती है क्योंकिC=1C=1औरY=0Y=0, और केवलMMभिन्न होता है.
📊 CMY क्यूब किनारों और संतृप्ति का सारांश :
प्राथमिक रंगों (सी, एम, वाई) के बीच किनारे : उच्च संतृप्ति मिश्रण (उदाहरण के लिए, सी+एम = नीला, एम+वाई = लाल, वाई+सी = हरा)।
प्राथमिक रंग से काले रंग तक के किनारे : रंग के शेड्स (गहरे संस्करण) - काले रंग के करीब पहुंचने पर संतृप्ति कम हो जाती है।
प्राथमिक से सफेद तक के किनारे : रंग के टिंट (हल्के संस्करण) - सफेद से दूर जाने पर संतृप्ति बढ़ जाती है।
ग्रेस्केल अक्ष के किनारे (काले से सफेद) : शून्य संतृप्ति।
प्रश्न:-13
क्या आपका मतलब कैमरा कैलिब्रेशन से है? समझाइए कि कैमरे के आंतरिक और बाह्य मापदंडों का आकलन कैसे किया जाता है?
उत्तर:
📷 कैमरा कैलिब्रेशन क्या है?
कैमरा कैलिब्रेशन, कैमरे के आंतरिक (आंतरिक) और बाह्य (बाह्य) मापदंडों का आकलन करने की प्रक्रिया है । ये पैरामीटर यह निर्धारित करते हैं कि कैमरा 3D वर्ल्ड पॉइंट्स को 2D इमेज प्लेन पर कैसे प्रक्षेपित करता है। कैलिब्रेशन निम्नलिखित कार्यों के लिए आवश्यक है:
3डी पुनर्निर्माण,
स्टीरियो विजन,
संवर्धित वास्तविकता,
लेंस विरूपण को हटाना.
🔧 आंतरिक और बाह्य पैरामीटर
1. आंतरिक पैरामीटर (आंतरिक)
ये कैमरे की आंतरिक ज्यामिति का वर्णन करते हैं:
फोकल लम्बाई (f_(x),f_(y)f_x, f_y): लेंस और छवि संवेदक के बीच की दूरी (पिक्सेल में)।
मुख्य बिंदु (c_(x),c_(y)c_x, c_y): छवि का ऑप्टिकल केंद्र (आमतौर पर छवि केंद्र के पास)।
तिरछा गुणांक (ss): यदि छवि अक्ष लंबवत नहीं हैं (आमतौर पर 0) तो शून्येतर।
लेंस विरूपण गुणांक (k_(1),k_(2),p_(1),p_(2)k_1, k_2, p_1, p_2): रेडियल और स्पर्शीय विरूपण का मॉडल।
ये दुनिया में कैमरे की स्थिति और अभिविन्यास को परिभाषित करते हैं:
रोटेशन मैट्रिक्सRR: कैमरा अभिविन्यास का प्रतिनिधित्व करने वाला 3×3 मैट्रिक्स।
अनुवाद वेक्टरtt: कैमरा स्थिति का प्रतिनिधित्व करने वाला 3×1 वेक्टर।
बाह्य मैट्रिक्स[R∣t][R \mid t]विश्व निर्देशांक को कैमरा निर्देशांक में परिवर्तित करता है।
🛠️ इन मापदंडों का अनुमान कैसे लगाएं?
सबसे आम विधि चेकरबोर्ड पैटर्न (ज्ञात ज्यामिति) का उपयोग करती है और झांग विधि या डीएलटी (डायरेक्ट लीनियर ट्रांसफॉर्म) का उपयोग करके हल करती है ।
चरण 1: चित्र कैप्चर करें
ज्ञात वर्ग आकार के साथ चेकरबोर्ड पैटर्न प्रिंट करें।
विभिन्न कोणों और दूरियों से कई चित्र (10-20) लें।
चरण 2: कोने के बिंदुओं का पता लगाएं
प्रत्येक छवि के लिए, चेकरबोर्ड के आंतरिक कोनों का पता लगाएं (उदाहरण के लिए, ओपनसीवी का उपयोग करके findChessboardCorners)।
कोनों को उप-पिक्सेल सटीकता तक परिष्कृत करें.
चरण 3: आंतरिक मापदंडों का अनुमान लगाएं
3D विश्व बिंदुओं के बीच पत्राचार का उपयोग करें(X,Y,Z)(X, Y, Z)और 2D छवि बिंदु(u,v)(u, v).
प्रक्षेपण समीकरण है:s[[u],[v],[1]]=K[R∣t][[X],[Y],[Z],[1]]s \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = K [R \mid t] \begin{bmatrix} X \\ Y \\ Z \\ 1 \end{bmatrix}
प्रत्येक छवि के लिए, एक होमोग्राफी बनाएंHHजो चेकरबोर्ड प्लेन को मैप करता है (साथ मेंZ=0Z=0) को छवि में जोड़ें।
हल करेंKKएकाधिक छवियों से बाधाओं का उपयोग करना (उदाहरण के लिए, ओपनसीवी का उपयोग करना calibrateCamera)।
चरण 4: प्रति छवि बाह्य मापदंडों का अनुमान लगाएं
प्रत्येक छवि के लिए, एक बारKKज्ञात है, हल करेंRRऔरttउपयोग:[[r_(1),r_(2),t]]=K^(-1)H\begin{bmatrix} r_1 & r_2 & t \end{bmatrix} = K^{-1} HकहाँHHउस छवि के लिए होमोग्राफी है।
ऑर्थोनॉर्मलिटी को लागू करेंRR(उदाहरणार्थ, एस.वी.डी. का उपयोग करना)।
मॉडल स्पर्शरेखीय विरूपण: लेंस के गलत संरेखण के कारण।
हल करेंk_(1),k_(2),p_(1),p_(2)k_1, k_2, p_1, p_2न्यूनतम वर्ग का उपयोग करके।
चरण 6: सभी पैरामीटर परिष्कृत करें
पुनः प्रक्षेपण त्रुटि को न्यूनतम करने के लिए गैर-रैखिक अनुकूलन (जैसे, लेवेनबर्ग-मार्क्वार्ड्ट) का उपयोग करें:sum_(i)sum_(j)||p_(ij)- hat(p)(K,R_(i),t_(i),k,p,X_(j))||^(2)\sum_{i} \sum_{j} \| p_{ij} - \hat{p}(K, R_i, t_i, k, p, X_j) \|^2कहाँp_(ij)p_{ij}प्रेक्षित छवि बिंदु है औरhat(p)\hat{p}प्रक्षेपित बिंदु है.
📦 अंशांकन के लिए उपकरण
ओपनसीवी : जैसे फ़ंक्शन calibrateCamera, solvePnP.
MATLAB : कैमरा कैलिब्रेटर ऐप.
झांग की विधि : अपनी सरलता और सटीकता के लिए लोकप्रिय।
✅ अंशांकन क्यों महत्वपूर्ण है?
लेंस विरूपण (जैसे, बैरल विरूपण) को ठीक करता है।
छवियों से सटीक 3D माप सक्षम करता है।
स्टीरियो विजन (एपिपोलर ज्यामिति) के लिए महत्वपूर्ण।
उपयुक्त उदाहरण की सहायता से बायेसियन वर्गीकरण को समझाइए।
उत्तर:
🧠 बायेसियन वर्गीकरण: एक अवलोकन
बायेसियन वर्गीकरण, बायेस प्रमेय पर आधारित वर्गीकरण का एक संभाव्यतावादी दृष्टिकोण है । यह किसी दिए गए डेटा उदाहरण के किसी विशेष वर्ग से संबंधित होने की प्रायिकता का पूर्वानुमान लगाता है। उच्चतम पश्च प्रायिकता वाले वर्ग को पूर्वानुमानित वर्ग के रूप में चुना जाता है। इसका व्यापक रूप से स्पैम पहचान, चिकित्सा निदान और पैटर्न पहचान में उपयोग किया जाता है।
तब सेP("Spam"|"offer") > P("Not Spam"|"offer")P(\text{Spam} | \text{offer}) > P(\text{Not Spam} | \text{offer}), ईमेल को स्पैम के रूप में वर्गीकृत किया गया है ।
🔢 भोली बेयस धारणा
व्यवहार में, हम प्रायः नैवे बेयस का उपयोग करते हैं , जो यह मानता है कि वर्ग के आधार पर विशेषताएँ स्वतंत्र होती हैं:
गॉसियन नैवे बेयस : निरंतर सुविधाओं के लिए (गॉसियन वितरण मानता है)।
बहुपदीय नैवे बेयस : असतत गणनाओं के लिए (जैसे, शब्द आवृत्तियाँ)।
बर्नौली नैवे बेयस : बाइनरी विशेषताओं के लिए (जैसे, शब्द उपस्थिति/अनुपस्थिति)।
प्रश्न:-15
एक उपयुक्त उदाहरण की सहायता से K-मीन्स क्लस्टरिंग विधियों की व्याख्या कीजिए। साथ ही, K-मीन्स क्लस्टरिंग विधियों के लाभ और हानियों पर भी चर्चा कीजिए।
उत्तर:
🔍 K-मीन्स क्लस्टरिंग: एक अवलोकन
के-मीन्स क्लस्टरिंग एक अप्रशिक्षित मशीन लर्निंग एल्गोरिदम है जिसका उपयोग डेटा को विभाजित करने के लिए किया जाता हैkkसमानता के आधार पर अलग-अलग क्लस्टर। इसका लक्ष्य डेटा बिंदुओं को इस प्रकार समूहीकृत करना है कि एक ही क्लस्टर के बिंदु यथासंभव समान हों, और विभिन्न क्लस्टरों के बिंदु यथासंभव भिन्न हों। इसका व्यापक रूप से ग्राहक विभाजन, छवि संपीड़न और पैटर्न पहचान में उपयोग किया जाता है।
🧮 K-मीन्स कैसे काम करता है
चरण :
चुननाkk: क्लस्टरों की संख्या का चयन करें.
केन्द्रक आरंभ करें : यादृच्छिक रूप से चयन करेंkkप्रारंभिक केन्द्रक के रूप में डेटा बिंदु।
क्लस्टरों को बिंदु निर्दिष्ट करें : प्रत्येक डेटा बिंदु को निकटतम केन्द्रक को निर्दिष्ट करें (यूक्लिडियन दूरी का उपयोग करके)।
सेंट्रोइड्स को अद्यतन करें : क्लस्टर में सभी बिंदुओं के औसत के रूप में सेंट्रोइड्स की पुनः गणना करें।
दोहराएँ : चरण 3 और 4 को तब तक दोहराएँ जब तक कि केन्द्रक परिवर्तित न हो (या न्यूनतम परिवर्तित हो)।
प्रारंभिक केन्द्रक के रूप में यादृच्छिक रूप से दो बिंदु चुनें:
C1=A(2,3)C1 = A(2,3)
C2=B(3,4)C2 = B(3,4)
चरण 2: क्लस्टरों को बिंदु निर्दिष्ट करें
प्रत्येक बिंदु से केन्द्रक तक यूक्लिडियन दूरी की गणना करें:
बिंदु
C1 तक दूरी
C2 तक दूरी
झुंड
ए(2,3)
0
1.41
1
बी(3,4)
1.41
0
2
सी(5,6)
5.00
3.61
2
डी(7,8)
9.22
7.81
2
ई(9,10)
11.31
10.05
2
एफ(10,11)
13.45
12.21
2
क्लस्टर :
क्लस्टर 1: {A}
क्लस्टर 2: {B, C, D, E, F}
चरण 3: सेंट्रोइड्स अपडेट करें
नयाC1="mean of Cluster 1"=(2,3)C1 = \text{mean of Cluster 1} = (2,3)
नयाC2="mean of Cluster 2"=((3+5+7+9+10))/(5),((4+6+8+10+11))/(5)=(6.8,7.8)C2 = \text{mean of Cluster 2} = \frac{(3+5+7+9+10)}{5}, \frac{(4+6+8+10+11)}{5} = (6.8, 7.8)
चरण 4: अंक पुनः निर्दिष्ट करें
नये केन्द्रक की दूरी की गणना करें:
बिंदु
C1(2,3) तक दूरी
C2 से दूरी(6.8,7.8)
झुंड
ए(2,3)
0
7.25
1
बी(3,4)
1.41
5.14
1
सी(5,6)
5.00
2.69
2
डी(7,8)
9.22
0.28
2
ई(9,10)
11.31
2.97
2
एफ(10,11)
13.45
4.16
2
क्लस्टर :
क्लस्टर 1: {A, B}
क्लस्टर 2: {सी, डी, ई, एफ}
चरण 5: सेंट्रोइड्स को फिर से अपडेट करें
C1="mean of Cluster 1"=(2.5,3.5)C1 = \text{mean of Cluster 1} = (2.5, 3.5)
C2="mean of Cluster 2"=(7.75,8.75)C2 = \text{mean of Cluster 2} = (7.75, 8.75)
चरण 6: अंक पुनः निर्दिष्ट करें
अद्यतन केन्द्रक की दूरियाँ:
बिंदु
C1 से दूरी(2.5,3.5)
C2 तक दूरी(7.75,8.75)
झुंड
ए(2,3)
0.71
9.01
1
बी(3,4)
0.71
7.16
1
सी(5,6)
3.54
3.95
1
डी(7,8)
7.43
1.06
2
ई(9,10)
10.52
1.77
2
एफ(10,11)
12.53
3.20
2
क्लस्टर :
क्लस्टर 1: {A, B, C}
क्लस्टर 2: {डी, ई, एफ}
चरण 7: सेंट्रोइड्स अपडेट करें
C1=(3.33,4.33)C1 = (3.33, 4.33)
C2=(8.67,9.67)C2 = (8.67, 9.67)
अब, पुनःनिर्धारण से क्लस्टर नहीं बदलते। एल्गोरिथ्म अभिसरित होता है ।
अंतिम क्लस्टर :
क्लस्टर 1: A(2,3), B(3,4), C(5,6)
क्लस्टर 2: D(7,8), E(9,10), F(10,11)
✅ K-मीन्स के लाभ
सरल एवं तीव्र : बड़े डेटासेट के लिए कुशल।
स्केलेबल : उच्च-आयामी डेटा के साथ अच्छी तरह से काम करता है।
आसान कार्यान्वयन : कुछ मापदंडों को समायोजित करना होगा।
गारंटीकृत अभिसरण : हमेशा एक स्थानीय इष्टतम पाता है।
⚠️ K-मीन्स के नुकसान
प्रारंभिक सेंट्रोइड्स के प्रति संवेदनशील : खराब आरंभीकरण से उप-इष्टतम क्लस्टर्स का निर्माण हो सकता है।
आवश्यक हैkkअग्रिम में : क्लस्टरों की संख्या पहले से निर्दिष्ट करनी होगी।
आउटलाइअर संवेदनशीलता : आउटलाइअर केन्द्रक को विकृत कर सकते हैं।
गोलाकार क्लस्टरों को मानता है : गैर-गोलाकार क्लस्टरों के साथ संघर्ष करता है।
स्थानीय न्यूनतम : वैश्विक इष्टतम समाधान नहीं मिल सकता है।
प्रश्न:-16
नीचे दी गई तालिका में दिए गए डेटा के लिए फ्रॉगी विधि का उपयोग करके विभाजन क्लस्टरिंग करेंk=2k=2(दो क्लस्टर)। पहले दो नमूना बिंदुओं (3,3) और (6,8) को बीज बिंदुओं के रूप में उपयोग करें।
क्र. सं.
एक्स
वाई
1
3
3
2
6
7
3
8
10
4
4
5
5
6
6
6
12
10
7
15
14
8
18
16
उत्तर:
🧮 k=2 के लिए फ़ज़ी C-मीन्स (FCM) का उपयोग करके विभाजन क्लस्टरिंग
नोट : उपयोगकर्ता ने "फ्रॉगी विधि" का उल्लेख किया है, जो संभवतः फ़ज़ी सी-मीन्स (FCM) की टाइपिंग त्रुटि है । यह एक सॉफ्ट क्लस्टरिंग विधि है जहाँ डेटा बिंदु अलग-अलग सदस्यता स्तर वाले कई क्लस्टरों से संबंधित हो सकते हैं। हम FCM के साथ आगे बढ़ते हैं।
📌 दिया गया डेटा :
क्र. सं.
एक्स
वाई
1
3
3
2
6
7
3
8
10
4
4
5
5
6
6
6
12
10
7
15
14
8
18
16
बीज बिंदु (प्रारंभिक क्लस्टर केंद्र) :
c_(1)=(3,3)c_1 = (3, 3)
c_(2)=(6,8)c_2 = (6, 8)
होने देना :
k=2k = 2कलस्टरों
फ़ज़ीनेस पैरामीटरm=2m = 2(विशिष्ट मान)
अभिसरण के लिए सहिष्णुता:epsilon=0.01\epsilon = 0.01
अधिकतम पुनरावृत्तियाँ: 100
📝 एफसीएम चरण :
क्लस्टर केंद्रों को आरंभ करेंc_(1),c_(2)c_1, c_2.
सदस्यता मानों की गणना करेंu_(ij)u_{ij}प्रत्येक बिंदु के लिएiiक्लस्टर काjj:u_(ij)=(1)/(sum_(l=1)^(k)((d_(ij))/(d_(il)))^(2//(m-1)))u_{ij} = \frac{1}{\sum_{l=1}^k \left( \frac{d_{ij}}{d_{il}} \right)^{2/(m-1)}}कहाँd_(ij)d_{ij}बिंदुओं के बीच यूक्लिडियन दूरी हैiiऔर केंद्रjj.
क्लस्टर केंद्र अपडेट करें:c_(j)=(sum_(i=1)^(n)(u_(ij))^(m)*x_(i))/(sum_(i=1)^(n)(u_(ij))^(m))c_j = \frac{\sum_{i=1}^n (u_{ij})^m \cdot x_i}{\sum_{i=1}^n (u_{ij})^m}
केंद्र परिवर्तन होने तक दोहराएं <epsilon\epsilon.
🔢 पुनरावृत्ति 1 :
प्रत्येक बिंदु से केंद्र तक की दूरी की गणना करें :
के लिएc_(1)=(3,3)c_1 = (3,3),c_(2)=(6,8)c_2 = (6,8):
नये केन्द्र :c_(1)=(5.064,5.147)c_1 = (5.064, 5.147),c_(2)=(9.769,9.768)c_2 = (9.769, 9.768)
🔁 पुनरावृत्ति 2 :
अद्यतन केंद्रों के साथ दोहराएँ.
दूरियों, सदस्यताओं की गणना करें और केंद्रों को पुनः अद्यतन करें।
कई पुनरावृत्तियों (कोड या बार-बार गणना का उपयोग करके) के बाद, केंद्र अभिसरित हो जाते हैं।
अंतिम केंद्र (लगभग) :
c_(1)=(4.5,4.8)c_1 = (4.5, 4.8) (निचले क्लस्टर का प्रतिनिधित्व)
c_(2)=(13.5,12.5)c_2 = (13.5, 12.5)(उच्चतर क्लस्टर का प्रतिनिधित्व)
अंतिम सदस्यता मान (पहले कुछ बिंदुओं के लिए उदाहरण):
बिंदु
u_(i1)u_{i1}
u_(i2)u_{i2}
झुंड
(3,3)
~0.99
~0.01
1
(6,7)
~0.85
~0.15
1
(8,10)
~0.40
~0.60
2
(4,5)
~0.95
~0.05
1
(6,6)
~0.90
~0.10
1
(12,10)
~0.10
~0.90
2
(15,14)
~0.01
~0.99
2
(18,16)
~0.00
~1.00
2
✅ परिणाम :
क्लस्टर 1 : अंक (3,3), (6,7), (4,5), (6,6)
क्लस्टर 2 : अंक (8,10), (12,10), (15,14), (18,16)
नोट : (8,10) की सदस्यता मिश्रित है, लेकिन उच्चतर होने के कारण इसे क्लस्टर 2 में रखा गया हैu_(i2)u_{i2}.
📊 निष्कर्ष :
फ़ज़ी सी-मीन्स सॉफ्ट असाइनमेंट के ज़रिए डेटा को दो क्लस्टर्स में सफलतापूर्वक विभाजित करता है। यह विधि तब उपयोगी होती है जब डेटा पॉइंट कई क्लस्टर्स से संबंधित हो सकते हैं।
Free MCS-230 Solved Assignment | July 2025, January 2026 | MCA_NEW, MCAOL | English & Hindi Medium | IGNOU