भाषा चुनें

ऑप्टिकल कैमरा कम्युनिकेशन और फोटोग्रामेट्री आधारित वायरलेस नेटवर्क एप्लिकेशन लोकेशन तकनीक

एक मास्टर थीसिस जो इनडोर/वाहन-माउंटेड हाइब्रिड पोजिशनिंग सिस्टम की खोज करती है, जो डेटा ट्रांसमिशन के लिए ऑप्टिकल कैमरा कम्युनिकेशन (OCC) और त्रि-आयामी स्थान निर्धारण के लिए फोटोग्रामेट्री को जोड़ती है।
rgbcw.org | PDF Size: 3.0 MB
रेटिंग: 4.5/5
आपकी रेटिंग
आपने इस दस्तावेज़ को पहले ही रेट कर दिया है
PDF दस्तावेज़ कवर - ऑप्टिकल कैमरा कम्युनिकेशन और फोटोग्रामेट्री पर आधारित वायरलेस नेटवर्क अनुप्रयोग स्थिति निर्धारण तकनीक

1. परिचय

यह शोध प्रबंध, जो Md. Tanvir Hossan द्वारा 2018 में नेशनल यूनिवर्सिटी को प्रस्तुत किया गया था, ऑप्टिकल कैमरा कम्युनिकेशन (OCC) और फोटोग्रामेट्री के सहयोगात्मक संयोजन के माध्यम से स्थान निर्धारण हासिल करने की एक नई पद्धति की जांच करता है। इसका मूल आधार पारंपरिक रेडियो फ्रीक्वेंसी (RF) आधारित प्रणालियों (जैसे GPS और Wi-Fi) की सीमाओं को दूर करना है, विशेष रूप से इनडोर या घने शहरी कैन्यन जैसे चुनौतीपूर्ण वातावरणों में।

1.1 परिचय

इस शोध का प्रेरणा स्रोत इंटरनेट ऑफ थिंग्स (IoT), स्वायत्त वाहनों और स्मार्ट सिटी अनुप्रयोगों में सटीक, विश्वसनीय और कम बुनियादी ढांचे वाली पोजिशनिंग प्रणालियों की बढ़ती मांग है।

1.2 स्थिति निर्धारण का महत्व

सटीक स्थान जानकारी आधुनिक संदर्भ-जागरूक सेवाओं का एक मौलिक सक्षम कारक है।

1.2.1 इनडोर स्थिति निर्धारण

GPS सिग्नल इनडोर वातावरण में गंभीर रूप से क्षीण हो जाते हैं, जिससे मीटर-स्तरीय त्रुटियाँ या पूर्ण विफलता होती है। अन्य RF-आधारित प्रणालियाँ (Wi-Fi, ब्लूटूथ) बहुपथ प्रसार से प्रभावित होती हैं और इन्हें व्यापक फिंगरप्रिंटिंग या सघन बुनियादी ढाँचे की तैनाती की आवश्यकता होती है।

1.2.2 वाहन स्थान निर्धारण

स्वचालित ड्राइविंग और वाहन-से-सब कुछ (V2X) संचार के लिए, सेंटीमीटर-स्तरीय सटीकता महत्वपूर्ण है। केवल GPS पर्याप्त नहीं है क्योंकि सिग्नल अवरोध और वायुमंडलीय त्रुटियाँ मौजूद हैं। कैमरों और लिडार के साथ सेंसर फ्यूजन आम है, लेकिन इसकी कम्प्यूटेशनल लागत अधिक है।

1.3 OCC और फोटोग्रामेट्री में स्थान निर्धारण की नवीनता

प्रस्तावित संकर विधि में प्रकाश उत्सर्जक डायोड (LED) और कैमरों के दोहरे उपयोग का परिचय दिया गया है:

  • OCC (डेटा लिंक): LED मॉड्यूलेटेड प्रकाश के माध्यम से पहचान कोड या डेटा (जैसे, ज्ञात 3D निर्देशांक) संचारित करता है, जिसे कैमरा द्वारा कैप्चर किया जाता है। यह एक मजबूत, लाइसेंस-मुक्त, उच्च सिग्नल-टू-नॉइज़ अनुपात वाला संचार चैनल प्रदान करता है जो आरएफ हस्तक्षेप से प्रभावित नहीं होता है।
  • फोटोग्रामेट्री (पोजिशनिंग इंजन): त्रि-आयामी पुनर्निर्माण के लिए एक ही कैमरा छवि का उपयोग करता है। द्वि-आयामी छवि में ज्ञात LED लैंडमार्क (OCC द्वारा डिकोड किए गए ID के माध्यम से) की पहचान करके, प्रोजेक्शन ज्योमेट्री सिद्धांतों का उपयोग करके कैमरे की स्थिति और अभिविन्यास (पोज़) की गणना की जा सकती है।

इस संयोजन ने एक स्व-निहित प्रणाली बनाई है जहाँ लैंडमार्क अपनी पहचान और स्थिति का प्रसारण करते हैं, जिससे स्थान निर्धारण प्रक्रिया सरल हो जाती है।

1.4 योगदान

यह शोध पत्र दावा करता है कि इसने इस विशिष्ट संकर वास्तुकला का प्रस्ताव करने, संबंधित डेटा डिकोडिंग और पोज़ अनुमान एल्गोरिदम विकसित करने, और इनडोर तथा वाहन-माउंटेड परिदृश्यों में इसके प्रदर्शन को मान्य करने में योगदान दिया है।

1.5 शोधपत्र संरचना

इस दस्तावेज़ की संरचना में संबंधित शोध, प्रस्तावित सिस्टम मॉडल, प्रदर्शन विश्लेषण और निष्कर्ष जैसे अध्याय शामिल हैं।

2. संबंधित शोध का स्थान निर्धारण

2.1 प्रस्तावना

यह अध्याय मौजूदा स्थानीयकरण तकनीकों का सिंहावलोकन प्रस्तुत करता है, प्रस्तावित विधि के लाभों को उजागर करने के लिए एक आधार रेखा स्थापित करता है। इसमें रेडियो फ्रीक्वेंसी-आधारित विधियाँ (GPS, Wi-Fi RTT, UWB), विज़ुअल-आधारित विधियाँ (मोनोकुलर/SLAM, मार्कर-आधारित AR) और लिडार तथा शुद्ध दृश्यमान प्रकाश स्थानीयकरण (VLP) जैसी अन्य ऑप्टिकल विधियाँ शामिल हो सकती हैं।

तकनीकी तुलना

GPS: लगभग 10 मीटर सटीकता, इनडोर कार्य नहीं करता।

Wi-Fi फिंगरप्रिंटिंग: लगभग 2-5 मीटर, कैलिब्रेशन की आवश्यकता है।

UWB: लगभग 10-30 सेंटीमीटर, लागत अधिक है।

प्रस्तावित OCC+फोटोग्रामेट्री: लक्ष्य सब-मीटर स्तर का है, अवसंरचना आवश्यकता कम है।

मुख्य अंतर्दृष्टि

  • द्वि-मोडल सहयोग: OCC ने फोटोग्रामेट्री के लैंडमार्क पहचान समस्या का समाधान किया, जबकि फोटोग्रामेट्री ने सटीक ज्यामितीय जानकारी प्रदान की।
  • हल्का बुनियादी ढांचा: मौजूदा या आसानी से तैनात किए जा सकने वाले LED का उपयोग करके, सघन एंटीना सरणियों से बचा जाता है।
  • हस्तक्षेप प्रतिरोध: प्रकाश संकेत अस्पताल या विमानों में महत्वपूर्ण रेडियो फ्रीक्वेंसी प्रणालियों में हस्तक्षेप नहीं करते हैं।
  • गोपनीयता और सुरक्षा: यह स्वभाव से दिशात्मक और दृष्टि-रेखा तक सीमित है, जो सर्वदिशात्मक रेडियो फ्रीक्वेंसी की तुलना में बेहतर गोपनीयता प्रदान करता है।

मूल विश्लेषण एवं समीक्षा

मुख्य अंतर्दृष्टि: यह शोध पत्र केवल एक और स्थान-निर्धारण पत्र नहीं है; यह एक सरल "हैक" है जो स्मार्टफोन के सबसे सर्वव्यापी सेंसर - कैमरे - को एक एकीकृत रेडियो रिसीवर और माप उपकरण के रूप में पुनः उपयोग करता है। वास्तविक नवाचार प्रकाश मॉड्यूलेशन का उपयोग करके डिजिटल "नाम पट्ट" को भौतिक लैंडमार्क में एम्बेड करना है, जो पारंपरिक दृश्य स्थान-निर्धारण (जैसे Google की Visual Positioning Service) से जुड़ी जटिल कंप्यूटर विज़न समस्याओं - फीचर मिलान और डेटाबेस लुकअप - को चतुराई से दरकिनार कर देता है। यह एक निष्क्रिय प्रकाश स्रोत को एक सक्रिय, स्व-पहचान करने वाले बीकन में बदल देता है।

तार्किक प्रवाह और लाभ: तर्क स्पष्ट और संक्षिप्त है। सिस्टम प्रक्रिया - फ्रेम कैप्चर करना, OCC ID डिकोड करना, ज्ञात 3D निर्देशांक पुनर्प्राप्त करना, परिप्रेक्ष्य-n-बिंदु (PnP) समस्या को हल करना - एक साफ, रैखिक पाइपलाइन है। इसके लाभ विशिष्ट अनुप्रयोग परिदृश्यों में स्पष्ट हैं: उदाहरण के लिए, एक गोदाम रोबोट मॉड्यूलेटेड एलईडी चैनल लाइट के नीचे नेविगेट कर रहा है, या एक ड्रोन एन्कोडेड एलईडी मार्कर वाले हैंगर में डॉक कर रहा है। आधुनिक वातावरण में आरएफ शोर के प्रति इसकी उच्च प्रतिरोधक क्षमता IEEE 802.15.7r1 OCC मानकीकरण कार्य समूह के अध्ययन द्वारा रेखांकित की गई है, जिसने विद्युत चुम्बकीय रूप से संवेदनशील क्षेत्रों में इसकी उपयोगिता पर प्रकाश डाला है। शुद्ध VLP सिस्टम की तुलना में, जो केवल प्राप्त सिग्नल शक्ति (RSS) या आगमन कोण (AoA) का उपयोग करते हैं और परिवेशी प्रकाश शोर से प्रभावित होते हैं, यह संकर दृष्टिकोण छवि की ज्यामिति का लाभ उठाता है और तीव्रता में उतार-चढ़ाव के प्रति अधिक मजबूत है।

दोष और महत्वपूर्ण अंतराल: हालाँकि, यह विधि मौलिक रूप से प्रकाशिकी के नियमों द्वारा सीमित है। प्रत्यक्ष दृष्टि रेखा (LoS) की आवश्यकता इसकी घातक कमजोरी है, जो इसे अव्यवस्थित या गैर-दृष्टि रेखा (NLoS) वातावरण में अनुपयोगी बना देती है - यह आरएफ की दीवारों को भेदने की क्षमता के विपरीत है। प्रभावी सीमा कैमरा रिज़ॉल्यूशन और एलईडी चमक द्वारा सीमित है; आप स्मार्टफोन कैमरे से 200 मीटर दूर वाहन को ट्रैक नहीं कर सकते। इसके अलावा, उच्च परिवेशी प्रकाश (धूप) में या कैमरा मोशन ब्लर होने पर सिस्टम प्रदर्शन तेजी से गिर जाता है, जबकि आरएफ सिस्टम इन मुद्दों को काफी हद तक नजरअंदाज कर सकते हैं। शोध पत्र वास्तविक समय छवि प्रसंस्करण और OCC डिकोडिंग की कम्प्यूटेशनल विलंबता को नजरअंदाज कर सकता है, जो उच्च गति वाहन अनुप्रयोगों के लिए अस्वीकार्य हो सकता है। यह एक बहुत ही विशिष्ट, सीमित समस्या के लिए एक उच्च परिशुद्धता समाधान है।

कार्रवाई योग्य अंतर्दृष्टि: व्यवसायियों के लिए, यह कार्य "स्मार्ट" वातावरणों को डिजाइन करने के लिए एक खाका है। कार्रवाई योग्य निहितार्थ यह है कि स्थान निर्धारण को शुरू से ही LED प्रकाश व्यवस्था के बुनियादी ढांचे के डिजाइन में शामिल किया जाना चाहिए - मानकीकृत मॉड्यूलेशन योजनाओं का उपयोग करके, जैसे कि IEEE 802.15.7 का ऑप्टिकल कैमरा कम्युनिकेशन (OCC)। भविष्य GPS या 5G स्थान निर्धारण को बदलने में नहीं, बल्कि इसमें हैवृद्धिउनके लिए सबसे व्यावहारिक मार्ग सेंसर फ्यूज़न है: IMU और GPS मोटे, हमेशा उपलब्ध अनुमान प्रदान करते हैं, जबकि OCC-फोटोग्रामेट्री सिस्टम कैमरा द्वारा बीकन देखे जाने पर उच्च-सटीक सुधार प्रदान करता है। यह हाइब्रिड सेंसर फ्यूज़न दृष्टिकोण स्वायत्त ड्राइविंग प्रणालियों में नवीनतम स्थानीयकरण अनुसंधान का केंद्रीय विषय है, जैसा कि NVIDIA DRIVE जैसे प्लेटफार्मों में दिखाया गया है।

तकनीकी विवरण और गणितीय सूत्र

मूल गणितीय समस्या परिप्रेक्ष्य n बिंदु (PnP) समस्या है। दिया गया:

  • विश्व समन्वय प्रणाली में $n$ 3D बिंदुओं का एक सेट: $\mathbf{P}_i = (X_i, Y_i, Z_i)^T$, OCC द्वारा डिकोड किए गए LED ID से प्राप्त।
  • छवि तल में उनके संगत 2D प्रक्षेपण: $\mathbf{p}_i = (u_i, v_i)^T$।
  • कैमरे का आंतरिक पैरामीटर मैट्रिक्स $\mathbf{K}$ (कैलिब्रेशन से)।

कैमरा रोटेशन $\mathbf{R}$ और ट्रांसलेशन $\mathbf{t}$ को निम्नलिखित शर्तों को पूरा करते हुए ज्ञात कीजिए:

$\mathbf{p}_i = \mathbf{K} [\mathbf{R} | \mathbf{t}] \mathbf{P}_i$

$n \geq 4$ (गैर-अध:पतन विन्यास में) के लिए, EPnP या IPPE जैसे एल्गोरिदम का उपयोग करके कुशलतापूर्वक हल किया जा सकता है। OCC घटक में छवि में प्रत्येक LED स्पॉट के आसपास के रुचि क्षेत्र (ROI) से प्रकाश तीव्रता सिग्नल को डिमॉड्यूलेट करना शामिल है। यह आमतौर पर ऑन-ऑफ कीइंग (OOK) या वेरिएबल पल्स पोजीशन मॉड्यूलेशन (VPPM) का उपयोग करता है। सिग्नल प्रोसेसिंग चेन में पृष्ठभूमि को हटाने, सिंक्रनाइज़ेशन और डिकोडिंग के लिए फ्रेम अंतर शामिल है।

प्रयोगात्मक परिणाम और प्रदर्शन

पेपर संरचना और समान कार्यों के आधार पर, प्रयोगात्मक खंड नियंत्रित प्रयोगशाला सेटिंग और अनुकरण वाहन परिदृश्यों में सिस्टम को मान्य कर सकता है।

चार्ट विवरण (अनुमानित): एक बार चार्ट विभिन्न प्रणालियों की स्थिति त्रुटि (सेंटीमीटर में) की तुलना करता है: Wi-Fi RSSI, लो-पावर ब्लूटूथ (BLE), शुद्ध VLP (RSS का उपयोग करके), और प्रस्तावित OCC+फोटोग्रामेट्री विधि। OCC+फोटोग्रामेट्री का बार काफी छोटा होगा, जो 30 सेंटीमीटर से कम सटीकता दर्शाता है, जबकि अन्य विधियाँ 1-5 मीटर त्रुटि दिखाती हैं। दूसरा लाइन चार्ट संभवतः त्रुटि को LED लैंडमार्क से दूरी के फलन के रूप में दिखाता है, त्रुटि डिज़ाइन कार्य सीमा (जैसे 5-10 मीटर) के भीतर धीरे-धीरे बढ़ती है लेकिन एक मीटर से नीचे बनी रहती है।

रिपोर्ट के प्रमुख मेट्रिक्स:

  • स्थिति सटीकता: स्थिति का रूट मीन स्क्वायर एरर (RMSE), अच्छी परिस्थितियों में 10-30 सेंटीमीटर की सीमा में हो सकता है।
  • OCC डिकोडिंग सफलता दर: सही ढंग से डिकोड किए गए LED ID के फ्रेम का प्रतिशत, जो एक्सपोज़र समय, फ्रेम रेट और मॉड्यूलेशन आवृत्ति पर निर्भर करता है।
  • प्रोसेसिंग विलंबता: छवि कैप्चर से लेकर पोज़ अनुमान तक का समय, जो रियल-टाइम अनुप्रयोगों के लिए महत्वपूर्ण है।
  • परिवेशी प्रकाश के प्रति रोबस्टनेस: विभिन्न प्रकाश स्थितियों में प्रदर्शन गिरावट।

विश्लेषणात्मक ढांचा: संकल्पनात्मक केस

परिदृश्य: स्मार्ट वेयरहाउस इन्वेंट्री रोबोट।

1. समस्या: एक रोबोट को किसी विशिष्ट शेल्फ (गलियारा 5, स्थान 12) पर सेंटीमीटर-स्तरीय सटीकता के साथ नेविगेट करके वस्तुओं को स्कैन करने की आवश्यकता है। GPS उपलब्ध नहीं है। धातु शेल्फिंग के कारण मल्टीपाथ प्रभाव से Wi-Fi अविश्वसनीय है।

2. OCC-फोटोग्रामेट्री समाधान ढांचा:

  • अवसंरचना: प्रत्येक गलियारे की छत में एक अद्वितीय एलईडी लाइट स्ट्रिंग होती है। प्रत्येक एलईडी एक सरल कोड को मॉड्यूलेट करती है, जो गोदाम के मानचित्र के सापेक्ष उसके पूर्व-मापे गए $(X, Y, Z)$ निर्देशांक संप्रेषित करता है।
  • रोबोट सेंसर: एक ऊपर की ओर इशारा करता कैमरा।
  • कार्यप्रवाह:
    1. रोबोट चैनल 5 में प्रवेश करता है। इसका कैमरा छत पर स्थित एलईडी को कैप्चर करता है।
    2. इमेज प्रोसेसिंग द्वारा चमकीले स्पॉट (एलईडी) को अलग किया जाता है।
    3. OCC डिकोडर प्रत्येक दृश्यमान LED के $(X, Y, Z)$ निर्देशांक निकालता है।
    4. PnP सॉल्वर इन 3D-2D संबंधों का उपयोग करके चैनल के भीतर रोबोट की सटीक $(x, y)$ स्थिति और हेडिंग $(\theta)$ की गणना करता है।
    5. यह उच्च-सटीक स्थानीकरण परिणाम व्हील ओडोमेट्री के साथ कलमैन फ़िल्टर में सम्मिलित किया जाता है, ताकि सहज नेविगेशन प्राप्त किया जा सके।

3. परिणाम: रोबोट ने सटीक रूप से स्टोरेज लोकेशन 12 का पता लगाया, जो एलईडी-सुसज्जित, संरचित इनडोर वातावरण में इस प्रणाली की व्यावहारिकता को प्रदर्शित करता है।

भविष्य के अनुप्रयोग और शोध दिशाएं

  • ऑगमेंटेड रियलिटी (AR) एंकर दृढ़ीकरण: संग्रहालयों में OCC-सक्षम LED, AR उपकरणों को बिना मैन्युअल स्कैन किए, तत्काल और सटीक रूप से भौतिक प्रदर्शनियों पर आभासी सामग्री को लॉक करने की अनुमति देते हैं, जैसा कि Microsoft Azure स्पेशल एंकर्स जैसी परियोजनाओं द्वारा दृश्य विशेषताओं का उपयोग करते हुए खोजा गया है।
  • अति-सटीक ड्रोन स्वार्म समन्वय: नियंत्रित स्थानों जैसे कारखाने के फर्श पर, ड्रोन मॉड्यूलेटेड एलईडी लैंडिंग पैड का उपयोग करके मिलीमीटर-स्तरीय सटीकता के साथ लैंडिंग और चार्जिंग कर सकते हैं, यह अवधारणा Amazon Prime Air फुलफिलमेंट केंद्रों से संबंधित है।
  • V2X संचार और स्थिति निर्धारण: वाहन हेडलाइट्स/टेललाइट्स और ट्रैफिक सिग्नल अपनी पहचान और स्थिति प्रसारित कर सकते हैं (उदाहरण के लिए, "मैं ट्रैफिक लाइट #47 हूं, 2 सेकंड में लाल हो जाऊंगा"), जिससे वाहन उन्हें सटीक रूप से स्थिति निर्धारित कर सकें और उनके इरादे समझ सकें, जिससे सुरक्षा प्रणालियों को बढ़ावा मिलता है।
  • शोध दिशा:
    1. NLoS शमन: सीमित गैर-दृष्टि रेखा (NLoS) संवेदन प्राप्त करने के लिए परावर्तक सतहों या विसरित प्रकाश पैटर्न का उपयोग करना।
    2. मानकीकरण और अंतरसंचालनशीलता: OCC मानक (IEEE 802.15.7r1) के व्यापक अपनाने को बढ़ावा देना, ताकि विभिन्न बीकन और रिसीवर एक साथ काम कर सकें।
    3. गहन शिक्षण एकीकरण: सीएनएन का उपयोग करके मॉड्यूलेटेड एलईडी युक्त छवियों से सीधे पोज़ रिग्रेशन करना, जिससे सिस्टम आंशिक अवरोध और शोर के प्रति अधिक मजबूत बनता है।
    4. ऊर्जा संरक्षण प्रोटोकॉल: बैटरी संचालित आईओटी टैग के लिए ड्यूटी साइकिल प्रोटोकॉल डिजाइन करना जो रेट्रोरिफ्लेक्टर और कैमरा फ्लैश को इंटरोगेटर के रूप में उपयोग करते हैं।

संदर्भ सूची

  1. Hossan, M. T. (2018). वायरलेस नेटवर्किंग अनुप्रयोगों के लिए ऑप्टिकल कैमरा संचार और फोटोग्रामेट्री का उपयोग करके स्थानीयकरण [मास्टर थीसिस, कुकमिन यूनिवर्सिटी].
  2. IEEE Standard for Local and Metropolitan Area Networks--Part 15.7: Short-Range Optical Wireless Communications. (2018). IEEE Std 802.15.7-2018.
  3. Lepetit, V., Moreno-Noguer, F., & Fua, P. (2009). EPnP: An Accurate O(n) Solution to the PnP Problem. International Journal of Computer Vision, 81(2), 155–166.
  4. Zhuang, Y., Hua, L., Qi, L., Yang, J., Cao, P., Cao, Y., ... & Thompson, J. (2018). A Survey of Positioning Systems Using Visible LED Lights. IEEE Communications Surveys & Tutorials, 20(3), 1963-1988.
  5. NVIDIA Corporation. (2023). NVIDIA DRIVE Hyperion: स्वायत्त वाहन कंप्यूटिंग प्लेटफॉर्म. से लिया गया https://www.nvidia.com/en-us/self-driving-cars/
  6. Microsoft Corporation. (2023). Azure Spatial Anchors. से लिया गया https://azure.microsoft.com/en-us/products/spatial-anchors/