اختر اللغة

التوطين باستخدام الاتصال البصري بالكاميرا والتصوير المساحي لتطبيقات الشبكات اللاسلكية

رسالة ماجستير تستكشف نظامًا هجينًا للتوطين الداخلي/المركبات يجمع بين الاتصال البصري بالكاميرا (OCC) لنقل البيانات والتصوير المساحي لتحديد المواقع ثلاثي الأبعاد.
rgbcw.org | PDF Size: 3.0 MB
التقييم: 4.5/5
تقييمك
لقد قيمت هذا المستند مسبقاً
غلاف مستند PDF - التوطين باستخدام الاتصال البصري بالكاميرا والتصوير المساحي لتطبيقات الشبكات اللاسلكية

1. المقدمة

تستكشف هذه الرسالة، التي قدمها محمد تنوير حسّان إلى جامعة كوكمن في عام 2018، نهجًا جديدًا للتوطين من خلال الجمع التكاملي بين الاتصال البصري بالكاميرا (OCC) والتصوير المساحي. الفرضية الأساسية هي معالجة قيود الأنظمة التقليدية القائمة على الترددات الراديوية (RF) مثل GPS وWi-Fi، خاصة في البيئات الصعبة مثل الأماكن المغلقة أو الوديان الحضرية الكثيفة.

1.1 المقدمة

الدافع وراء هذا البحث هو الطلب المتزايد على أنظمة تحديد مواقع دقيقة وموثوقة وقليلة البنية التحتية لتطبيقات إنترنت الأشياء (IoT) والمركبات ذاتية القيادة والمدن الذكية.

1.2 أهمية التوطين

معلومات الموقع الدقيقة هي عامل تمكين أساسي للخدمات الحديثة الواعية بالسياق.

1.2.1 التوطين الداخلي

تتضاءل إشارات GPS بشدة داخل المباني، مما يؤدي إلى أخطاء بمستوى الأمتار أو فشل كامل. تعاني الأنظمة البديلة القائمة على RF (Wi-Fi، Bluetooth) من انتشار متعدد المسارات وتتطلب بصمة واسعة أو نشرًا كثيفًا للبنية التحتية.

1.2.2 توطين المركبات

من أجل القيادة الذاتية والاتصال بين المركبات وكل شيء (V2X)، تعد الدقة بمستوى السنتيمترات أمرًا بالغ الأهمية. نظام GPS وحده غير كافٍ بسبب انسداد الإشارة والأخطاء الجوية. دمج المستشعرات مع الكاميرات وLiDAR شائع ولكنه مكلف حسابيًا.

1.3 حداثة استخدام OCC والتصوير المساحي في التوطين

تقدم الطريقة الهجينة المقترحة استخدامًا مزدوج الغرض لمصابيح LED والكاميرا:

  • OCC (رابط البيانات): تنقل مصابيح LED رموز تعريف أو بيانات (مثل الإحداثيات ثلاثية الأبعاد المعروفة) عبر الضوء المُعدَّل، والذي يتم التقاطه بواسطة الكاميرا. يوفر هذا قناة اتصال قوية وخالية من الترخيص وذات نسبة إشارة إلى ضوضاء عالية ومحصنة ضد تداخل RF.
  • التصوير المساحي (محرك تحديد المواقع): تُستخدم نفس صورة الكاميرا لإجراء إعادة بناء ثلاثي الأبعاد. من خلال تحديد معالم LED المعروفة (عبر هويات تم فك تشفيرها بواسطة OCC) في الصورة ثنائية الأبعاد، يمكن حساب موقع واتجاه (وضعية) الكاميرا باستخدام مبادئ الهندسة الإسقاطية.

ينشئ هذا الدمج نظامًا مكتفيًا ذاتيًا حيث تبث المعالم هويتها وموقعها الخاص، مما يبسط خط أنابيب التوطين.

1.4 الإسهامات

تدعي الرسالة إسهامات في اقتراح هذا الهيكل الهجين المحدد، وتطوير الخوارزميات المرتبطة لفك تشفير البيانات وتقدير الوضعية، والتحقق من أدائها لكل من السيناريوهات الداخلية والمركبات.

1.5 هيكل الرسالة

تم تنظيم الوثيقة بفصول حول الأعمال ذات الصلة، ونموذج النظام المقترح، وتحليل الأداء، والخلاصة.

2. الأعمال ذات الصلة في مجال التوطين

2.1 المقدمة

يستعرض هذا الفصل تقنيات التوطين الحالية، ويؤسس خطًا أساسيًا لتسليط الضوء على مزايا الطريقة المقترحة. من المحتمل أن يغطي الطرق القائمة على RF (GPS، Wi-Fi RTT، UWB)، والطرق القائمة على الرؤية (monocular/SLAM، AR القائم على العلامات)، وطرقًا بصرية أخرى مثل LiDAR وتحديد المواقع بالضوء المرئي الخالص (VLP).

مقارنة التقنيات

GPS: دقة ~10 أمتار، يفشل داخليًا.

بصمة Wi-Fi: دقة ~2-5 أمتار، تحتاج إلى معايرة.

UWB: دقة ~10-30 سم، تكلفة عالية.

OCC+التصوير المساحي المقترح: يهدف إلى دقة أقل من المتر، مع بنية تحتية قليلة.

رؤى رئيسية

  • التآزر ثنائي الوسائط: يحل OCC مشكلة تحديد المعالم للتصوير المساحي، والذي بدوره يوفر هندسة دقيقة.
  • بنية تحتية خفيفة: يستفيد من مصابيح LED الحالية أو سهلة النشر، متجنبًا المصفوفات الكثيفة للهوائيات.
  • القدرة على تحمل التداخل: الإشارات الضوئية لا تتداخل مع أنظمة RF الحرجة في المستشفيات أو الطائرات.
  • الخصوصية والأمان: اتجاهي بطبيعته ومحصور ضمن خط الرؤية، مما يوفر خصوصية أفضل من RF متعدد الاتجاهات.

التحليل والنقد الأصلي

الرؤية الأساسية: هذه الرسالة ليست مجرد ورقة بحثية أخرى عن تحديد المواقع؛ إنها حيلة ذكية تعيد توظيف مستشعر الهاتف الذكي الأكثر انتشارًا - الكاميرا - لتصبح جهاز استقبال لاسلكي وأداة مسح مجتمعة. الابتكار الحقيقي هو استخدام تعديل الضوء لتضمين "بطاقة تعريف" رقمية في معلم فيزيائي، متجاوزًا بذكاء مشكلة رؤية الكمبيوتر المعقدة لمطابقة الميزات والبحث في قاعدة البيانات التي تؤرق التوطين البصري التقليدي (مثل خدمة تحديد المواقع البصرية من Google). إنه يحول مصدر الضوء السلبي إلى منارة نشطة تتعرف على نفسها.

التسلسل المنطقي والمزايا: المنطق سليم واقتصادي. تدفق النظام - التقاط الإطار، فك تشفير هويات OCC، استرجاع الإحداثيات ثلاثية الأبعاد المعروفة، حل مشكلة المنظور-ن-نقطة (PnP) - هو خط أنابيب نظيف وخطي. تبرز نقاط قوته في التطبيقات المتخصصة: فكر في روبوتات المستودعات التي تتنقل تحت أضواء الممرات LED المُعدَّلة، أو الطائرات بدون طيار التي ترسو في حظيرة بها علامات LED مشفرة. إنه مقاوم بشدة للضجيج الراديوي للبيئات الحديثة، وهي نقطة أكدتها أبحاث مجموعة العمل IEEE 802.15.7r1 حول توحيد معايير OCC، والتي تسلط الضوء على فائدتها في المناطق الحساسة كهرومغناطيسيًا. مقارنة بأنظمة VLP الخالصة التي تستخدم فقط قوة الإشارة المستقبلة (RSS) أو زاوية الوصول (AoA) وتعاني من ضوضاء الضوء المحيط، تستخدم هذه الطريقة الهجينة البنية الهندسية للصورة، وهي أكثر قوة تجاه التقلبات في الشدة.

العيوب والفجوات النقدية: ومع ذلك، فإن النهج مقيد بشكل أساسي بقوانين البصريات. شرط خط الرؤية المباشر (LoS) هو نقطة ضعفه القاتلة، مما يجعله غير قابل للاستخدام في البيئات المزدحمة أو غير خط الرؤية (NLoS) - على النقيض تمامًا من قدرة RF على اختراق الجدران. النطاق الفعال محدود بدقة الكاميرا وسطوع LED؛ لن تتمكن من تتبع المركبات من على بعد 200 متر بكاميرا هاتف ذكي. علاوة على ذلك، يتدهور أداء النظام بشدة تحت الضوء المحيط العالي (ضوء الشمس) أو مع ضبابية حركة الكاميرا، وهي مشاكل تتجاهلها أنظمة RF إلى حد كبير. من المحتمل أن تتغاضى الرسالة عن زمن التأخير الحسابي لمعالجة الصور وفك تشفير OCC في الوقت الفعلي، والذي قد يكون مانعًا للتطبيقات المركباتية عالية السرعة. إنه حل عالي الدقة لمجموعة محددة ومقيدة جدًا من المشكلات.

رؤى قابلة للتنفيذ: بالنسبة للممارسين، هذا العمل هو مخطط لتصميم بيئات "ذكية". النتيجة القابلة للتنفيذ هي تصميم بنية تحتية لإضاءة LED مع وضع التوطين في الاعتبار منذ البداية - باستخدام مخططات تعديل قياسية مثل الاتصال البصري بالكاميرا (OCC) في IEEE 802.15.7. المستقبل ليس في استبدال GPS أو تحديد المواقع بـ 5G، بل في تعزيزها. المسار الأكثر جدوى هو دمج المستشعرات: يوفر IMU وGPS تقديرًا تقريبيًا ومتاحًا دائمًا، بينما يقدم نظام OCC-التصوير المساحي تصحيحًا عالي الدقة كلما كانت للكاميرا رؤية لمنارة. هذا النهج الهجين لدمج المستشعرات هو الموضوع المركزي في أحدث أبحاث التوطين للأنظمة الذاتية، كما يُرى في منصات مثل NVIDIA DRIVE.

التفاصيل التقنية والصياغة الرياضية

المشكلة الرياضية الأساسية هي مشكلة المنظور-ن-نقطة (PnP). بفرض:

  • مجموعة من نقاط $n$ ثلاثية الأبعاد في نظام إحداثيات العالم: $\mathbf{P}_i = (X_i, Y_i, Z_i)^T$، تم الحصول عليها من هوية LED التي تم فك تشفيرها بواسطة OCC.
  • إسقاطاتها ثنائية الأبعاد المقابلة في مستوى الصورة: $\mathbf{p}_i = (u_i, v_i)^T$.
  • مصفوفة الكاميرا الجوهرية $\mathbf{K}$ (من المعايرة).

أوجد دوران الكاميرا $\mathbf{R}$ وانتقالها $\mathbf{t}$ اللذين يحققان:

$\mathbf{p}_i = \mathbf{K} [\mathbf{R} | \mathbf{t}] \mathbf{P}_i$

من أجل $n \geq 4$ (في تكوين غير متدهور)، يمكن حل هذا بكفاءة باستخدام خوارزميات مثل EPnP أو IPPE. يتضمن مكون OCC إزالة تعديل إشارة شدة الضوء من منطقة الاهتمام (ROI) حول كل بقعة LED في الصورة. يستخدم هذا عادةً تعديل إزاحة المفتاح (OOK) أو تعديل موضع النبض المتغير (VPPM). تتضمن سلسلة معالجة الإشارة فرق الإطارات لإزالة الخلفية، والمزامنة، وفك التشفير.

النتائج التجريبية والأداء

بناءً على هيكل الرسالة والأعمال المماثلة، من المحتمل أن يتحقق القسم التجريبي من صحة النظام في إعداد معمل خاضع للتحكم وسيناريو مركباتي وهمي.

وصف الرسم البياني (مُستنتج): رسم بياني شريطي يقارن خطأ التوطين (بالسنتيمترات) لأنظمة مختلفة: Wi-Fi RSSI، Bluetooth Low Energy (BLE)، VLP الخالص (باستخدام RSS)، وطريقة OCC+التصوير المساحي المقترحة. سيكون الشريط الخاص بـ OCC+التصوير المساحي أقصر بشكل ملحوظ، مما يوضح دقة أقل من 30 سم، بينما تظهر الأنظمة الأخرى أخطاء تتراوح بين 1-5 أمتار. من المحتمل أن يظهر رسم بياني خطي ثاني الخطأ كدالة للمسافة من معالم LED، مع زيادة الخطأ تدريجيًا ولكن يبقى أقل من متر ضمن النطاق التشغيلي المصمم (مثل 5-10 أمتار).

المقاييس الرئيسية المبلغ عنها:

  • دقة التوطين: جذر متوسط مربع الخطأ (RMSE) في الموقع، على الأرجح في نطاق 10-30 سم في ظل ظروف جيدة.
  • معدل نجاح فك تشفير OCC: النسبة المئوية للإطارات التي تم فك تشفير هويات LED فيها بشكل صحيح، وتعتمد على وقت التعرض، ومعدل الإطارات، وتردد التعديل.
  • زمن التأخير في المعالجة: الوقت من التقاط الصورة إلى تقدير الوضعية، وهو أمر بالغ الأهمية للتطبيقات في الوقت الفعلي.
  • القدرة على تحمل الضوء المحيط: تدهور الأداء تحت ظروف إضاءة مختلفة.

إطار التحليل: حالة مفاهيمية

السيناريو: روبوت جرد مستودع ذكي.

1. المشكلة: يحتاج الروبوت إلى التنقل إلى رف معين (الممر 5، الخليج 12) بدقة سنتيمترية لمسح العناصر. نظام GPS غير متاح. Wi-Fi غير موثوق بسبب رفوف المعدن التي تسبب انتشارًا متعدد المسارات.

2. إطار حل OCC-التصوير المساحي:

  • البنية التحتية: يحتوي كل ممر على سلسلة فريدة من أضواء LED على السقف. يعدل كل LED رمزًا بسيطًا ينقل إحداثياته $(X, Y, Z)$ المساحية مسبقًا بالنسبة لخريطة المستودع.
  • مستشعر الروبوت: كاميرا موجهة للأعلى.
  • سير العمل:
    1. يدخل الروبوت الممر 5. تلتقط كاميرته مصابيح LED في السقف.
    2. تعزل معالجة الصور البقع الساطعة (مصابيح LED).
    3. يفك مشفر OCC إحداثيات $(X, Y, Z)$ لكل LED مرئي.
    4. يستخدم محلل PnP هذه المراسلات ثلاثية الأبعاد إلى ثنائية الأبعاد لحساب موقع الروبوت الدقيق $(x, y)$ واتجاهه $(\theta)$ في الممر.
    5. يتم دمج هذا التحديد عالي الدقة مع قياس المسافة بالعجلات في مرشح كالمان للملاحة السلسة.

3. النتيجة: يحدد الروبوت الخليج 12 بدقة، مما يوضح فائدة النظام في بيئة داخلية منظمة ومجهزة بـ LED.

التطبيقات المستقبلية واتجاهات البحث

  • استمرارية مرساة الواقع المعزز (AR): يمكن لمصابيح LED المدعومة بـ OCC في متحف أن تسمح لأجهزة AR بقفل المحتوى الافتراضي على معرض فيزيائي بشكل فوري ودقيق دون مسح يدوي، كما استكشفته مشاريع مثل Azure Spatial Anchors من Microsoft باستخدام الميزات البصرية.
  • تنسيق سرب الطائرات بدون طيار فائق الدقة: في مساحة خاضعة للتحكم مثل أرضية المصنع، يمكن للطائرات بدون طيار استخدام منصات الهبوط LED المُعدَّلة للرسو والشحن بدقة مليمترية، وهو مفهوم ذو صلة بمراكز تنفيذ Amazon Prime Air.
  • الاتصال وتحديد المواقع V2X: يمكن لمصابيح السيارة الأمامية/الخلفية وإشارات المرور بث هويتها وحالتها (مثل "أنا إشارة مرور رقم 47، سأتحول إلى الأحمر خلال ثانيتين")، مما يمكن المركبات من تحديد موقعها بدقة وفهم النية، مما يعزز أنظمة السلامة.
  • اتجاهات البحث:
    1. التخفيف من NLoS: استخدام الأسطح العاكسة أو أنماط الضوء المنتشر لتمكين الاستشعار المحدود غير خط الرؤية.
    2. التوحيد القياسي والقدرة على التشغيل البيني: الدفع نحو اعتماد أوسع لمعايير OCC (IEEE 802.15.7r1) لضمان عمل المنارات والمستقبلات المختلفة معًا.
    3. دمج التعلم العميق: استخدام الشبكات العصبية التلافيفية (CNNs) لاستنباط الوضعية مباشرة من الصور التي تحتوي على مصابيح LED مُعدَّلة، مما يجعل النظام أكثر قوة تجاه الانسداد الجزئي والضوضاء.
    4. بروتوكولات موفرة للطاقة: تصميم بروتوكولات دورية العمل للعلامات IoT التي تعمل بالبطارية باستخدام عواكس رجعية وفلاش الكاميرا كمستجوب.

المراجع

  1. Hossan, M. T. (2018). Localization using Optical Camera Communication and Photogrammetry for Wireless Networking Applications [رسالة ماجستير، جامعة كوكمن].
  2. IEEE Standard for Local and Metropolitan Area Networks--Part 15.7: Short-Range Optical Wireless Communications. (2018). IEEE Std 802.15.7-2018.
  3. Lepetit, V., Moreno-Noguer, F., & Fua, P. (2009). EPnP: An Accurate O(n) Solution to the PnP Problem. International Journal of Computer Vision, 81(2), 155–166.
  4. Zhuang, Y., Hua, L., Qi, L., Yang, J., Cao, P., Cao, Y., ... & Thompson, J. (2018). A Survey of Positioning Systems Using Visible LED Lights. IEEE Communications Surveys & Tutorials, 20(3), 1963-1988.
  5. NVIDIA Corporation. (2023). NVIDIA DRIVE Hyperion: Autonomous Vehicle Computing Platform. تم الاسترجاع من https://www.nvidia.com/en-us/self-driving-cars/
  6. Microsoft Corporation. (2023). Azure Spatial Anchors. تم الاسترجاع من https://azure.microsoft.com/en-us/products/spatial-anchors/