اختر اللغة

إطار عمل تعاوني لتحديد المواقع بين الروبوتات والهواتف الذكية يعتمد على الاتصالات بالضوء المرئي

تحليل لنظام تحديد مواقع تعاوني قائم على الاتصالات بالضوء المرئي (VLC) يتيح مشاركة الموقع بدقة عالية ووقت حقيقي بين الروبوتات والهواتف الذكية في البيئات الداخلية.
rgbcw.org | PDF Size: 0.3 MB
التقييم: 4.5/5
تقييمك
لقد قيمت هذا المستند مسبقاً
غلاف مستند PDF - إطار عمل تعاوني لتحديد المواقع بين الروبوتات والهواتف الذكية يعتمد على الاتصالات بالضوء المرئي

1. نظرة عامة

يتناول هذا البحث التحدي الحرج لتحديد المواقع في الأماكن المغلقة حيث تفشل الأنظمة التقليدية مثل نظام تحديد المواقع العالمي (GPS) بسبب حجب الإشارة. ويستفيد البحث من الانتشار الواسع لإضاءة LED وأجهزة استشعار CMOS عالية الدقة في الهواتف الذكية والروبوتات. يستخدم النظام المقترح تقنية تحديد المواقع بالضوء المرئي (VLP)، حيث تقوم أجهزة إرسال LED بتعديل ضوئها (باستخدام تعديل المفتاح التشغيلي-الإيقافي - OOK) لتضمين معرف فريد (UID) وبيانات الموقع. تقوم المحطة المستقبلة (كاميرا هاتف ذكي أو مستشعر رؤية للروبوت) بالتقاط تغيرات الضوء عالية التردد هذه من خلال تأثير المصراع المتداول، وهي ظاهرة موثقة جيدًا في أبحاث الاتصالات بالكاميرا البصرية (OCC). وهذا يتيح معدلات نقل بيانات تتجاوز معدل إطار الفيديو. من خلال فك تشفير أنماط الضوء المُلتقطة ("الشرائط") لاسترداد المعرف الفريد والتحقق منه مقابل قاعدة بيانات خريطة مخزنة مسبقًا، يمكن للجهاز تحديد موقعه بدقة عالية. يضع البحث هذه التقنية كمُمكن رئيسي للتعاون بين الإنسان والروبوت في بيئات ديناميكية مثل المستودعات والخدمات التجارية، حيث يكون الوعي المشترك بالوضع في الوقت الحقيقي أمرًا بالغ الأهمية.

2. الابتكار

يكمن الابتكار الأساسي في إطار العمل التعاوني نفسه. في حين تم استكشاف تقنية VLP للأجهزة المنفردة، فإن هذا العمل يدمج تحديد المواقع لكل من الهواتف الذكية والروبوتات في نظام موحد. تشمل المساهمات الرئيسية ما يلي:

  1. تصميم النظام: نظام تعاوني لتحديد المواقع قائم على VLC مصمم خصيصًا للتحديات العملية لاستخدام الهواتف الذكية (مثل ميل الجهاز) وملاحة الروبوتات، باستخدام مخططات VLP متعددة لتعزيز المتانة.
  2. تنفيذ الإطار: إطار عمل وظيفي يتم فيه الحصول على مواقع كل من الروبوتات والهواتف الذكية ومشاركتها في الوقت الحقيقي، وتصورها على واجهة الهاتف الذكي.
  3. التحقق التجريبي: التركيز على التحقق التجريبي من دقة تحديد الهوية، ودقة تحديد الموقع، والأداء في الوقت الحقيقي.

3. وصف العرض التوضيحي

ينقسم نظام العرض التوضيحي إلى أجهزة إرسال وأجهزة استقبال.

3.1 بنية النظام

تتكون البنية من:

  • جانب المرسل: لوحات LED متعددة، كل منها يتحكم بها وحدة تحكم دقيقة (MCU). تقوم وحدة التحكم الدقيقة بتشفير إحداثيات الموقع الجغرافي إلى إشارة رقمية باستخدام تعديل OOK، مما يؤدي إلى تشغيل وإيقاف LED بسرعة عالية.
  • جانب المستقبل: الهواتف الذكية والروبوتات المجهزة بكاميرات CMOS. يلتقط مصراع الكاميرا المتداول أشرطة مضيئة ومظلمة متناوبة (شرائط) عند توجيهها نحو LED معدل. تقوم خوارزميات معالجة الصور بفك تشفير هذه الشرائط لاستخراج المعرف المرسل.
  • المنطق المركزي: قاعدة بيانات للخريطة تحتوي على التعيين {UID: (x, y, z) coordinates}. يستعلم المعرف المفكوك في هذه القاعدة لاسترداد الموقع المطلق لـ LED. باستخدام تقنيات هندسية (مثل التثليث إذا كانت هناك عدة مصابيح LED في مجال الرؤية)، يحسب المستقبل موقعه الخاص.

3.2 الإعداد التجريبي

كما هو موضح في الشكل 1 (الموصوف أدناه)، يتضمن الإعداد أربعة أجهزة إرسال LED مثبتة على ألواح مسطحة، تبث مواقعها. تم تصميم دائرة التحكم لتكون بسيطة وقابلة للتوسع. من المحتمل أن تمثل البيئة مساحة داخلية خاضعة للتحكم تحاكي قسمًا من مستودع أو مختبر.

4. التفاصيل التقنية والصياغة الرياضية

يعتمد النظام على المبادئ الأساسية للاتصالات بالكاميرا البصرية (OCC) والتحديد الهندسي للموقع.

1. تعديل OOK وتأثير المصراع المتداول:
يرسل LED تسلسلاً ثنائيًا. يتم تمثيل '1' بتشغيل LED، و'0' بإيقافه (أو العكس). يعرض مصراع الكاميرا في الهاتف الذكي صفوفًا مختلفة من المستشعر في أوقات مختلفة قليلاً. عند التقاط LED يومض بسرعة، يؤدي هذا إلى ظهور أشرطة مضيئة ومظلمة متناوبة عبر الصورة. نمط هذه الشرائط يتوافق مباشرة مع تسلسل البتات المرسل. معدل البيانات $R_{data}$ محدود بمعدل أخذ العينات للمصراع المتداول، وليس معدل الإطارات $FPS$: $R_{data} \approx N_{rows} \times F_{rs}$، حيث $N_{rows}$ هو عدد صفوف المستشعر و $F_{rs}$ هو تردد مسح الصف.

2. تقدير الموقع:
بمجرد استرداد المواقع ثلاثية الأبعاد لـ $n$ من مصابيح LED من قاعدة البيانات ($\mathbf{P}_{LED,i} = [x_i, y_i, z_i]^T$)، وتم العثور على إسقاطاتها ثنائية الأبعاد المقابلة على مستوى الصورة ($\mathbf{p}_i = [u_i, v_i]^T$)، يمكن تقدير وضع الكاميرا ذي الست درجات حرية (الموقع $\mathbf{t}$ والتوجه $\mathbf{R}$) عن طريق حل مشكلة المنظور-ن-نقطة (PnP): $$ s_i \begin{bmatrix} u_i \\ v_i \\ 1 \end{bmatrix} = \mathbf{K} [\mathbf{R} | \mathbf{t}] \begin{bmatrix} x_i \\ y_i \\ z_i \\ 1 \end{bmatrix} $$ حيث $s_i$ هو عامل قياس، و $\mathbf{K}$ هي مصفوفة المعلمات الداخلية للكاميرا. بالنسبة لـ $n \geq 3$، يمكن حل ذلك باستخدام خوارزميات مثل EPnP أو الطرق التكرارية. موقع الروبوت هو $\mathbf{t}$.

5. النتائج التجريبية ووصف المخططات

يدعي البحث أن العرض التوضيحي تحقق من الدقة العالية والأداء في الوقت الحقيقي. في حين أن النتائج العددية المحددة لم يتم تفصيلها في المقتطف المقدم، يمكننا استنتاج طبيعة النتائج بناءً على الأعمال السابقة المشار إليها ووصف النظام.

مقاييس الأداء المستنتجة:

  • دقة تحديد الموقع: بالرجوع إلى [2,3]، اللتين حققتا دقة تبلغ حوالي 2.5 سم لتحديد موقع الروبوت باستخدام LED واحد مجتمعًا مع SLAM، من المرجح أن يستهدف هذا النظام التعاوني دقة على مستوى السنتيمتر. الدقة هي دالة لكثافة LED ودقة الكاميرا والمعايرة.
  • معدل/دقة تحديد الهوية: مقياس حاسم لموثوقية النظام. يشير تركيز البحث على هذا إلى أن التجارب قاست معدل خطأ البت (BER) أو معدل فك التشفير الناجح تحت ظروف مختلفة (المسافة، الزاوية، الضوء المحيط).
  • زمن التأخير في الوقت الحقيقي: زمن التأخير من طرف إلى طرف من التقاط الصورة إلى عرض الموقع على الهاتف الذكي. وهذا يشمل معالجة الصور، وفك التشفير، والبحث في قاعدة البيانات، وحساب الوضع. للتعاون الفعال، يحتاج هذا على الأرجح إلى أن يكون أقل من 100 مللي ثانية.

وصف المخطط (الشكل 1):
من المفترض أن يظهر الشكل 1 البيئة التجريبية الشاملة. سيتضمن عادةً:

  1. مخططًا أو صورة لمنطقة الاختبار مع أجهزة إرسال LED الأربعة موضوعة في إحداثيات معروفة على السقف أو الجدران.
  2. منصة روبوت (مثل روبوت ذو دفع تفاضلي أو متعدد الاتجاهات) مجهزة بكاميرا موجهة للأعلى.
  3. مستخدم يحمل هاتفًا ذكيًا، مع توجيه كاميرته أيضًا نحو مصابيح LED.
  4. إطار داخلي أو لوحة منفصلة تظهر واجهة عرض الهاتف الذكي، مصورة خريطة بها رموز تمثل المواقع في الوقت الحقيقي لكل من الروبوت والهاتف الذكي نفسه.
يهدف هذا الشكل إلى التحقق بصريًا من المفهوم التشغيلي للطبيعة التعاونية للنظام.

6. إطار التحليل: دراسة حالة غير برمجية

السيناريو: انتقاء الطلبات في المستودع مع فرق الإنسان والروبوت.
الهدف: ينقل الروبوت عربة إلى محطة انتقاء حيث يقوم عامل بشري بتجميع العناصر. يحتاج كلاهما إلى بيانات موقع دقيقة ومشتركة للالتقاء بكفاءة وتجنب العوائق.

تطبيق الإطار:

  1. إعداد البنية التحتية: يتم تركيب شبكة من أضواء LED المدعمة بتقنية VLP في سقف المستودع، كل منها مبرمج بمعرفها الفريد وإحداثيات المستودع الدقيقة (مثل: الممر 3، الرف 5، الارتفاع 4 أمتار).
  2. تحديد موقع الروبوت: تقوم الكاميرا المثبتة أعلى الروبوت بمشاهدة عدة مصابيح LED بشكل مستمر. تقوم بفك تشفير هوياتها، واسترداد مواقعها ثلاثية الأبعاد من خريطة محلية أو قائمة على السحابة، واستخدام PnP لحساب وضعها الخاص (x, y, theta) على أرضية المستودع بدقة تبلغ حوالي 5 سم.
  3. تحديد موقع العامل: يقوم هاتف العامل الذكي (في حافظة مثبتة على الصدر لتوجيه ثابت) بنفس عملية VLP. يتم حساب وضعه، ولكن أيضًا يتم مشاركته عبر Wi-Fi مع النظام المركزي والروبوت.
  4. المنطق التعاوني:
    • يقوم مدير المهام المركزي بتعيين وجهة للروبوت: موقع العامل الحالي.
    • يخطط الروبوت مسارًا، باستخدام موقعه الخاص وموقع العامل المحدث ديناميكيًا.
    • على شاشة هاتف العامل الذكي، تظهر طبقة زيادة واقعية (AR) موقع الروبوت الحي والوقت المقدر للوصول.
    • إذا تحرك العامل، يتم تحديث هدف الروبوت في الوقت الحقيقي، مما يتيح إعادة التخطيط الديناميكي.
  5. النتيجة: تقليل وقت البحث، والقضاء على التنسيق اللفظي، وتحسين المسارات، وتعزيز السلامة من خلال الوعي المتبادل.
توضح دراسة الحالة هذه كيف يتجاوز إطار العمل التعاوني VLP مجرد تحديد المواقع ليصبح طبقة تمكينية للتعاون الذكي والتكيفي.

7. الفكرة الأساسية ومنظور المحلل

الفكرة الأساسية: هذا البحث ليس عن اختراع خوارزمية جديدة لتحديد المواقع؛ إنه خطة تكامل نظامي عملية. القيمة الحقيقية تكمن في دمج اتجاهين ناضجين - كاميرات الهواتف الذكية المنتشرة في كل مكان ونظام تشغيل الروبوتات (ROS) - مع بنية تحتية لـ LED لحل مشكلة التنسيق "للمتر الأخير" في الأتمتة. يعيد توجيه قناة الاتصال (الضوء) للاستخدام المزدوج كمنارة تحديد مواقع عالية الدقة، وهو مفهوم يردد مبادئ دمج المستشعرات الموجودة في أنظمة SLAM المتقدمة ولكن بتكلفة أقل ورقابة أعلى على البنية التحتية.

التدفق المنطقي: الحجة سليمة: نظام GPS يفشل في الداخل → تقنية VLP تقدم بديلاً عمليًا وعالي الدقة → الأعمال السابقة تظهر نجاحًا على منصات فردية → لذلك، دمج هذه في إطار عمل تعاوني يفتح تطبيقات تعاونية جديدة. التدفق من التكنولوجيا المكونة (OOK، المصراع المتداول) إلى النظام الفرعي (VLP على الهاتف) إلى النظام المتكامل (إطار عمل تحديد المواقع المشترك) واضح ومنطقي.

نقاط القوة والضعف:
نقاط القوة: 1) الاستخدام المزدوج الأنيق: الاستفادة من الإضاءة والمستشعرات الحالية يقلل من تكاليف الأجهزة. 2) إمكانية الدقة العالية: يمكن للطرق القائمة على الرؤية أن تتفوق على الأنظمة القائمة على الترددات الراديوية (Wi-Fi/Bluetooth) في البيئات الخاضعة للتحكم. 3) الخصوصية والأمان: محلي وبصر الخط بشكل طبيعي، على عكس التتبع اللاسلكي المنتشر.
عيوب كبيرة: 1) سجن خط البصر (LoS): هذا هو نقطة الضعف القاتلة. أي عائق - يد مرفوعة، منصة نقالة، جسم الروبوت نفسه - يكسر تحديد الموقع. ادعاء التعامل مع "مواقف إضاءة مختلفة" [5-7] يعالج على الأرجح ضوضاء الضوء المحيط، وليس حالات عدم وجود خط البصر (NLoS). هذا يحد بشدة من المتانة في المستودعات المزدحمة والديناميكية. 2) الاعتماد على البنية التحتية: يتطلب شبكة LED كثيفة ومعايرة ومعدلة. تحديث المرافق الحالية ليس بالأمر الهين. 3) أسئلة حول قابلية التوسع: كيف يتعامل النظام مع العشرات من الروبوتات والعمال؟ التداخل المحتمل ومشاكل الاختناق في البحث في قاعدة البيانات لم يتم معالجتها.

رؤى قابلة للتنفيذ:

  1. التهجين أو الفشل: لتحقيق جدوى عملية في العالم الحقيقي، يجب أن يكون نظام VLP هذا مكونًا ضمن مجموعة هجينة لتحديد المواقع. يجب دمجه مع قياس المسافة بالعجلات، ووحدات القياس بالقصور الذاتي (IMU)، وربما النطاق العريض جدًا (UWB) لتحمل حالات عدم وجود خط البصر المؤقتة، على غرار كيفية دمج نظام Cartographer SLAM من Google لبيانات الليدار وIMU. يجب تصميم الإطار مع اعتبار دمج المستشعرات كأولوية قصوى.
  2. التركيز على بروتوكول المصافحة: حداثة البحث هي تحديد المواقع "التعاوني". يجب أن يكون البحث والتطوير الأكثر أهمية على بروتوكول الاتصال بين الوكلاء - ليس فقط مشاركة الإحداثيات، ولكن مشاركة فترات الثقة، والنوايا، وحل الغموض بشكل تعاوني عندما يفقد أحد الوكلاء خط البصر.
  3. المقارنة المعيارية مع أحدث التقنيات: يجب على المؤلفين مقارنة دقة نظامهم وزمن التأخير والتكلفة بشكل صارم مع الأنظمة القائمة على UWB (مثل Pozyx أو نظام AirTag من Apple) وأنظمة العلامات المعيارية القائمة على الكاميرا (مثل AprilTags). يحتاج عرض القيمة إلى تعريف أكثر وضوحًا.
في الختام، هذا العمل هو دليل مفهوم مقنع لنهج نظيف بوساطة بنية تحتية للتعاون. ومع ذلك، فإن رحلته من العرض التوضيحي المختبري إلى التبني الصناعي تعتمد بالكامل على التغلب على القيود الأساسية للأنظمة البصرية في البيئات الواقعية الفوضوية. يجب أن يقدم البحث التالي نتائج من تجربة أولية في مستودع عمل حقيقي، وليس مختبرًا خاضعًا للتحكم.

8. آفاق التطبيق والاتجاهات المستقبلية

التطبيقات قصيرة المدى (3-5 سنوات):

  • المستودعات والخدمات اللوجستية الذكية: كما هو موضح في دراسة الحالة، للرسو الدقيق، والانتقاء التعاوني، وإدارة المخزون حيث تشارك الروبوتات والبشر المساحة.
  • خلايا التصنيع المتقدمة: توجيه الروبوتات التعاونية (كوبوتات) لتسليم الأجزاء للفنيين في مواقع دقيقة على خط التجميع.
  • التجارة التفاعلية والمتاحف: توفير معلومات واعية بالسياق على الهواتف الذكية بناءً على الموقع الدقيق تحت إضاءة معينة للمعرض، وتوجيه روبوتات الخدمة لمساعدة الزوار.
  • مرافق الرعاية المساعدة: تتبع موقع المقيمين (بموافقتهم) وتوجيه الروبوتات المساعدة إليهم، مع ضمان الخصوصية من خلال المعالجة المحلية.

اتجاهات البحث والتطوير المستقبلية:

  1. حالات عدم وجود خط البصر والمتانة: البحث في استخدام أنماط الضوء المنعكس أو دمج VLP مع وسائط استشعار أخرى (صوتية، حرارية) لاستنتاج الموقع أثناء انسداد خط البصر لفترات قصيرة.
  2. التوحيد القياسي والقدرة على التشغيل البيني: تطوير معايير مفتوحة لمخططات تعديل LED الخاصة بـ VLP وتنسيقات البيانات، على غرار معيار IEEE 802.15.7r1 لـ VLC، لتمكين أنظمة متعددة البائعين.
  3. المعالجة المعززة بالذكاء الاصطناعي: استخدام التعلم العميق لفك تشفير الهوية بشكل قوي تحت ظروف إضاءة متطرفة، أو ضبابية الحركة، أو الانسداد الجزئي، والانتقال إلى ما بعد خطوط معالجة الرؤية الحاسوبية التقليدية.
  4. التكامل مع التوائم الرقمية: تصبح بيانات الموقع في الوقت الحقيقي لجميع الوكلاء التغذية المثالية لتوأم رقمي حي للمنشأة، مما يتيح المحاكاة والتحسين والتحليلات التنبؤية.
  5. بروتوكولات موفرة للطاقة: تصميم بروتوكولات للهواتف الذكية لأداء VLP مع استهلاك أدنى للبطارية، ربما باستخدام وحدات معالجة مساعدة منخفضة الطاقة أو المسح المتقطع.
الاتجاه النهائي هو نحو "إنترنت الأشياء المحيطي" - حيث توفر البيئة نفسها (من خلال الضوء والصوت والظواهر الأخرى) قدرات استشعار واتصال سلسة للأجهزة المضمنة والروبوتات والأدوات الشخصية، مع كون هذا العمل جزءًا أساسيًا من تلك الرؤية.

9. المراجع

  1. [المؤلفون]. (السنة). عنوان طريقة تحديد المواقع للروبوتات القائمة على ROS. اسم المؤتمر/المجلة. (مشار إليه في PDF كـ [1])
  2. [المؤلفون]. (السنة). عنوان طريقة تحديد موقع الروبوت القائمة على LED واحد. اسم المؤتمر/المجلة. (مشار إليه في PDF كـ [2])
  3. [المؤلفون]. (السنة). عنوان البحث الذي يجمع بين تحديد الموقع باستخدام LED واحد مع SLAM. اسم المؤتمر/المجلة. (مشار إليه في PDF كـ [3])
  4. [المؤلفون]. (السنة). عنوان العمل الذي يوضح موقع الروبوت التعاوني المجدي. اسم المؤتمر/المجلة. (مشار إليه في PDF كـ [4])
  5. Zhou, B., et al. (السنة). مخططات VLP عالية الدقة للهواتف الذكية. IEEE Transactions on Mobile Computing. (مثال على أدبيات مخططات VLP)
  6. IEEE Standard for Local and metropolitan area networks–Part 15.7: Short-Range Optical Wireless Communications. (2018). IEEE Std 802.15.7-2018. (معيار مرجعي لـ VLC)
  7. Grisetti, G., Stachniss, C., & Burgard, W. (2007). Improved Techniques for Grid Mapping With Rao-Blackwellized Particle Filters. IEEE Transactions on Robotics. (مرجع أساسي لـ SLAM ذو صلة بسياق تحديد موقع الروبوت)
  8. Apple Inc. (2021). Precision Finding for AirTag. [موقع إلكتروني]. (مثال على نظام تحديد مواقع UWB تجاري كمعيار مقارنة تنافسي)
  9. Olson, E. (2011). AprilTag: A robust and flexible visual fiducial system. Proceedings of the IEEE International Conference on Robotics and Automation (ICRA). (نظام علامات معيارية قائم على الكاميرا مستخدم على نطاق واسع)