Pilih Bahasa

Pemplataran Menggunakan Komunikasi Kamera Optik dan Fotogrametri untuk Aplikasi Rangkaian Tanpa Wayar

Tesis Sarjana yang meneroka sistem pemplataran hibrid dalaman/kenderaan yang menggabungkan Komunikasi Kamera Optik (OCC) untuk penghantaran data dan fotogrametri untuk penentuan kedudukan 3D.
rgbcw.org | PDF Size: 3.0 MB
Penilaian: 4.5/5
Penilaian Anda
Anda sudah menilai dokumen ini
Sampul Dokumen PDF - Pemplataran Menggunakan Komunikasi Kamera Optik dan Fotogrametri untuk Aplikasi Rangkaian Tanpa Wayar

1. Pengenalan

Tesis ini, yang dikemukakan oleh Md. Tanvir Hossan kepada Universiti Kookmin pada tahun 2018, menyiasat pendekatan baharu untuk pemplataran dengan menggabungkan secara sinergi Komunikasi Kamera Optik (OCC) dan fotogrametri. Premis teras adalah untuk menangani batasan sistem tradisional berasaskan Frekuensi Radio (RF) seperti GPS dan Wi-Fi, terutamanya dalam persekitaran mencabar seperti dalaman atau kawasan bandar yang padat.

1.1 Pengenalan

Penyelidikan ini didorong oleh permintaan yang semakin meningkat untuk sistem penentuan kedudukan yang tepat, boleh dipercayai dan ringan infrastruktur untuk Internet Benda (IoT), kenderaan autonomi dan aplikasi bandar pintar.

1.2 Kepentingan Pemplataran

Maklumat lokasi yang tepat adalah pemangkin asas untuk perkhidmatan sedar konteks moden.

1.2.1 Pemplataran Dalaman

Isyarat GPS dilemahkan dengan teruk di dalam bangunan, menyebabkan ralat peringkat meter atau kegagalan sepenuhnya. Sistem alternatif berasaskan RF (Wi-Fi, Bluetooth) mengalami perambatan pelbagai laluan dan memerlukan cap jari yang meluas atau penyebaran infrastruktur yang padat.

1.2.2 Pemplataran Kenderaan

Untuk pemanduan autonomi dan komunikasi Kenderaan-ke-Segala-galanya (V2X), ketepatan peringkat sentimeter adalah penting. GPS sahaja tidak mencukupi disebabkan sekatan isyarat dan ralat atmosfera. Gabungan sensor dengan kamera dan LiDAR adalah biasa tetapi mahal dari segi pengiraan.

1.3 Kebaharuan OCC dan Fotogrametri dalam Pemplataran

Kaedah hibrid yang dicadangkan memperkenalkan penggunaan dwi-tujuan diod pemancar cahaya (LED) dan kamera:

  • OCC (Pautan Data): LED menghantar kod pengenalan atau data (cth., koordinat 3D yang diketahui) melalui cahaya termodulat, yang ditangkap oleh kamera. Ini menyediakan saluran komunikasi yang teguh, bebas lesen dan SNR tinggi yang kebal terhadap gangguan RF.
  • Fotogrametri (Enjin Penentuan Kedudukan): Imej kamera yang sama digunakan untuk melakukan pembinaan semula 3D. Dengan mengenal pasti mercu tanda LED yang diketahui (melalui ID yang dinyahkod OCC) dalam imej 2D, kedudukan dan orientasi (pose) kamera boleh dikira menggunakan prinsip geometri unjuran.

Gabungan ini mencipta sistem yang berdiri sendiri di mana mercu tanda menyiarkan identiti dan lokasi mereka sendiri, memudahkan saluran pemplataran.

1.4 Sumbangan

Tesis ini mendakwa sumbangan dalam mencadangkan seni bina hibrid khusus ini, membangunkan algoritma berkaitan untuk penyahkodan data dan anggaran pose, dan mengesahkan prestasinya untuk kedua-dua senario dalaman dan kenderaan.

1.5 Organisasi Tesis

Dokumen ini distrukturkan dengan bab mengenai kerja berkaitan, model sistem yang dicadangkan, analisis prestasi dan kesimpulan.

2. Kerja Berkaitan untuk Pemplataran

2.1 Pengenalan

Bab ini meninjau teknologi pemplataran sedia ada, mewujudkan garis asas untuk menyerlahkan kelebihan kaedah yang dicadangkan. Ia mungkin meliputi kaedah berasaskan RF (GPS, Wi-Fi RTT, UWB), kaedah berasaskan penglihatan (monokular/SLAM, AR berasaskan penanda) dan kaedah optik lain seperti LiDAR dan Penentuan Kedudukan Cahaya Nampak (VLP) tulen.

Perbandingan Teknologi

GPS: Ketepatan ~10m, gagal dalam bangunan.

Cap Jari Wi-Fi: ~2-5m, perlukan penentukuran.

UWB: ~10-30cm, kos tinggi.

OCC+Fotogrametri yang Dicadangkan: Bertujuan untuk sub-meter, infrastruktur rendah.

Pandangan Utama

  • Sinergi Dwi-Modaliti: OCC menyelesaikan masalah pengenalpastian mercu tanda untuk fotogrametri, yang seterusnya menyediakan geometri tepat.
  • Infrastruktur Ringan: Memanfaatkan LED sedia ada atau mudah disebar, mengelakkan tatasusunan antena padat.
  • Ketahanan Gangguan: Isyarat optik tidak mengganggu sistem RF kritikal di hospital atau pesawat.
  • Privasi & Keselamatan: Secara semula jadi berarah dan terkandung dalam garis penglihatan, menawarkan privasi yang lebih baik daripada RF omnidirectional.

Analisis & Kritikan Asal

Pandangan Teras: Tesis ini bukan sekadar satu lagi kertas penentuan kedudukan; ia adalah satu 'hack' bijak yang menggunakan semula sensor paling meluas dalam telefon pintar—kamera—menjadi penerima radio dan alat ukur tanah yang digabungkan. Inovasi sebenar adalah menggunakan modulasi cahaya untuk menanam "tag nama" digital ke dalam mercu tanda fizikal, dengan elegan memintas masalah penglihatan komputer yang kompleks iaitu pemadanan ciri dan carian pangkalan data yang membelenggu pemplataran visual tradisional (seperti Perkhidmatan Penentuan Kedudukan Visual Google). Ia menjadikan sumber cahaya pasif menjadi suar aktif yang mengenal pasti diri sendiri.

Aliran Logik & Kekuatan: Logiknya kukuh dan ringkas. Aliran sistem—tangkap bingkai, nyahkod ID OCC, ambil koordinat 3D yang diketahui, selesaikan Perspektif-n-Titik (PnP)—adalah saluran yang bersih dan linear. Kekuatannya jelas dalam aplikasi khusus: fikirkan robot gudang yang mengemudi di bawah lampu lorong LED termodulat, atau dron yang berlabuh di hangar dengan penanda LED berkod. Ia sangat tahan terhadap kekacauan RF persekitaran moden, satu titik yang ditekankan oleh penyelidikan dari kumpulan tugas IEEE 802.15.7r1 mengenai pemiawaian OCC, yang menyerlahkan utilitinya di zon sensitif elektromagnet. Berbanding sistem VLP tulen yang hanya menggunakan kekuatan isyarat diterima (RSS) atau sudut ketibaan (AoA) dan terjejas oleh bunyi cahaya ambien, kaedah hibrid ini menggunakan struktur geometri imej, yang lebih teguh terhadap turun naik keamatan.

Kelemahan & Jurang Kritikal: Walau bagaimanapun, pendekatan ini pada dasarnya dirantai oleh hukum optik. Keperluan untuk garis penglihatan langsung (LoS) adalah tumit Achillesnya, menjadikannya tidak boleh digunakan dalam persekitaran berselerak atau bukan garis penglihatan (NLoS)—berbeza ketara dengan keupayaan RF untuk menembusi dinding. Julat berkesan adalah terhad oleh resolusi kamera dan kecerahan LED; anda tidak akan dapat mengesan kenderaan pada jarak 200 meter dengan kamera telefon pintar. Tambahan pula, prestasi sistem merosot teruk di bawah cahaya ambien tinggi (cahaya matahari) atau dengan kabur pergerakan kamera, isu yang kebanyakannya diabaikan oleh sistem RF. Tesis ini mungkin mengabaikan kependaman pengiraan pemprosesan imej masa nyata dan penyahkodan OCC, yang boleh menjadi penghalang untuk aplikasi kenderaan berkelajuan tinggi. Ia adalah penyelesaian ketepatan tinggi untuk set masalah yang sangat khusus dan terhad.

Pandangan Boleh Tindak: Untuk pengamal, kerja ini adalah pelan untuk mereka bentuk persekitaran "pintar". Pandangan boleh tindak yang boleh diambil adalah mereka bentuk infrastruktur pencahayaan LED dengan mempertimbangkan pemplataran dari awal—menggunakan skim modulasi piawai seperti Komunikasi Kamera Optik (OCC) IEEE 802.15.7. Masa depan bukan dalam menggantikan GPS atau penentuan kedudukan 5G, tetapi dalam mengukuhkannya. Laluan paling berdaya maju adalah gabungan sensor: IMU dan GPS menyediakan anggaran kasar yang sentiasa tersedia, manakala sistem OCC-fotogrametri memberikan pembetulan ketepatan tinggi setiap kali kamera mempunyai pandangan ke suar. Pendekatan gabungan sensor hibrid ini adalah tema utama dalam penyelidikan pemplataran terkini untuk sistem autonomi, seperti yang dilihat dalam platform seperti NVIDIA DRIVE.

Butiran Teknikal & Formulasi Matematik

Masalah matematik teras adalah masalah Perspektif-n-Titik (PnP). Diberikan:

  • Satu set $n$ titik 3D dalam sistem koordinat dunia: $\mathbf{P}_i = (X_i, Y_i, Z_i)^T$, diperoleh daripada ID LED yang dinyahkod OCC.
  • Unjuran 2D sepadan mereka dalam satah imej: $\mathbf{p}_i = (u_i, v_i)^T$.
  • Matriks intrinsik kamera $\mathbf{K}$ (daripada penentukuran).

Cari putaran kamera $\mathbf{R}$ dan translasi $\mathbf{t}$ yang memenuhi:

$\mathbf{p}_i = \mathbf{K} [\mathbf{R} | \mathbf{t}] \mathbf{P}_i$

Untuk $n \geq 4$ (dalam konfigurasi tidak merosot), ini boleh diselesaikan dengan cekap menggunakan algoritma seperti EPnP atau IPPE. Komponen OCC melibatkan penyahmodulatan isyarat keamatan cahaya dari kawasan kepentingan (ROI) di sekitar setiap tompok LED dalam imej. Ini biasanya menggunakan Kekunci Hidup-Mati (OOK) atau Modulasi Kedudukan Denyut Berubah (VPPM). Rantaian pemprosesan isyarat melibatkan perbezaan bingkai untuk membuang latar belakang, penyegerakan dan penyahkodan.

Keputusan Eksperimen & Prestasi

Berdasarkan struktur tesis dan kerja serupa, bahagian eksperimen mungkin mengesahkan sistem dalam persediaan makmal terkawal dan senario kenderaan tiruan.

Penerangan Carta (Disimpulkan): Satu carta bar membandingkan ralat pemplataran (dalam sentimeter) untuk sistem berbeza: Wi-Fi RSSI, Bluetooth Tenaga Rendah (BLE), VLP Tulen (menggunakan RSS) dan kaedah OCC+Fotogrametri yang dicadangkan. Bar OCC+Fotogrametri akan jauh lebih pendek, menunjukkan ketepatan sub-30cm, manakala yang lain menunjukkan ralat 1-5 meter. Satu graf garis kedua mungkin menunjukkan ralat sebagai fungsi jarak dari mercu tanda LED, dengan ralat meningkat secara beransur-ansur tetapi kekal di bawah satu meter dalam julat operasi yang direka (cth., 5-10m).

Metrik Utama Dilaporkan:

  • Ketepatan Pemplataran: Ralat Punca Min Kuasa Dua (RMSE) dalam kedudukan, mungkin dalam julat 10-30 cm di bawah keadaan baik.
  • Kadar Kejayaan Penyahkodan OCC: Peratusan bingkai di mana ID LED berjaya dinyahkod dengan betul, bergantung pada masa pendedahan, kadar bingkai dan frekuensi modulasi.
  • Kependaman Pemprosesan: Masa dari tangkapan imej ke anggaran pose, kritikal untuk aplikasi masa nyata.
  • Keteguhan kepada Cahaya Ambien: Kemerosotan prestasi di bawah keadaan pencahayaan berbeza.

Rangka Kerja Analisis: Satu Kes Konseptual

Senario: Robot Inventori Gudang Pintar.

1. Masalah: Sebuah robot perlu mengemudi ke rak tertentu (Lorong 5, Teluk 12) dengan ketepatan sentimeter untuk mengimbas item. GPS tidak tersedia. Wi-Fi tidak boleh dipercayai kerana rak logam menyebabkan pelbagai laluan.

2. Rangka Kerja Penyelesaian OCC-Fotogrametri:

  • Infrastruktur: Setiap lorong mempunyai rentetan lampu LED yang unik di siling. Setiap LED memodulatkan kod mudah yang menyampaikan koordinat $(X, Y, Z)$nya yang telah diukur terlebih dahulu relatif kepada peta gudang.
  • Sensor Robot: Sebuah kamera menghadap ke atas.
  • Aliran Kerja:
    1. Robot memasuki Lorong 5. Kameranya menangkap LED siling.
    2. Pemprosesan imej mengasingkan tompok terang (LED).
    3. Penyahkod OCC mengekstrak koordinat $(X, Y, Z)$ untuk setiap LED yang kelihatan.
    4. Penyelesai PnP menggunakan padanan 3D-2D ini untuk mengira lokasi tepat $(x, y)$ dan hala tuju $(\theta)$ robot dalam lorong.
    5. Pembetulan ketepatan tinggi ini digabungkan dengan odometri roda dalam Penapis Kalman untuk navigasi lancar.

3. Hasil: Robot itu mencari Teluk 12 dengan tepat, menunjukkan utiliti sistem dalam persekitaran dalaman berstruktur yang dilengkapi LED.

Aplikasi Masa Depan & Hala Tuju Penyelidikan

  • Ketekalan Pautan Realiti Terimbuh (AR): LED yang diaktifkan OCC di muzium boleh membolehkan peranti AR mengunci kandungan maya kepada pameran fizikal dengan serta-merta dan tepat tanpa imbasan manual, seperti yang diterokai oleh projek seperti Azure Spatial Anchors Microsoft menggunakan ciri visual.
  • Penyelarasan Kawanan Dron Ultra-Tepat: Dalam ruang terkawal seperti lantai kilang, dron boleh menggunakan alas pendaratan LED termodulat untuk berlabuh dan mengecas dengan ketepatan milimeter, satu konsep yang relevan dengan pusat pemenuhan Amazon Prime Air.
  • Komunikasi & Pemplataran V2X: Lampu hadapan/ekor kereta dan isyarat lalu lintas boleh menyiarkan identiti dan keadaan mereka (cth., "Saya lampu isyarat #47, akan bertukar merah dalam 2s"), membolehkan kenderaan menentukan lokasi mereka dengan tepat dan memahami niat, meningkatkan sistem keselamatan.
  • Hala Tuju Penyelidikan:
    1. Pengurangan NLoS: Menggunakan permukaan pantulan atau corak cahaya resap untuk membolehkan deria bukan garis penglihatan terhad.
    2. Pemiawaian & Kebolehoperasian: Mendorong penerimaan meluas piawaian OCC (IEEE 802.15.7r1) untuk memastikan suar dan penerima berbeza berfungsi bersama.
    3. Integrasi Pembelajaran Mendalam: Menggunakan CNN untuk terus merosotkan pose dari imej yang mengandungi LED termodulat, menjadikan sistem lebih teguh terhadap okulasi separa dan bunyi.
    4. Protokol Cekap Tenaga: Mereka bentuk protokol kitaran tugas untuk tag IoT berkuasa bateri menggunakan pemantul balik dan kilat kamera sebagai pemeriksa.

Rujukan

  1. Hossan, M. T. (2018). Localization using Optical Camera Communication and Photogrammetry for Wireless Networking Applications [Tesis Sarjana, Universiti Kookmin].
  2. Piawaian IEEE untuk Rangkaian Kawasan Setempat dan Metropolitan--Bahagian 15.7: Komunikasi Wayarles Optik Jarak Pendek. (2018). IEEE Std 802.15.7-2018.
  3. Lepetit, V., Moreno-Noguer, F., & Fua, P. (2009). EPnP: An Accurate O(n) Solution to the PnP Problem. International Journal of Computer Vision, 81(2), 155–166.
  4. Zhuang, Y., Hua, L., Qi, L., Yang, J., Cao, P., Cao, Y., ... & Thompson, J. (2018). A Survey of Positioning Systems Using Visible LED Lights. IEEE Communications Surveys & Tutorials, 20(3), 1963-1988.
  5. NVIDIA Corporation. (2023). NVIDIA DRIVE Hyperion: Platform Pengiraan Kenderaan Autonomi. Diambil dari https://www.nvidia.com/en-us/self-driving-cars/
  6. Microsoft Corporation. (2023). Azure Spatial Anchors. Diambil dari https://azure.microsoft.com/en-us/products/spatial-anchors/