Pilih Bahasa

Demonstrasi Pertama Penyahmodulatan Isyarat 512-Color Shift Keying Menggunakan Penyeimbangan Neural untuk Komunikasi Kamera Optik

Demonstrasi eksperimen penghantaran 512-CSK OCC menggunakan penderia imej CMOS dan penyeimbang rangkaian neural pelabelan pelbagai untuk penyahmodulatan bebas ralat.
rgbcw.org | PDF Size: 0.4 MB
Penilaian: 4.5/5
Penilaian Anda
Anda sudah menilai dokumen ini
Sampul Dokumen PDF - Demonstrasi Pertama Penyahmodulatan Isyarat 512-Color Shift Keying Menggunakan Penyeimbangan Neural untuk Komunikasi Kamera Optik

Kandungan

1. Pengenalan

Komunikasi Kamera Optik (OCC) merupakan teknologi yang menjanjikan untuk komunikasi tanpa wayar optik generasi seterusnya, yang menggunakan penderia imej CMOS yang terdapat di mana-mana dalam kamera sebagai penerima. Ia menawarkan saluran yang bebas lesen dan kos efektif. Cabaran utama adalah meningkatkan kadar pemindahan data, yang terhad oleh kadar bingkai kamera dan masa pendedahan, sambil mengekalkan operasi tanpa kelipan. Color-Shift Keying (CSK), satu skim modulasi dari IEEE 802.15.7, memetakan data kepada warna dalam ruang kromatisiti CIE 1931 untuk meningkatkan kadar data. Walau bagaimanapun, silang-bicara yang disebabkan oleh kepekaan spektrum kamera memerlukan pampasan. Demonstrasi terdahulu mencapai sehingga 32-CSK dalam jarak pendek. Kertas kerja ini membentangkan demonstrasi eksperimen pertama penghantaran isyarat 512-CSK dengan penyahmodulatan bebas ralat melebihi 4 meter, menggunakan penyeimbang berasaskan rangkaian neural untuk mengendalikan silang-bicara tak linear.

2. Konfigurasi Penerima

Sistem penerima adalah berdasarkan modul penderia imej CMOS Sony IMX530 dengan kanta 50mm, yang mampu mengeluarkan data RGB mentah 12-bit tanpa pemprosesan susulan (demosaicing, penyingkiran hingar, pengimbangan putih).

2.1 Sistem Kamera dan Data Mentah

Sistem kamera Sony mengeluarkan data imej mentah tulen, mengekalkan bacaan penderia asal yang penting untuk pemprosesan isyarat yang tepat sebelum sebarang pembetulan warna memperkenalkan herotan.

2.2 Penukaran Ruang Warna

Nilai RGB mentah ditukar kepada koordinat kromatisiti CIE 1931 (x, y) menggunakan matriks penjelmaan piawai: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 Penyeimbang Rangkaian Neural

Rangkaian neural klasifikasi pelabelan pelbagai bertindak sebagai penyeimbang untuk mengimbangi silang-bicara tak linear. Ia mempunyai 2 unit input (x, y), $N_h$ lapisan tersembunyi dengan $N_u$ unit, dan $M=log_2(512)=9$ unit output (bit per simbol). Rangkaian mengeluarkan taburan kebarangkalian posterior $p(1|x,y)$, di mana Nisbah Log-Kebarangkalian (LLR) dikira untuk dimasukkan ke dalam penyahkod LDPC. Titik-titik buruj untuk 512-CSK disusun secara segi tiga bermula dari bucu biru (x=0.1805, y=0.0722).

3. Keputusan Eksperimen

3.1 Persediaan Eksperimen

Penghantaran menggunakan tatasusunan planar LED 8x8 (saiz panel: 6.5 cm). Bilangan LED aktif diubah dari 1x1 hingga 8x8 untuk menilai Kadar Ralat Bit (BER) berdasarkan kawasan imej yang diduduki (keamatan cahaya). Jarak penghantaran ditetapkan pada 4 meter.

3.2 Prestasi Kadar Ralat Bit (BER)

Sistem mencapai penyahmodulatan bebas ralat untuk 512-CSK. Ciri-ciri BER dinilai terhadap kawasan LED berkesan dalam imej yang dirakam. Penyeimbang neural berjaya mengurangkan silang-bicara, membolehkan penyahmodulatan yang boleh dipercayai pada peringkat modulasi tinggi ini di mana kaedah linear tradisional akan gagal.

Metrik Prestasi Utama

Peringkat Modulasi: 512-CSK (9 bit/simbol)

Jarak Penghantaran: 4 meter

Keputusan: Penyahmodulatan bebas ralat dicapai

4. Inti Pati & Analisis

Inti Pati

Kerja ini bukan sekadar tentang meningkatkan CSK kepada 512 warna; ia adalah peralihan strategik dari pembersihan isyarat berasaskan fizik kepada pembinaan semula berasaskan data. Kejayaan sebenar adalah merawat silang-bicara antara saluran yang teruk bukan sebagai masalah hingar untuk ditapis, tetapi sebagai peta herotan tak linear yang deterministik untuk dipelajari dan diterbalikkan oleh rangkaian neural. Ini mencerminkan anjakan paradigma yang dilihat dalam pengimejan pengiraan, di mana model pembelajaran mendalam seperti yang dibincangkan dalam kertas kerja CycleGAN (Zhu et al., 2017) belajar untuk menterjemah antara domain (contohnya, hingar kepada bersih) tanpa contoh berpasangan. Di sini, NN mempelajari songsangan 'cap jari' spektrum kamera.

Aliran Logik

Logiknya menarik: 1) CSK peringkat tinggi terhalang oleh silang-bicara. 2) Silang-bicara kamera adalah kompleks dan tak linear. 3) Oleh itu, gunakan penghampir fungsi universal (rangkaian neural) yang dilatih pada data yang diterima untuk memodelkan dan membatalkannya. Aliran dari data penderia mentah -> penukaran CIE 1931 -> penyeimbang NN -> penyahkod LDPC adalah rantaian pemprosesan isyarat hibrid moden. Ia secara bijak menggunakan ruang CIE piawai sebagai perwakilan perantaraan yang stabil, memisahkan sains warna dari teori komunikasi.

Kekuatan & Kelemahan

Kekuatan: Demonstrasi ini kukuh secara empirikal, mencapai rekod 512-CSK dalam jarak praktikal 4m. Menggunakan data penderia mentah memintas saluran paip ISP kamera yang merosakkan—taktik kritikal yang sering diabaikan. Kaedah ini tidak bergantung pada penerima; NN boleh dilatih semula untuk mana-mana kamera. Kelemahan: Pendekatan ini secara semula jadi lapar data dan memerlukan penentukuran untuk setiap kamera. Kertas kerja ini senyap tentang kerumitan, kependaman, dan penggunaan kuasa NN—butiran maut untuk OCC masa nyata dan mudah alih. Tatasusunan LED 8x8 adalah pemancar yang besar, bercanggah dengan matlamat OCC untuk memanfaatkan sumber cahaya yang terdapat di mana-mana. Seperti yang dinyatakan dalam penyelidikan IEEE ComSoc mengenai VLC, kebolehskalaan dan kebolehoperasian kekal sebagai halangan yang ketara.

Pandangan Boleh Tindak

Untuk penyelidik: Masa depan terletak pada model pembelajaran ringan, mungkin pembelajaran teragih untuk penentukuran pada peranti. Terokai seni bina berasaskan transformer yang mungkin mengendalikan herotan simbol berurutan lebih baik daripada NN suap hadapan. Untuk industri: Teknologi ini sudah sedia untuk senario pemasangan tetap khusus (panduan muzium, komunikasi robot kilang) di mana pemancar dan penerima adalah stabil. Bekerjasama dengan pengeluar penderia kamera (seperti Sony, seperti dalam kertas kerja ini) untuk menyematkan blok penyeimbang yang telah dilatih awal atau mudah dilatih terus ke bahagian belakang digital penderia, menjadikan kamera "sedia OCC" sebagai ciri yang boleh dijual.

5. Butiran Teknikal

Cabaran teknikal teras adalah ketidakpadanan antara ruang warna CIE 1931 ideal dan kepekaan spektrum sebenar kamera, seperti yang ditunjukkan dalam Rajah 1(b) PDF. Ini menyebabkan nilai (R, G, B) yang diterima menjadi campuran linear keamatan yang dihantar. Penjelmaan kepada (x, y) membantu tetapi tidak menghapuskan ketaklinearan. Rangkaian neural, dengan lapisan tersembunyinya $N_h$, mempelajari fungsi $f: (x, y) \rightarrow \mathbf{p}$, di mana $\mathbf{p}$ adalah vektor 9-dimensi kebarangkalian bit. LLR untuk bit ke-$k$ dikira sebagai: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ LLR ini menyediakan input lembut untuk penyahkod LDPC yang berkuasa, membolehkan pembetulan ralat ke hadapan untuk mencapai keputusan akhir bebas ralat.

6. Contoh Kerangka Analisis

Kes: Menilai Kamera Baharu untuk OCC. Penyelidikan ini menyediakan kerangka kerja untuk penanda aras kesesuaian mana-mana kamera untuk CSK peringkat tinggi.

  1. Perolehan Data: Hantar simbol 512-CSK yang diketahui menggunakan tatasusunan LED yang ditentukur. Rakam data penderia mentah dengan kamera yang sedang diuji.
  2. Pra-pemprosesan: Tukar tompok RGB mentah kepada koordinat CIE 1931 (x, y) menggunakan matriks piawai.
  3. Latihan Model: Latih rangkaian neural pelabelan pelbagai (contohnya, MLP 3 lapisan mudah) untuk memetakan kelompok (x, y) yang diterima kembali kepada 512 label simbol yang dihantar. Set latihan adalah pemetaan simbol yang diketahui.
  4. Metrik Prestasi: Ketepatan pengesahan akhir atau BER selepas penyahkodan LDPC secara langsung menunjukkan keupayaan kamera. Ketepatan tinggi menunjukkan herotan semula jadi yang rendah atau kelinearan yang tinggi, menjadikannya penerima OCC yang baik.
  5. Perbandingan: Ulangi untuk kamera yang berbeza. Kerumitan rangkaian neural yang diperlukan (kedalaman $N_h$, lebar $N_u$) menjadi proksi untuk keterukan silang-bicara kamera.
Kerangka kerja ini melangkaui analisis helaian spesifikasi kepada penilaian berfungsi yang berpusatkan komunikasi.

7. Aplikasi & Hala Tuju Masa Depan

Aplikasi:

  • Penentududukan Dalaman Tepat: OCC kadar data tinggi boleh menghantar cap jari atau peta lokasi kompleks bersama kod ID.
  • Pautan Realiti Ditambah (AR): Lampu pintar boleh menyiarkan metadata tentang objek atau karya seni terus ke kamera telefon pintar, membolehkan AR lancar tanpa carian awan.
  • IoT Perindustrian di Kawasan Sensitif RF: Komunikasi antara robot, penderia, dan pengawal di hospital atau pesawat menggunakan pencahayaan fasiliti sedia ada.
  • Komunikasi Bawah Air: LED biru-hijau menggunakan CSK boleh menyediakan kadar data yang lebih tinggi untuk kenderaan dan penderia selaman.
Hala Tuju Penyelidikan:
  • Pembelajaran Hujung-ke-Hujung: Bergerak melebihi blok berasingan (penyahmodulatan, penyeimbangan, penyahkodan) kepada rangkaian tunggal yang dilatih secara langsung untuk pengurangan BER.
  • Pampasan Saluran Dinamik: Membangunkan NN yang boleh menyesuaikan diri secara masa nyata kepada keadaan berubah seperti pendedahan automatik kamera, kabur gerakan, atau perubahan cahaya ambien.
  • Pemiawaian Seni Bina NN: Mencadangkan model NN ringan dan piawai untuk penyeimbangan yang boleh dilaksanakan dalam perkakasan atau perisian tegar kamera.
  • Integrasi dengan Visi 6G: Memposisikan OCC sebagai teknologi pelengkap dalam seni bina rangkaian heterogen 6G, seperti yang diterokai dalam kertas putih dari Next G Alliance.

8. Rujukan

  1. H.-W. Chen et al., "8-CSK data transmission over 4 cm," Relevant Conference, 2019.
  2. C. Zhu et al., "16-CSK over 80 cm using a quadrichromatic LED," Relevant Journal, 2016.
  3. N. Murata et al., "16-digital CSK over 100 cm based on IEEE 802.15.7," Relevant Conference, 2016.
  4. P. Hu et al., "Tri-LEDs based 32-CSK over 3 cm," Relevant Journal, 2019.
  5. R. Singh et al., "Tri-LEDs based 32-CSK," Relevant Conference, 2014.
  6. J.-Y. Zhu et al., "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks," IEEE International Conference on Computer Vision (ICCV), 2017. (Sumber luaran untuk konsep terjemahan domain berasaskan pembelajaran)
  7. IEEE Communications Society, "Visible Light Communication: A Roadmap for Standardization," Technical Report, 2022. (Sumber luaran untuk cabaran industri)
  8. Next G Alliance, "6G Vision and Framework," White Paper, 2023. (Sumber luaran untuk integrasi rangkaian masa depan)
  9. "Commission Internationale de l'Eclairage (CIE) 1931 color space," Standard.
  10. Sony Semiconductor Solutions Corporation, "IMX530 Sensor Datasheet," Technical Specification.