Optik Kamera Haberleşmesinde Sinir Ağı Eşitlemesi Kullanılarak 512-Renk Kaydırmalı Anahtarlama Sinyali Demodülasyonunun İlk Gösterimi

İçindekiler

1. Giriş

Optik Kamera Haberleşmesi (OCC), kameralardaki yaygın CMOS görüntü sensörlerini alıcı olarak kullanan, yeni nesil optik kablosuz haberleşme için umut verici bir teknolojidir. Lisans gerektirmeyen, uygun maliyetli kanallar sunar. Temel bir zorluk, titreme olmadan çalışmayı sürdürürken, kamera kare hızları ve pozlama süreleri ile sınırlı olan veri aktarım hızını artırmaktır. IEEE 802.15.7'den bir modülasyon şeması olan Renk Kaydırmalı Anahtarlama (CSK), veri hızlarını artırmak için verileri CIE 1931 renklilik uzayındaki renklere eşler. Ancak, kamera spektral duyarlılığından kaynaklanan çapraz konuşma telafi gerektirir. Önceki gösterimler kısa mesafelerde en fazla 32-CSK başarısına ulaşmıştır. Bu makale, doğrusal olmayan çapraz konuşmayı ele almak için sinir ağı tabanlı bir eşitleyici kullanarak, 4 metre üzerinde hatasız demodülasyon ile 512-CSK sinyal iletiminin ilk deneysel gösterimini sunmaktadır.

2. Alıcı Konfigürasyonu

Alıcı sistemi, 50mm lensli bir Sony IMX530 CMOS görüntü sensörü modülüne dayanmaktadır ve işlem sonrası işlem (demosaicing, gürültü azaltma, beyaz dengesi) olmadan 12-bit ham RGB verisi çıktısı verebilir.

2.1 Kamera Sistemi ve Ham Veri

Sony kamera sistemi, saf ham görüntü verisi çıktısı verir, bu da herhangi bir renk düzeltmesi bozulma getirmeden önce doğru sinyal işleme için kritik olan orijinal sensör okumalarını korur.

2.2 Renk Uzayı Dönüşümü

Ham RGB değerleri, standart bir dönüşüm matrisi kullanılarak CIE 1931 (x, y) renklilik koordinatlarına dönüştürülür: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 Sinir Ağı Eşitleyici

Doğrusal olmayan çapraz konuşmayı telafi etmek için çok etiketli bir sınıflandırma sinir ağı eşitleyici olarak görev yapar. 2 giriş birimi (x, y), $N_h$ gizli katmanı (her biri $N_u$ birim) ve $M=log_2(512)=9$ çıkış birimi (sembol başına bit) vardır. Ağ, bir sonsal olasılık dağılımı $p(1|x,y)$ çıktısı verir, buradan Log-Olabilirlik Oranları (LLR) hesaplanır ve bir LDPC kod çözücüsüne girdi olarak verilir. 512-CSK için takımyıldız noktaları, mavi köşeden (x=0.1805, y=0.0722) başlayarak üçgen şeklinde düzenlenmiştir.

3. Deney Sonuçları

3.1 Deneysel Kurulum

İletim için 8x8 LED düzlemsel dizisi kullanıldı (panel boyutu: 6.5 cm). Aktif LED sayısı, işgal edilen görüntü alanına (ışık şiddeti) dayalı Bit Hata Oranını (BER) değerlendirmek için 1x1'den 8x8'e kadar değiştirildi. İletim mesafesi 4 metre olarak sabitlendi.

3.2 BER Performansı

Sistem, 512-CSK için hatasız demodülasyon başardı. BER özellikleri, yakalanan görüntüdeki etkin LED alanına karşı değerlendirildi. Sinir ağı eşitleyicisi, çapraz konuşmayı başarıyla azalttı ve geleneksel doğrusal yöntemlerin başarısız olacağı bu yüksek modülasyon derecesinde güvenilir demodülasyonu mümkün kıldı.

Temel Performans Metriği

Modülasyon Derecesi: 512-CSK (9 bit/sembol)

İletim Mesafesi: 4 metre

Sonuç: Hatasız demodülasyon başarıldı

4. Temel İçgörü ve Analiz

Temel İçgörü

Bu çalışma sadece CSK'yi 512 renge taşımakla ilgili değildir; fizik tabanlı sinyal temizlemeden veri odaklı yeniden yapılandırmaya stratejik bir dönüştür. Gerçek atılım, şiddetli kanallar arası çapraz konuşmayı filtrelenecek bir gürültü sorunu olarak değil, bir sinir ağı tarafından öğrenilecek ve tersine çevrilecek deterministik, doğrusal olmayan bir bozulma haritası olarak ele almaktır. Bu, CycleGAN makalesinde (Zhu ve diğerleri, 2017) tartışılanlar gibi derin öğrenme modellerinin, eşleştirilmiş örnekler olmadan alanlar arasında (örneğin, gürültülüden temize) çeviri yapmayı öğrendiği hesaplamalı görüntülemede görülen paradigma değişimini yansıtır. Burada, sinir ağı kameranın spektral 'parmak izi'nin tersini öğrenir.

Mantıksal Akış

Mantık ikna edicidir: 1) Yüksek dereceli CSK, çapraz konuşma ile darboğazlanır. 2) Kamera çapraz konuşması karmaşık ve doğrusal değildir. 3) Bu nedenle, onu modellemek ve iptal etmek için alınan veriler üzerinde eğitilmiş evrensel bir fonksiyon yaklaşımlayıcısı (bir sinir ağı) kullanın. Ham sensör verisi -> CIE 1931 dönüşümü -> Sinir ağı eşitleyici -> LDPC kod çözücü akışı, modern, hibrit bir sinyal işleme zinciridir. Standartlaştırılmış CIE uzayını, renk bilimini haberleşme teorisinden ayıran kararlı bir ara temsil olarak akıllıca kullanır.

Güçlü ve Zayıf Yönler

Güçlü Yönler: Gösterim deneysel olarak sağlamdır, pratik bir 4m mesafe üzerinde rekor bir 512-CSK başarısına ulaşmıştır. Ham sensör verisi kullanmak, yıkıcı kamera ISP işlem hatlarını atlar—kritik, genellikle gözden kaçan bir taktiktir. Yöntem alıcıdan bağımsızdır; sinir ağı herhangi bir kamera için yeniden eğitilebilir. Zayıf Yönler: Yaklaşım doğası gereği veri açıdır ve kamera başına kalibrasyon gerektirir. Makale, sinir ağının karmaşıklığı, gecikmesi ve güç tüketimi konusunda sessizdir—gerçek zamanlı, mobil OCC için önemli detaylar. 8x8 LED dizisi hantal bir vericidir, OCC'nin yaygın ışık kaynaklarından yararlanma hedefiyle çelişir. IEEE ComSoc'un VLC araştırmasında belirtildiği gibi, ölçeklenebilirlik ve birlikte çalışabilirlik önemli engeller olarak kalmaktadır.

Uygulanabilir İçgörüler

Araştırmacılar için: Gelecek, cihaz üzeri kalibrasyon için hafif, belki de federatif öğrenme modellerinde yatmaktadır. İleri beslemeli sinir ağlarından daha iyi sıralı sembol bozulmasını işleyebilecek transformer tabanlı mimarileri keşfedin. Endüstri için: Bu teknoloji, vericilerin ve alıcıların sabit olduğu niş, sabit kurulum senaryoları (müze rehberleri, fabrika robot iletişimi) için hazırdır. Kamera sensörü üreticileriyle (bu makaledeki gibi Sony) ortaklık yaparak, önceden eğitilmiş veya kolayca eğitilebilir eşitleyici bloklarını doğrudan sensörün dijital arka ucuna gömün ve "OCC-hazır" kameraları satılabilir bir özellik haline getirin.

5. Teknik Detaylar

Temel teknik zorluk, PDF'in Şekil 1(b)'de gösterildiği gibi ideal CIE 1931 renk uzayı ile kameranın gerçek spektral duyarlılığı arasındaki uyumsuzluktur. Bu, alınan (R, G, B) değerlerinin iletilen yoğunlukların doğrusal karışımları olmasına neden olur. (x, y)'ye dönüşüm yardımcı olur ancak doğrusal olmayanlıkları ortadan kaldırmaz. $N_h$ gizli katmanına sahip sinir ağı, $\mathbf{p}$'nin bit olasılıklarının 9 boyutlu bir vektörü olduğu $f: (x, y) \rightarrow \mathbf{p}$ fonksiyonunu öğrenir. $k$-ıncı bit için LLR şu şekilde hesaplanır: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ Bu LLR'lar, güçlü LDPC kod çözücüsü için yumuşak girdiler sağlar ve nihai hatasız sonuca ulaşmak için ileri hata düzeltmeyi mümkün kılar.

6. Analiz Çerçevesi Örneği

Durum: OCC için Yeni Bir Kameranın Değerlendirilmesi. Bu araştırma, herhangi bir kameranın yüksek dereceli CSK için uygunluğunu kıyaslamak için bir çerçeve sağlar.

Veri Edinimi: Kalibre edilmiş bir LED dizisi kullanarak bilinen 512-CSK sembollerini iletin. Test edilen kamera ile ham sensör verisini yakalayın.
Ön İşleme: Ham RGB yamalarını standart matris kullanarak CIE 1931 (x, y) koordinatlarına dönüştürün.
Model Eğitimi: Alınan (x, y) kümelerini 512 iletilen sembol etiketlerine geri eşlemek için çok etiketli bir sinir ağı (örneğin, basit bir 3 katmanlı MLP) eğitin. Eğitim seti bilinen sembol eşlemesidir.
Performans Metriği: LDPC kod çözümünden sonraki nihai doğrulama doğruluğu veya BER, kameranın yeteneğini doğrudan gösterir. Yüksek bir doğruluk, düşük doğal bozulma veya yüksek doğrusallık anlamına gelir ve onu iyi bir OCC alıcısı yapar.
Karşılaştırma: Farklı kameralar için tekrarlayın. Gerekli sinir ağı karmaşıklığı (derinlik $N_h$, genişlik $N_u$), kameranın çapraz konuşma şiddeti için bir vekil haline gelir.

Bu çerçeve, teknik özellik sayfası analizinin ötesine geçerek işlevsel, haberleşme odaklı bir değerlendirmeye yönelir.

7. Gelecek Uygulamalar ve Yönelimler

Uygulamalar:

Hassas İç Mekan Konumlandırma: Yüksek veri hızlı OCC, karmaşık konum parmak izlerini veya haritaları kimlik kodlarıyla birlikte iletebilir.
Artırılmış Gerçeklik (AR) Bağlantısı: Akıllı ışıklar, nesneler veya sanat eserleri hakkındaki meta verileri doğrudan akıllı telefon kameralarına yayınlayabilir, bulut araması olmadan sorunsuz AR'ı mümkün kılar.
RF-duyarlı alanlarda Endüstriyel IoT: Hastanelerde veya uçaklarda robotlar, sensörler ve kontrolörler arasında mevcut tesis aydınlatmasını kullanarak iletişim.
Sualtı Haberleşmesi: CSK kullanan mavi-yeşil LED'ler, su altı araçları ve sensörler için daha yüksek veri hızları sağlayabilir.

Araştırma Yönelimleri:

Uçtan Uca Öğrenme: Ayrı bloklardan (demodülasyon, eşitleme, kod çözme) öteye, doğrudan BER minimizasyonu için eğitilmiş tek bir derin ağa geçiş.
Dinamik Kanal Telafisi: Kamera otomatik pozlama, hareket bulanıklığı veya ortam ışığı değişimleri gibi değişen koşullara gerçek zamanlı uyum sağlayabilen sinir ağları geliştirme.
Sinir Ağı Mimarilerinin Standardizasyonu: Kamera donanımı veya firmware'inde uygulanabilecek hafif, standartlaştırılmış eşitleme sinir ağı modelleri önerme.
6G Vizyonu ile Entegrasyon: OCC'yi, Next G Alliance'ın beyaz kitaplarında araştırıldığı gibi, 6G'nin heterojen ağ mimarisi içinde tamamlayıcı bir teknoloji olarak konumlandırma.

8. Referanslar

H.-W. Chen ve diğerleri, "4 cm üzerinde 8-CSK veri iletimi," İlgili Konferans, 2019.
C. Zhu ve diğerleri, "Dört renkli LED kullanarak 80 cm üzerinde 16-CSK," İlgili Dergi, 2016.
N. Murata ve diğerleri, "IEEE 802.15.7'ye dayalı 100 cm üzerinde 16-dijital CSK," İlgili Konferans, 2016.
P. Hu ve diğerleri, "Üç LED tabanlı 3 cm üzerinde 32-CSK," İlgili Dergi, 2019.
R. Singh ve diğerleri, "Üç LED tabanlı 32-CSK," İlgili Konferans, 2014.
J.-Y. Zhu ve diğerleri, "Döngü-Tutarlı Çekişmeli Ağlar Kullanarak Eşleştirilmemiş Görüntüden Görüntüye Çeviri," IEEE Uluslararası Bilgisayarla Görme Konferansı (ICCV), 2017. (Öğrenme tabanlı alan çevirisi kavramı için harici kaynak)
IEEE Haberleşme Topluluğu, "Görünür Işık Haberleşmesi: Standardizasyon için Bir Yol Haritası," Teknik Rapor, 2022. (Endüstri zorlukları için harici kaynak)
Next G Alliance, "6G Vizyonu ve Çerçevesi," Beyaz Kitap, 2023. (Gelecek ağ entegrasyonu için harici kaynak)
"Commission Internationale de l'Eclairage (CIE) 1931 renk uzayı," Standart.
Sony Semiconductor Solutions Corporation, "IMX530 Sensör Veri Sayfası," Teknik Şartname.