選擇語言

首次展示使用神經網絡均衡技術進行512色移鍵控訊號解調以實現光學相機通訊

實驗展示使用CMOS影像感測器及多標籤神經網絡均衡器,實現無誤差解調嘅512-CSK光學相機通訊傳輸。
rgbcw.org | PDF Size: 0.4 MB
評分: 4.5/5
您的評分
您已經為此文檔評過分
PDF文檔封面 - 首次展示使用神經網絡均衡技術進行512色移鍵控訊號解調以實現光學相機通訊

目錄

1. 簡介

光學相機通訊(OCC)係一種極具潛力嘅新一代光學無線通訊技術,利用相機中無處不在嘅CMOS影像感測器作為接收器。佢提供免牌照、成本效益高嘅通訊頻道。一個主要挑戰係喺保持無閃爍操作嘅同時,提升受相機幀率同曝光時間限制嘅數據吞吐量。色移鍵控(CSK)係IEEE 802.15.7標準中嘅一種調制方案,將數據映射到CIE 1931色度空間中嘅顏色,以提高數據速率。然而,相機光譜靈敏度引起嘅串擾需要補償。先前嘅演示喺短距離內實現咗最多32-CSK。本文首次實驗展示咗512-CSK訊號喺4米距離上實現無誤差解調嘅傳輸,使用基於神經網絡嘅均衡器來處理非線性串擾。

2. 接收器配置

接收器系統基於Sony IMX530 CMOS影像感測器模組,配備50mm鏡頭,能夠輸出未經後處理(去馬賽克、降噪、白平衡)嘅12位元原始RGB數據。

2.1 相機系統與原始數據

Sony相機系統輸出純粹嘅原始影像數據,保留咗原始感測器讀數,對於喺任何色彩校正引入失真之前進行準確訊號處理至關重要。

2.2 色彩空間轉換

使用標準轉換矩陣將原始RGB值轉換為CIE 1931 (x, y) 色度座標: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 神經網絡均衡器

一個多標籤分類神經網絡作為均衡器,用於補償非線性串擾。佢有2個輸入單元(x, y)、$N_h$個隱藏層(每層$N_u$個單元),以及$M=log_2(512)=9$個輸出單元(每個符號嘅位元數)。網絡輸出一個後驗概率分佈$p(1|x,y)$,從中計算對數似然比(LLR)以輸入到LDPC解碼器。512-CSK嘅星座點從藍色頂點(x=0.1805, y=0.0722)開始以三角形方式排列。

3. 實驗結果

3.1 實驗設置

傳輸使用一個8x8 LED平面陣列(面板尺寸:6.5厘米)。啟動嘅LED數量由1x1到8x8變化,以根據佔據嘅影像面積(光強度)評估誤碼率(BER)。傳輸距離固定為4米。

3.2 誤碼率表現

該系統實現咗512-CSK嘅無誤差解調。誤碼率特性針對捕獲影像中嘅有效LED面積進行評估。神經均衡器成功減輕咗串擾,使得喺傳統線性方法會失效嘅高調制階數下實現可靠解調。

關鍵性能指標

調制階數: 512-CSK(9位元/符號)

傳輸距離: 4米

結果: 實現無誤差解調

4. 核心見解與分析

核心見解

呢項工作唔單止係將CSK推至512色;佢係一個從基於物理嘅訊號清理到數據驅動重建嘅戰略性轉向。真正嘅突破係將嚴重嘅通道間串擾唔當作需要過濾嘅噪音問題,而係當作一個確定性、非線性嘅失真映射,由神經網絡學習並反轉。呢個反映咗計算影像學中見到嘅範式轉移,好似CycleGAN論文(Zhu等人,2017)中討論嘅深度學習模型,學習喺領域之間(例如,有噪音到乾淨)轉換而無需配對示例。喺度,神經網絡學習相機光譜「指紋」嘅反函數。

邏輯流程

邏輯令人信服:1)高階CSK受串擾瓶頸限制。2)相機串擾複雜且非線性。3)因此,使用喺接收數據上訓練嘅通用函數逼近器(神經網絡)來建模並消除佢。從原始感測器數據 -> CIE 1931轉換 -> 神經網絡均衡器 -> LDPC解碼器嘅流程係一個現代、混合嘅訊號處理鏈。佢巧妙地使用標準化嘅CIE空間作為穩定嘅中間表示,將色彩科學同通訊理論分開。

優點與缺點

優點: 演示喺實證上穩固,喺實用嘅4米距離上實現咗創紀錄嘅512-CSK。使用原始感測器數據繞過咗破壞性嘅相機ISP處理流程——一個關鍵且常被忽視嘅策略。該方法與接收器無關;神經網絡可以為任何相機重新訓練。缺點: 該方法本質上需要大量數據,並且需要針對每部相機進行校準。論文對神經網絡嘅複雜度、延遲同功耗隻字不提——對於實時、移動OCC而言係致命細節。8x8 LED陣列係一個笨重嘅發射器,與OCC利用無處不在光源嘅目標相矛盾。正如IEEE ComSoc關於VLC嘅研究所指出,可擴展性同互操作性仍然係重大障礙。

可行見解

對於研究人員:未來在於輕量級、或許係聯邦學習模型,用於設備端校準。探索基於Transformer嘅架構,佢哋可能比前饋神經網絡更好地處理連續符號失真。對於業界:呢項技術已準備好用於利基、固定安裝場景(博物館導覽、工廠機械人通訊),其中發射器同接收器穩定。與相機感測器製造商(好似本文中嘅Sony)合作,將預訓練或易於訓練嘅均衡器模塊直接嵌入感測器嘅數字後端,令「OCC就緒」相機成為可銷售嘅功能。

5. 技術細節

核心技術挑戰係理想CIE 1931色彩空間與相機實際光譜靈敏度之間嘅不匹配,如PDF中圖1(b)所示。呢個導致接收嘅(R, G, B)值成為發射強度嘅線性混合。轉換到(x, y)有幫助,但並未消除非線性。神經網絡憑藉其$N_h$個隱藏層,學習函數$f: (x, y) \rightarrow \mathbf{p}$,其中$\mathbf{p}$係一個9維嘅位元概率向量。第$k$個位元嘅LLR計算如下: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ 呢啲LLR為強大嘅LDPC解碼器提供軟輸入,實現前向糾錯以達致最終無誤差結果。

6. 分析框架示例

案例:評估一部新相機用於OCC。 呢項研究提供咗一個框架,用於基準測試任何相機對高階CSK嘅適用性。

  1. 數據獲取: 使用校準嘅LED陣列發送已知嘅512-CSK符號。用待測相機捕獲原始感測器數據。
  2. 預處理: 使用標準矩陣將原始RGB區域轉換為CIE 1931 (x, y) 座標。
  3. 模型訓練: 訓練一個多標籤神經網絡(例如,一個簡單嘅3層MLP),將接收到嘅(x, y)集群映射返去512個發射符號標籤。訓練集係已知嘅符號映射。
  4. 性能指標: LDPC解碼後嘅最終驗證準確率或誤碼率直接指示相機嘅能力。高準確率表示低固有失真或高線性度,使其成為良好嘅OCC接收器。
  5. 比較: 對唔同相機重複測試。所需神經網絡複雜度(深度$N_h$,寬度$N_u$)成為相機串擾嚴重程度嘅代理指標。
呢個框架超越咗規格表分析,邁向功能性、以通訊為中心嘅評估。

7. 未來應用與方向

應用:

  • 精準室內定位: 高數據速率OCC可以傳輸複雜嘅位置指紋或地圖,連同ID碼。
  • 擴增實境(AR)連結: 智能燈具可以直接向智能手機相機廣播關於物件或藝術品嘅元數據,實現無需雲端查詢嘅無縫AR體驗。
  • 射頻敏感區域嘅工業物聯網: 喺醫院或飛機等場所,利用現有設施照明,實現機械人、感測器同控制器之間嘅通訊。
  • 水下通訊: 使用CSK嘅藍綠光LED可以為潛水器同感測器提供更高數據速率。
研究方向:
  • 端到端學習: 超越獨立模塊(解調、均衡、解碼),轉向直接為最小化誤碼率而訓練嘅單一深度網絡。
  • 動態通道補償: 開發能夠實時適應變化條件(如相機自動曝光、動態模糊或環境光變化)嘅神經網絡。
  • 神經網絡架構標準化: 提出輕量級、標準化嘅均衡用神經網絡模型,可以喺相機硬件或韌體中實現。
  • 與6G願景整合: 將OCC定位為6G異構網絡架構內嘅互補技術,正如Next G聯盟白皮書中所探討。

8. 參考文獻

  1. H.-W. Chen等人,「8-CSK數據傳輸超過4厘米」,相關會議,2019。
  2. C. Zhu等人,「使用四色LED實現16-CSK超過80厘米」,相關期刊,2016。
  3. N. Murata等人,「基於IEEE 802.15.7嘅16位數字CSK超過100厘米」,相關會議,2016。
  4. P. Hu等人,「基於三色LED嘅32-CSK超過3厘米」,相關期刊,2019。
  5. R. Singh等人,「基於三色LED嘅32-CSK」,相關會議,2014。
  6. J.-Y. Zhu等人,「使用循環一致性對抗網絡進行非配對圖像到圖像轉換」,IEEE國際計算機視覺會議(ICCV),2017。(用於基於學習嘅領域轉換概念嘅外部來源)
  7. IEEE通訊學會,「可見光通訊:標準化路線圖」,技術報告,2022。(用於行業挑戰嘅外部來源)
  8. Next G聯盟,「6G願景與框架」,白皮書,2023。(用於未來網絡整合嘅外部來源)
  9. 「國際照明委員會(CIE)1931色彩空間」,標準。
  10. Sony Semiconductor Solutions Corporation,「IMX530感測器數據手冊」,技術規格。