首次展示使用神經網絡均衡技術進行512色移鍵控訊號解調以實現光學相機通訊

1. 簡介

光學相機通訊（OCC）係一種極具潛力嘅新一代光學無線通訊技術，利用相機中無處不在嘅CMOS影像感測器作為接收器。佢提供免牌照、成本效益高嘅通訊頻道。一個主要挑戰係喺保持無閃爍操作嘅同時，提升受相機幀率同曝光時間限制嘅數據吞吐量。色移鍵控（CSK）係IEEE 802.15.7標準中嘅一種調制方案，將數據映射到CIE 1931色度空間中嘅顏色，以提高數據速率。然而，相機光譜靈敏度引起嘅串擾需要補償。先前嘅演示喺短距離內實現咗最多32-CSK。本文首次實驗展示咗512-CSK訊號喺4米距離上實現無誤差解調嘅傳輸，使用基於神經網絡嘅均衡器來處理非線性串擾。

2. 接收器配置

接收器系統基於Sony IMX530 CMOS影像感測器模組，配備50mm鏡頭，能夠輸出未經後處理（去馬賽克、降噪、白平衡）嘅12位元原始RGB數據。

2.1 相機系統與原始數據

Sony相機系統輸出純粹嘅原始影像數據，保留咗原始感測器讀數，對於喺任何色彩校正引入失真之前進行準確訊號處理至關重要。

2.2 色彩空間轉換

使用標準轉換矩陣將原始RGB值轉換為CIE 1931 (x, y) 色度座標： $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 神經網絡均衡器

一個多標籤分類神經網絡作為均衡器，用於補償非線性串擾。佢有2個輸入單元（x, y）、$N_h$個隱藏層（每層$N_u$個單元），以及$M=log_2(512)=9$個輸出單元（每個符號嘅位元數）。網絡輸出一個後驗概率分佈$p(1|x,y)$，從中計算對數似然比（LLR）以輸入到LDPC解碼器。512-CSK嘅星座點從藍色頂點（x=0.1805, y=0.0722）開始以三角形方式排列。

3. 實驗結果

3.1 實驗設置

傳輸使用一個8x8 LED平面陣列（面板尺寸：6.5厘米）。啟動嘅LED數量由1x1到8x8變化，以根據佔據嘅影像面積（光強度）評估誤碼率（BER）。傳輸距離固定為4米。

3.2 誤碼率表現

該系統實現咗512-CSK嘅無誤差解調。誤碼率特性針對捕獲影像中嘅有效LED面積進行評估。神經均衡器成功減輕咗串擾，使得喺傳統線性方法會失效嘅高調制階數下實現可靠解調。

關鍵性能指標

調制階數： 512-CSK（9位元/符號）

傳輸距離： 4米

結果： 實現無誤差解調

4. 核心見解與分析

核心見解

呢項工作唔單止係將CSK推至512色；佢係一個從基於物理嘅訊號清理到數據驅動重建嘅戰略性轉向。真正嘅突破係將嚴重嘅通道間串擾唔當作需要過濾嘅噪音問題，而係當作一個確定性、非線性嘅失真映射，由神經網絡學習並反轉。呢個反映咗計算影像學中見到嘅範式轉移，好似CycleGAN論文（Zhu等人，2017）中討論嘅深度學習模型，學習喺領域之間（例如，有噪音到乾淨）轉換而無需配對示例。喺度，神經網絡學習相機光譜「指紋」嘅反函數。

邏輯流程

邏輯令人信服：1）高階CSK受串擾瓶頸限制。2）相機串擾複雜且非線性。3）因此，使用喺接收數據上訓練嘅通用函數逼近器（神經網絡）來建模並消除佢。從原始感測器數據 -> CIE 1931轉換 -> 神經網絡均衡器 -> LDPC解碼器嘅流程係一個現代、混合嘅訊號處理鏈。佢巧妙地使用標準化嘅CIE空間作為穩定嘅中間表示，將色彩科學同通訊理論分開。

優點與缺點

優點： 演示喺實證上穩固，喺實用嘅4米距離上實現咗創紀錄嘅512-CSK。使用原始感測器數據繞過咗破壞性嘅相機ISP處理流程——一個關鍵且常被忽視嘅策略。該方法與接收器無關；神經網絡可以為任何相機重新訓練。缺點： 該方法本質上需要大量數據，並且需要針對每部相機進行校準。論文對神經網絡嘅複雜度、延遲同功耗隻字不提——對於實時、移動OCC而言係致命細節。8x8 LED陣列係一個笨重嘅發射器，與OCC利用無處不在光源嘅目標相矛盾。正如IEEE ComSoc關於VLC嘅研究所指出，可擴展性同互操作性仍然係重大障礙。

可行見解

對於研究人員：未來在於輕量級、或許係聯邦學習模型，用於設備端校準。探索基於Transformer嘅架構，佢哋可能比前饋神經網絡更好地處理連續符號失真。對於業界：呢項技術已準備好用於利基、固定安裝場景（博物館導覽、工廠機械人通訊），其中發射器同接收器穩定。與相機感測器製造商（好似本文中嘅Sony）合作，將預訓練或易於訓練嘅均衡器模塊直接嵌入感測器嘅數字後端，令「OCC就緒」相機成為可銷售嘅功能。

5. 技術細節

核心技術挑戰係理想CIE 1931色彩空間與相機實際光譜靈敏度之間嘅不匹配，如PDF中圖1(b)所示。呢個導致接收嘅（R, G, B）值成為發射強度嘅線性混合。轉換到（x, y）有幫助，但並未消除非線性。神經網絡憑藉其$N_h$個隱藏層，學習函數$f: (x, y) \rightarrow \mathbf{p}$，其中$\mathbf{p}$係一個9維嘅位元概率向量。第$k$個位元嘅LLR計算如下： $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ 呢啲LLR為強大嘅LDPC解碼器提供軟輸入，實現前向糾錯以達致最終無誤差結果。

6. 分析框架示例

案例：評估一部新相機用於OCC。 呢項研究提供咗一個框架，用於基準測試任何相機對高階CSK嘅適用性。

數據獲取： 使用校準嘅LED陣列發送已知嘅512-CSK符號。用待測相機捕獲原始感測器數據。
預處理： 使用標準矩陣將原始RGB區域轉換為CIE 1931 (x, y) 座標。
模型訓練： 訓練一個多標籤神經網絡（例如，一個簡單嘅3層MLP），將接收到嘅（x, y）集群映射返去512個發射符號標籤。訓練集係已知嘅符號映射。
性能指標： LDPC解碼後嘅最終驗證準確率或誤碼率直接指示相機嘅能力。高準確率表示低固有失真或高線性度，使其成為良好嘅OCC接收器。
比較： 對唔同相機重複測試。所需神經網絡複雜度（深度$N_h$，寬度$N_u$）成為相機串擾嚴重程度嘅代理指標。

呢個框架超越咗規格表分析，邁向功能性、以通訊為中心嘅評估。

7. 未來應用與方向

應用：

精準室內定位： 高數據速率OCC可以傳輸複雜嘅位置指紋或地圖，連同ID碼。
擴增實境（AR）連結： 智能燈具可以直接向智能手機相機廣播關於物件或藝術品嘅元數據，實現無需雲端查詢嘅無縫AR體驗。
射頻敏感區域嘅工業物聯網： 喺醫院或飛機等場所，利用現有設施照明，實現機械人、感測器同控制器之間嘅通訊。
水下通訊： 使用CSK嘅藍綠光LED可以為潛水器同感測器提供更高數據速率。

研究方向：

端到端學習： 超越獨立模塊（解調、均衡、解碼），轉向直接為最小化誤碼率而訓練嘅單一深度網絡。
動態通道補償： 開發能夠實時適應變化條件（如相機自動曝光、動態模糊或環境光變化）嘅神經網絡。
神經網絡架構標準化： 提出輕量級、標準化嘅均衡用神經網絡模型，可以喺相機硬件或韌體中實現。
與6G願景整合： 將OCC定位為6G異構網絡架構內嘅互補技術，正如Next G聯盟白皮書中所探討。

8. 參考文獻

H.-W. Chen等人，「8-CSK數據傳輸超過4厘米」，相關會議，2019。
C. Zhu等人，「使用四色LED實現16-CSK超過80厘米」，相關期刊，2016。
N. Murata等人，「基於IEEE 802.15.7嘅16位數字CSK超過100厘米」，相關會議，2016。
P. Hu等人，「基於三色LED嘅32-CSK超過3厘米」，相關期刊，2019。
R. Singh等人，「基於三色LED嘅32-CSK」，相關會議，2014。
J.-Y. Zhu等人，「使用循環一致性對抗網絡進行非配對圖像到圖像轉換」，IEEE國際計算機視覺會議（ICCV），2017。（用於基於學習嘅領域轉換概念嘅外部來源）
IEEE通訊學會，「可見光通訊：標準化路線圖」，技術報告，2022。（用於行業挑戰嘅外部來源）
Next G聯盟，「6G願景與框架」，白皮書，2023。（用於未來網絡整合嘅外部來源）
「國際照明委員會（CIE）1931色彩空間」，標準。
Sony Semiconductor Solutions Corporation，「IMX530感測器數據手冊」，技術規格。

目錄