选择语言

基于神经均衡的光学相机通信512阶颜色偏移键控信号解调的首次实验验证

利用CMOS图像传感器和多标签神经网络均衡器,实验演示了512-CSK OCC传输,实现了无误码解调。
rgbcw.org | PDF Size: 0.4 MB
评分: 4.5/5
您的评分
您已经为此文档评过分
PDF文档封面 - 基于神经均衡的光学相机通信512阶颜色偏移键控信号解调的首次实验验证

目录

1. 引言

光学相机通信(OCC)是一种前景广阔的下一代光无线通信技术,它利用相机中普遍存在的CMOS图像传感器作为接收机,提供了无需许可、经济高效的通信信道。其面临的一个关键挑战是在保持无闪烁操作的同时,提升受限于相机帧率和曝光时间的数据吞吐量。颜色偏移键控(CSK)是IEEE 802.15.7标准中的一种调制方案,它将数据映射到CIE 1931色度空间中的颜色,以提高数据速率。然而,相机光谱灵敏度引起的串扰需要进行补偿。此前的演示在短距离内最多实现了32-CSK。本文首次通过实验演示了在4米距离上实现无误码解调的512-CSK信号传输,其中采用了基于神经网络的均衡器来处理非线性串扰。

2. 接收机配置

接收机系统基于索尼IMX530 CMOS图像传感器模块,配备50mm镜头,能够输出未经后处理(去马赛克、降噪、白平衡)的12位原始RGB数据。

2.1 相机系统与原始数据

索尼相机系统输出纯净的原始图像数据,保留了原始传感器读数,这对于在任何色彩校正引入失真之前进行精确的信号处理至关重要。

2.2 色彩空间转换

原始RGB值使用标准转换矩阵转换为CIE 1931 (x, y) 色度坐标: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 神经网络均衡器

一个多标签分类神经网络充当均衡器,以补偿非线性串扰。该网络有2个输入单元(x, y),$N_h$个隐藏层,每层$N_u$个单元,以及$M=log_2(512)=9$个输出单元(每符号比特数)。网络输出后验概率分布$p(1|x,y)$,据此计算对数似然比(LLR)并输入LDPC解码器。512-CSK的星座点从蓝色顶点(x=0.1805, y=0.0722)开始呈三角形排列。

3. 实验结果

3.1 实验设置

传输使用一个8x8 LED平面阵列(面板尺寸:6.5厘米)。激活的LED数量从1x1变化到8x8,以根据占据的图像区域(光强)评估误码率(BER)。传输距离固定为4米。

3.2 误码率性能

该系统实现了512-CSK的无误码解调。误码率特性根据捕获图像中的有效LED面积进行了评估。神经均衡器成功抑制了串扰,使得在这种传统线性方法会失效的高阶调制下仍能实现可靠的解调。

关键性能指标

调制阶数: 512-CSK(9比特/符号)

传输距离: 4米

结果: 实现无误码解调

4. 核心见解与分析

核心见解

这项工作不仅仅是把CSK推到512种颜色;它标志着从基于物理的信号清理到数据驱动重建的战略性转变。真正的突破在于,将严重的信道间串扰不是当作需要滤除的噪声问题,而是当作一个确定性的、非线性的失真映射,由神经网络学习并求逆。这反映了计算成像领域的范式转变,正如CycleGAN论文(Zhu等人,2017)中讨论的深度学习模型那样,学习在领域之间(例如,从有噪声到干净)进行转换,而无需成对的示例。在这里,神经网络学习的是相机光谱“指纹”的逆映射。

逻辑脉络

其逻辑令人信服:1)高阶CSK受限于串扰。2)相机串扰是复杂且非线性的。3)因此,使用在接收数据上训练的通用函数逼近器(神经网络)来建模并消除它。从原始传感器数据 -> CIE 1931转换 -> NN均衡器 -> LDPC解码器的流程,构成了一条现代、混合的信号处理链。它巧妙地利用标准化的CIE空间作为稳定的中间表示,将色彩科学与通信理论分离开来。

优势与不足

优势: 该演示在实证上非常扎实,在实用的4米距离上实现了创纪录的512-CSK。使用原始传感器数据绕过了破坏性的相机图像信号处理(ISP)流水线——这是一个关键且常被忽视的策略。该方法与接收机无关;神经网络可以为任何相机重新训练。不足: 该方法本质上需要大量数据,并且需要针对每台相机进行校准。论文未提及神经网络的复杂度、延迟和功耗——这些对于实时、移动的OCC应用是致命细节。8x8 LED阵列是一个笨重的发射器,与OCC利用无处不在光源的目标相悖。正如IEEE通信学会在可见光通信研究中指出的,可扩展性和互操作性仍然是重大障碍。

可操作的见解

对于研究人员:未来在于轻量级、或许是联邦学习模型,用于设备端校准。探索基于Transformer的架构,它可能比前馈神经网络更好地处理序列符号失真。对于工业界:该技术已准备好用于利基、固定安装场景(博物馆导览、工厂机器人通信),其中发射器和接收器是稳定的。与相机传感器制造商(如本文中的索尼)合作,将预训练或易于训练的均衡器模块直接嵌入传感器的数字后端,使“支持OCC”成为相机的一个可销售特性。

5. 技术细节

核心技术挑战在于理想的CIE 1931色彩空间与相机实际光谱灵敏度之间的不匹配,如PDF中图1(b)所示。这导致接收到的(R, G, B)值是发射强度的线性混合。转换到(x, y)坐标有所帮助,但并未消除非线性。具有$N_h$个隐藏层的神经网络学习函数$f: (x, y) \rightarrow \mathbf{p}$,其中$\mathbf{p}$是一个9维的比特概率向量。第$k$个比特的对数似然比计算如下: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ 这些LLR为强大的LDPC解码器提供了软输入,从而实现前向纠错,达到最终的无误码结果。

6. 分析框架示例

案例:评估新相机对OCC的适用性。 本研究提供了一个框架,用于评估任何相机对高阶CSK的适用性。

  1. 数据采集: 使用校准的LED阵列发送已知的512-CSK符号。用待测相机捕获原始传感器数据。
  2. 预处理: 使用标准矩阵将原始RGB图像块转换为CIE 1931 (x, y)坐标。
  3. 模型训练: 训练一个多标签神经网络(例如,一个简单的3层MLP),将接收到的(x, y)簇映射回512个发射符号标签。训练集是已知的符号映射。
  4. 性能指标: LDPC解码后的最终验证准确率或误码率直接指示了相机的性能。高准确率表明固有的失真低或线性度高,使其成为良好的OCC接收机。
  5. 比较: 对不同相机重复此过程。所需的神经网络复杂度(深度$N_h$,宽度$N_u$)成为相机串扰严重程度的代理指标。
该框架超越了规格表分析,转向了以通信功能为中心的评估。

7. 未来应用与方向

应用:

  • 高精度室内定位: 高数据速率的OCC可以传输复杂的位置指纹或地图,同时发送ID码。
  • 增强现实(AR)联动: 智能灯具可以将物体或艺术品的元数据直接广播到智能手机相机,实现无需云端查询的无缝AR体验。
  • 射频敏感区域的工业物联网: 在医院或飞机等场所,利用现有设施照明,实现机器人、传感器和控制器之间的通信。
  • 水下通信: 使用CSK的蓝绿光LED可以为潜水器和传感器提供更高的数据速率。
研究方向:
  • 端到端学习: 超越分离的模块(解调、均衡、解码),转向直接为最小化误码率而训练的单一深度网络。
  • 动态信道补偿: 开发能够实时适应相机自动曝光、运动模糊或环境光变化等条件的神经网络。
  • 神经网络架构标准化: 提出用于均衡的轻量级、标准化的神经网络模型,以便在相机硬件或固件中实现。
  • 与6G愿景融合: 将OCC定位为6G异构网络架构中的补充技术,正如Next G联盟白皮书中所探讨的那样。

8. 参考文献

  1. H.-W. Chen 等人,“8-CSK data transmission over 4 cm,” 相关会议, 2019.
  2. C. Zhu 等人,“16-CSK over 80 cm using a quadrichromatic LED,” 相关期刊, 2016.
  3. N. Murata 等人,“16-digital CSK over 100 cm based on IEEE 802.15.7,” 相关会议, 2016.
  4. P. Hu 等人,“Tri-LEDs based 32-CSK over 3 cm,” 相关期刊, 2019.
  5. R. Singh 等人,“Tri-LEDs based 32-CSK,” 相关会议, 2014.
  6. J.-Y. Zhu 等人,“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks,” IEEE International Conference on Computer Vision (ICCV), 2017. (基于学习的领域转换概念的外部来源)
  7. IEEE Communications Society, “Visible Light Communication: A Roadmap for Standardization,” Technical Report, 2022. (行业挑战的外部来源)
  8. Next G Alliance, “6G Vision and Framework,” White Paper, 2023. (未来网络融合的外部来源)
  9. “Commission Internationale de l'Eclairage (CIE) 1931 color space,” 标准.
  10. Sony Semiconductor Solutions Corporation, “IMX530 Sensor Datasheet,” 技术规格书.