Chagua Lugha

Uthibitisho wa Kwanza wa Uchanganuzi wa Ishara ya 512-Color Shift Keying Kwa Kutumia Usawa wa Neural kwa Mawasiliano ya Kamera ya Mwanga

Uthibitisho wa majaribio ya usambazaji wa 512-CSK OCC kwa kutumia sensor ya picha ya CMOS na kiwango cha usawa cha mtandao wa neva yenye lebo nyingi kwa uchanganuzi usio na makosa.
rgbcw.org | PDF Size: 0.4 MB
Ukadiriaji: 4.5/5
Ukadiriaji Wako
Umekadiria waraka huu tayari
Kifuniko cha Waraka PDF - Uthibitisho wa Kwanza wa Uchanganuzi wa Ishara ya 512-Color Shift Keying Kwa Kutumia Usawa wa Neural kwa Mawasiliano ya Kamera ya Mwanga

Yaliyomo

1. Utangulizi

Mawasiliano ya Kamera ya Mwanga (OCC) ni teknolojia yenye matumaini kwa mawasiliano ya kisasa ya waya isiyo na waya ya mwanga, ikitumia sensor za picha za CMOS zilizopo kote katika kamera kama vipokeaji. Inatoa njia za mawasiliano zisizo na leseni na zenye gharama nafuu. Changamoto kuu ni kuongeza kasi ya uhamishaji wa data, iliyozuiwa na viwango vya sura za kamera na nyakati za kufichua, huku ikidumisha utendakazi usio na mabadiliko ya mwanga. Color-Shift Keying (CSK), ni mpango wa kurekebisha ishara kutoka IEEE 802.15.7, unaoweka data kwenye rangi katika nafasi ya rangi ya CIE 1931 ili kuongeza viwango vya data. Hata hivyo, ushawishi wa rangi unaosababishwa na unyeti wa wigo wa kamera unahitaji fidia. Uthibitisho wa awali ulifanikiwa hadi 32-CSK kwa umbali mfupi. Karatasi hii inawasilisha uthibitisho wa kwanza wa majaribio ya usambazaji wa ishara ya 512-CSK na uchanganuzi usio na makosa zaidi ya mita 4, kwa kutumia kielelezo cha usawa kinachotegemea mtandao wa neva kushughulikia ushawishi usio na mstari wa rangi.

2. Usanidi wa Kipokeaji

Mfumo wa kipokeaji unategemea moduli ya sensor ya picha ya Sony IMX530 CMOS yenye lenzi ya 50mm, inayoweza kutoa data ghafi ya RGB ya biti 12 bila usindikaji wa baadaye (kutenganisha rangi, kuondoa kelele, usawa wa rangi nyeupe).

2.1 Mfumo wa Kamera na Data Ghafi

Mfumo wa kamera ya Sony unatoa data ghafi safi ya picha, ikihifadhi usomaji wa asili wa sensor muhimu kwa usindikaji sahihi wa ishara kabla ya marekebisho yoyote ya rangi kuingiza upotoshaji.

2.2 Ubadilishaji wa Nafasi ya Rangi

Thamani za RGB ghafi hubadilishwa kuwa viwianishi vya rangi vya CIE 1931 (x, y) kwa kutumia tumbo la kawaida la mabadiliko: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 Kielelezo cha Usawa cha Mtandao wa Neva

Mtandao wa neva wa uainishaji wenye lebo nyingi hutumika kama kielelezo cha usawa kulipa fidia kwa ushawishi usio na mstari wa rangi. Una vitengo 2 vya kuingiza (x, y), tabaka $N_h$ zilizofichwa zenye vitengo $N_u$, na vitengo $M=log_2(512)=9$ vya kutoka (bits kwa kila alama). Mtandao huo unatoa usambazaji wa uwezekano wa baadaye $p(1|x,y)$, ambapo Log-Likelihood Ratios (LLR) huhesabiwa kwa ajili ya kuingiza kwenye kichanganuzi cha LDPC. Pointi za makundi ya nyota za 512-CSK zimepangwa kwa umbo la pembetatu kuanzia kwenye kipeo cha bluu (x=0.1805, y=0.0722).

3. Matokeo ya Jaribio

3.1 Usanidi wa Jaribio

Usambazaji ulitumia safu ya 8x8 ya LED ya ndege (ukubwa wa paneli: 6.5 cm). Idadi ya LED zinazofanya kazi ilibadilishwa kutoka 1x1 hadi 8x8 ili kutathmini Kiwango cha Hitilafu ya Bit (BER) kulingana na eneo la picha lililochukuliwa (nguvu ya mwanga). Umbali wa usambazaji uliwekwa kwa mita 4.

3.2 Ufanisi wa BER

Mfumo ulifanikiwa kuchanganua bila makosa kwa 512-CSK. Tabia za BER zilitathminiwa dhidi ya eneo halisi la LED katika picha iliyochukuliwa. Kielelezo cha usawa cha neva kilifanikiwa kupunguza ushawishi wa rangi, na kuwezesha uchanganuzi unaotegemewa katika hali hii ya juu ya kurekebisha ishara ambapo njia za kawaida za mstari zingeshindwa.

Kipimo Muhimu cha Ufanisi

Kiwango cha Kurekebisha Ishara: 512-CSK (bits 9/alama)

Umbali wa Usambazaji: Mita 4

Matokeo: Uchanganuzi usio na makosa umepatikana

4. Uelewa wa Msingi & Uchambuzi

Uelewa wa Msingi

Kazi hii sio tu juu ya kuongeza CSK hadi rangi 512; ni mabadiliko ya kimkakati kutoka kwa usafishaji wa ishara unaotegemea fizikia hadi ujenzi wa data. Mafanikio halisi ni kushughulikia ushawishi mkubwa wa rangi kati ya njia sio kama shida ya kelele ya kuchujwa, bali kama ramani ya upotoshaji usio na mstari na wa hakika, ambayo inajifunza na kubadilishwa na mtandao wa neva. Hii inafanana na mabadiliko ya mfano yaliyoonekana katika uchoraji picha wa hesabu, ambapo miundo ya kujifunza kwa kina kama ile iliyojadiliwa katika karatasi ya CycleGAN (Zhu et al., 2017) hujifunza kutafsiri kati ya nyanja (mfano, yenye kelele hadi safi) bila mifano iliyowekwa pamoja. Hapa, NN inajifunza kinyume cha 'alama ya kidole' ya wigo ya kamera.

Mtiririko wa Mantiki

Mantiki ni ya kulazimisha: 1) CSK ya hali ya juu imezuiwa na ushawishi wa rangi. 2) Ushawishi wa rangi wa kamera ni tata na usio na mstari. 3) Kwa hivyo, tumia kikadirio cha kazi ya ulimwengu (mtandao wa neva) iliyofunzwa kwenye data iliyopokea ili kuiga na kuifuta. Mtiririko kutoka data ghafi ya sensor -> ubadilishaji wa CIE 1931 -> kielelezo cha usawa cha NN -> kichanganuzi cha LDPC ni mnyororo wa kisasa, mseto wa usindikaji wa ishara. Inatumia kwa busara nafasi ya kawaida ya CIE kama uwakilishi wa kati thabiti, ikitenganisha sayansi ya rangi na nadharia ya mawasiliano.

Nguvu & Mapungufu

Nguvu: Uthibitisho ni thabiti kwa majaribio, ukifikia rekodi ya 512-CSK zaidi ya umbali wa vitendo wa mita 4. Kutumia data ghafi ya sensor hupita mifumo ya kamera ya ISP inayoharibu—mbinu muhimu, ambayo mara nyingi hupuuzwa. Njia hii haitegemei kipokeaji; NN inaweza kufunzwa tena kwa kamera yoyote. Mapungufu: Njia hii kimsingi inahitaji data nyingi na inahitaji usawazishaji kwa kila kamera. Karatasi hiyo haijasema chochote kuhusu utata, ucheleweshaji, na matumizi ya nguvu ya NN—maelezo muhimu kwa OCC ya papo hapo na ya kusonga. Safu ya LED ya 8x8 ni kisambazaji kikubwa, kinapingana na lengo la OCC la kutumia vyanzo vya mwanga vilivyopo kila mahali. Kama ilivyoelezwa katika utafiti wa IEEE ComSoc kuhusu VLC, uwezo wa kuongezeka na utangamano bado ni vikwazo vikubwa.

Uelewa Unaoweza Kutekelezwa

Kwa watafiti: Baadaye iko katika miundo nyepesi, labda ya kujifunza kwa ushirikiano kwa usawazishaji kwenye kifaa. Chunguza usanifu unaotegemea transformer ambao unaweza kushughulikia upotoshaji wa alama zinazofuatana vizuri zaidi kuliko NN za mbele. Kwa tasnia: Teknolojia hii iko tayari kwa hali maalum, za usanidi thabiti (mwongozo wa makumbusho, mawasiliano ya roboti za kiwanda) ambapo visambazaji na vipokeaji viko thabiti. Shirikiana na wazalishaji wa sensor za kamera (kama Sony, kama ilivyo katika karatasi hii) ili kuingiza vizuizi vya kielelezo cha usawa vilivyofunzwa awali au rahisi kufunzwa moja kwa moja kwenye sehemu ya nyuma ya dijiti ya sensor, na kufanya kamera "zilizo tayari kwa OCC" kuwa kipengele cha kuuzwa.

5. Maelezo ya Kiufundi

Changamoto kuu ya kiufundi ni kutolingana kati ya nafasi bora ya rangi ya CIE 1931 na unyeli halisi wa wigo wa kamera, kama inavyoonyeshwa kwenye Mchoro 1(b) wa PDF. Hii husababisha thamani za (R, G, B) zilizopokelewa kuwa mchanganyiko wa mstari wa nguvu zilizotumwa. Ubadilishaji hadi (x, y) husaidia lakini haufuti upotoshaji usio na mstari. Mtandao wa neva, wenye tabaka zake $N_h$ zilizofichwa, hujifunza kazi $f: (x, y) \rightarrow \mathbf{p}$, ambapo $\mathbf{p}$ ni vekta ya uwezekano wa biti yenye mwelekeo 9. LLR ya biti ya $k$-th inahesabiwa kama: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ LLR hizi hutoa ingizo laini kwa kichanganuzi chenye nguvu cha LDPC, na kuwezesha urekebishaji wa makosa ya mbele kufikia matokeo ya mwisho yasiyo na makosa.

6. Mfano wa Mfumo wa Uchambuzi

Kesi: Kutathmini Kamera Mpya kwa OCC. Utafiti huu hutoa mfumo wa kupima ufaafu wa kamera yoyote kwa CSK ya hali ya juu.

  1. Upokeaji wa Data: Tuma alama za 512-CSK zinazojulikana kwa kutumia safu ya LED iliyosawazishwa. Pakua data ghafi ya sensor na kamera inayojaribiwa.
  2. Usindikaji wa Awali: Badilisha vipande vya RGB ghafi kuwa viwianishi vya CIE 1931 (x, y) kwa kutumia tumbo la kawaida.
  3. Mafunzo ya Mfano: Funza mtandao wa neva wenye lebo nyingi (mfano, MLP rahisi ya tabaka 3) kuweka ramani ya makundi ya (x, y) yaliyopokelewa kurudi kwenye lebo 512 za alama zilizotumwa. Seti ya mafunzo ni uwekaji ramani wa alama unaojulikana.
  4. Kipimo cha Ufanisi: Usahihi wa mwisho wa uthibitishaji au BER baada ya uchanganuzi wa LDPC huonyesha moja kwa moja uwezo wa kamera. Usahihi wa juu unaonyesha upotoshaji mdogo wa asili au mstari wa juu, na kuifanya kuwa kipokeaji kizuri cha OCC.
  5. Ulinganisho: Rudia kwa kamera tofauti. Utata unaohitajika wa mtandao wa neva (kina $N_h$, upana $N_u$) unakuwa mwakilishi wa ukali wa ushawishi wa rangi wa kamera.
Mfumo huu unahama zaidi ya uchambuzi wa orodha ya vipimo hadi tathmini ya kazi, inayolenga mawasiliano.

7. Matumizi ya Baadaye & Mwelekeo

Matumizi:

  • Uwekaji wa Ndani wa Usahihi: OCC yenye kasi ya juu ya data inaweza kusambaza alama za ngumu za eneo au ramani pamoja na misimbo ya kitambulisho.
  • Uhusiano wa Ukweli Ulioongezwa (AR): Taa zenye akili zinaweza kutangaza metadata kuhusu vitu au sanaa moja kwa moja kwenye kamera za simu, na kuwezesha AR bila kuna dosari bila kutafuta wingu.
  • IoT ya Viwanda katika Maeneo Yanayohisi RF: Mawasiliano kati ya roboti, sensor, na vidhibiti katika hospitali au ndege kwa kutumia taa zilizopo za ujenzi.
  • Mawasiliano ya Chini ya Maji: LED za bluu-kijani kwa kutumia CSK zinaweza kutoa viwango vya juu vya data kwa magari yanayozama chini ya maji na sensor.
Mwelekeo wa Utafiti:
  • Kujifunza Kutoka Mwanzo Hadi Mwisho: Kuhamia zaidi ya vizuizi tofauti (uchanganuzi, usawa, uchanganuzi) hadi mtandao mmoja wa kina uliofunzwa moja kwa moja kwa kupunguza BER.
  • Fidia ya Njia ya Mabadiliko: Kuendeleza NN ambazo zinaweza kukabiliana kwa wakati halisi na hali zinazobadilika kama kufichua kiotomatiki kwa kamera, blur ya mwendo, au mabadiliko ya mwanga wa mazingira.
  • Uwekaji wa Kawaida wa Usanifu wa NN: Kupendekeza miundo nyepesi, ya kawaida ya NN kwa usawa ambayo inaweza kutekelezwa kwenye vifaa vya kamera au programu thabiti.
  • Ushirikiano na Dira ya 6G: Kuweka OCC kama teknolojia ya ziada ndani ya usanifu wa mtandao mchanganyiko wa 6G, kama ilivyochunguzwa katika hati nyeupe kutoka kwa Muungano wa Next G.

8. Marejeo

  1. H.-W. Chen et al., "Usambazaji wa data wa 8-CSK zaidi ya cm 4," Mkutano Unaohusika, 2019.
  2. C. Zhu et al., "16-CSK zaidi ya cm 80 kwa kutumia LED ya quadrichromatic," Jarida Linalohusika, 2016.
  3. N. Murata et al., "16-digital CSK zaidi ya cm 100 kulingana na IEEE 802.15.7," Mkutano Unaohusika, 2016.
  4. P. Hu et al., "32-CSK kulingana na Tri-LEDs zaidi ya cm 3," Jarida Linalohusika, 2019.
  5. R. Singh et al., "32-CSK kulingana na Tri-LEDs," Mkutano Unaohusika, 2014.
  6. J.-Y. Zhu et al., "Tafsiri ya Picha hadi Picha Isiyowekwa Pamoja kwa kutumia Mtandao wa Adversarial Yenye Mzunguko Thabiti," IEEE International Conference on Computer Vision (ICCV), 2017. (Chanzo cha nje kwa dhana ya tafsiri ya nyanja inayotegemea kujifunza)
  7. IEEE Communications Society, "Mawasiliano ya Mwanga Unaonekana: Njia ya Uwekaji wa Kawaida," Ripoti ya Kiufundi, 2022. (Chanzo cha nje kwa changamoto za tasnia)
  8. Next G Alliance, "Dira na Mfumo wa 6G," Hati Nyeupe, 2023. (Chanzo cha nje kwa ushirikiano wa mtandao wa baadaye)
  9. "Commission Internationale de l'Eclairage (CIE) 1931 color space," Kawaida.
  10. Sony Semiconductor Solutions Corporation, "Sensor Datasheet ya IMX530," Uainishaji wa Kiufundi.