1. Utangulizi na Muhtasari
Makala hii inashughulikia kikwazo muhimu katika uwezo wa kupanuka wa mifumo ya wahusika wengi (MAS): kutoweza kutofautisha kimaumbile kati ya wahusika sawa, wanaozalishwa kwa wingi (k.m., ndege zisizo na rubani, roboti za kutembea) na kuunganisha kwa urahisi utambuzi wao wa kuona na mtiririko wao wa mawasiliano. Mbinu za jadi kama kuweka rangi au alama maalum (k.m., ArUco) hazifai kwa wahusika wenye mwendo na kuzunguka, au kwa uzalishaji wa wingi. Mawasiliano ya redio, ingawa yanafaa kwa uhamishaji wa data, hayana muktadha wa asili wa anga, na hivyo kuunda "kukatika" kati ya mtazamo wa sensor ya kihusika na chanzo cha data iliyopokelewa.
Suluhisho lililopendekezwa linaunganisha kwa ubunifu Vipima Utafiti wa Kuona Kulingana na Tukio (Kamera za Tukio) na Mawasiliano ya Mwanga Unaonekana (VLC). Kamera za tukio, ambazo huripoti mabadiliko ya mwangaza kwa kila pikseli kwa usahihi wa mikrosekunde, zinatumika tena kama vipokezi vya haraka vya nuru. Wahusika huwa na taa za LED ambazo hutuma misimbo ya kipekee ya utambulisho kupitia kuwaka na kuzima kwa haraka, isiyoonekana kwa kamera za kawaida za RGB lakini inayoweza kugunduliwa na kamera ya tukio kwenye kihusika jirani. Hii huunda kiungo cha moja kwa moja, kinachotambua anga: kihusika "kinaona" ni kihusika gani maalum katika uwanja wake wa mtazamo kinachotuma data.
2. Mbinu Kuu na Ubunifu wa Mfumo
2.1. Tatizo: Wahusika Wasioweza Kutofautishwa Kimaumbile
Katika matumizi ya baadaye ya kundi la roboti zenye umbo moja katika maghala, uokoaji na utafutaji, au ufuatiliaji wa mazingira, wahusika watakuwa sawa kimaumbile. Kamera ya kawaida haiwezi kutofautisha "Ndege A" na "Ndege B" kulingana na mwonekano pekee. Ndege A inapopokea ujumbe wa redio, haiwezi kuunganisha ujumbe huo na ndege maalum anayoona kwenye mtiririko wake wa kamera. Hii huvunja mzunguko wa tabia za ushirikiano zinazotambua muktadha.
2.2. Suluhisho Lililopendekezwa: Kamera ya Tukio VLC
Ubunifu mkuu ni kutumia kamera ya tukio sio kwa utafiti wa kuona tu, bali kama kipokezi cha mawasiliano chenye madhumuni mawili. Taa ya LED inayowaka na kuzima kwa mzunguko wa juu (k.m., kHz) hutoa muundo uliopangwa wa matukio ya mabadiliko ya mwangaza. Kamera ya tukio hukamata muundo huu wa anga na wakati. Kwa kufafanua muundo huu, kihusika kinachopokea kinaweza kutoa kitambulisho cha kipekee. Muhimu zaidi, ufafanuzi huu unafanywa kwenye eneo la picha ambapo matukio ya LED yanatokea, na hivyo kuunganisha kitambulisho hicho kwa kiumbe kinachoonekana moja kwa moja.
2.3. Usanifu wa Mfumo na Ubunifu wa Kihusika
Kila kihusika kina vifaa vifuatavyo:
- Kamera ya Tukio: Sensor kuu kwa utafiti wa kuona na kupokea VLC.
- Taa Nyingi za LED: Taa nne tofauti za LED zinazokabili mwelekeo tofauti ili kuhakikisha uwezo wa utumaji bila kujali mwelekeo wa kihusika (angalia Mchoro 1 kwenye PDF).
- Moduli ya Mawasiliano: Kwa ubadilishanaji wa data wa jadi (k.m., redio) baada ya utambulisho kuanzishwa.
- Kitengo cha Usindikaji: Kuendesha algoriti ya kufafanua VLC kulingana na tukio na mantiki ya udhibiti wa kihusika.
Mfumo huu unawawezesha kihusika kuzunguka, kutambua wahusika jirani walio sawa kupitia misimbo yao ya LED, na kuanzisha kiungo cha mawasiliano hasa na kihusika kilichotazamwa.
3. Maelezo ya Kiufundi na Msingi wa Hisabati
Ishara ya VLC imesimbwa kwa kutumia Ufunguo wa Kuwasha-Kuzima (OOK). Acha $s(t) \in \{0, 1\}$ iwakilishe ishara iliyotumwa. Kamera ya tukio hutengeneza tukio $e_k = (x_k, y_k, t_k, p_k)$ kwenye pikseli $(x_k, y_k)$ na wakati $t_k$ na upande $p_k \in \{+1, -1\}$ (unaonyesha kuongezeka au kupungua kwa mwangaza) wakati mabadiliko ya mwangaza ya logariti yazidi kizingiti $C$:
$$p_k \cdot (\log L(x_k, y_k, t_k) - \log L(x_k, y_k, t_k - \Delta t)) > C$$
ambapo $L$ ni mwangaza. Taa ya LED inayowaka na kuzima itatoa msururu wa makundi ya matukio mazuri na hasi. Algoriti ya kufafanua inajumuisha:
- Kukusanya Kulingana na Anga: Kukusanya matukio kutoka kwa chanzo kimoja cha LED kwa kutumia ukaribu kwenye ndege ya picha.
- Utoaji wa Muda: Kuchambua muda kati ya matukio ndani ya kundi ili kupata msururu wa binary $\hat{s}(t)$, unaowakilisha kitambulisho kilichofafanuliwa.
- Urekebishaji wa Makosa: Kutumia miradi ya kusimba (k.m., misimbo ya Hamming) ili kupunguza makosa kutoka kwa kelele au kufunikwa kwa sehemu.
Usahihi wa juu wa muda wa kamera za tukio (kwa mpangilio wa mikrosekunde) ndio ufunguo wa kufikia kiwango cha juu cha kutosha cha data kwa utumaji wa kitambulisho.
4. Matokeo ya Majaribio na Uchambuzi wa Utendaji
4.1. Uthibitishaji wa Uigizaji
Uigizaji ulifanywa kulinganisha mfumo uliopendekezwa wa tukio-VLC dhidi ya misingi miwili: (1) Mawasiliano ya Redio na (2) RGB-VLC (kutumia kamera ya kawaida kugundua kuwaka na kuzima polepole, kunaonekana kwa LED). Kipimo muhimu kilikuwa mafanikio ya kuunganisha Kitambulisho-kwa-Utafiti wa Kuona katika hali yenye wahusika wengi walio sawa kimaumbile.
- Redio: Ilishindwa kuunganisha. Wahusika walipokea vitambulisho lakini hawakuweza kuvihusisha na wahusika maalum katika uwanja wao wa kuona.
- RGB-VLC: Utendaji uliwekewa kikomo na kiwango cha chini cha sura (~30-60 Hz) na blur ya mwendo, na kusababisha viwango vya juu vya makosa kwa wahusika wenye mwendo/kuzunguka.
- Tukio-VLC: Ilifanikiwa kudumisha kuunganisha kwa usahihi wa juu hata kwa mwendo na kuzunguka kwa kihusika, ikitumia usahihi wake wa juu wa muda na ukosefu wa blur ya mwendo.
Uigizaji umehakikisha faida ya msingi: tukio-VLC hutoa chaneli ya mawasiliano yenye msingi wa anga.
4.2. Majaribio ya Robot Halisi
Waandishi walitekeleza mfumo halisi wa wahusika wengi (kama inavyoonyeshwa kwenye PDF Mchoro 1). Wahusika kwenye meza inayozunguka walikuwa na vifaa vilivyoelezewa. Majaribio yalionyesha:
- Upokeaji wa Kuegemea wa Kitambulisho: Wahusika waliweza kufafanua vitambulisho vya wahusika jirani vilivyotumwa na LED wakati wakizunguka.
- Kuchochea Tabia ya Ushirikiano: Baada ya kuunganisha kwa mafanikio kwa kuona na mawasiliano, wahusika waliweza kuanzisha vitendo vilivyobainishwa awali vya ushirikiano (k.m., mwendo ulioko pamoja au kushiriki taarifa), na kudhibitisha utendaji wa mfumo katika mzunguko halisi wa udhibiti.
Uthibitishaji huu halisi unahamisha dhana kutoka kwa nadharia hadi kwa mfano unaoweza kuonyeshwa.
5. Uchambuzi wa Kulinganisha na Ufahamu Muhimu
| Mbinu | Kuunganisha Kitambulisho kwa Utafiti wa Kuona | Uthabiti wa Mwendo | Ufaa wa Uzalishaji wa Wingi | Uwezekano wa Kiwango cha Data |
| Alama za ArUco / QR | Bora Sana | Duni (inahitaji mtazamo wazi) | Duni (huongeza uchafu wa kuona) | Chini Sana (tuli) |
| Redio (UWB, WiFi) | Hakuna | Bora Sana | Bora Sana | Juwa Sana |
| Kamera ya RGB VLC | Nzuri | Duni (blur ya mwendo) | Nzuri | Chini (~bps 10) |
| Kamera ya Tukio VLC | Bora Sana | Bora Sana | Nzuri | Kati-ya-Juu (~kbps) |
Ufahamu Mkuu: Tukio-VLC sio njia ya mawasiliano yenye upana mkubwa zaidi, wala sio kitambulisho safi bora zaidi cha kuona. Thamani yake ya kipekee ni kuwa mchanganyiko bora unaounganisha kwa urahisi nyanja hizo mbili kwa uthabiti wa juu kwa mwendo—sifa muhimu kwa mifumo ya wahusika wengi yenye mwendo.
6. Uchambuzi wa Mtaalam Asilia
Ufahamu Mkuu: Makala hii sio tu kuhusu hila mpya ya mawasiliano; ni hatua ya msingi kuelekea mawasiliano yaliyomo kwa mashine. Waandishi wametambua kwa usahihi kwamba changamoto halisi katika MAS ya baadaye sio kusogeza data kutoka sehemu A hadi B (iliyotatuliwa na redio), bali kuweka data hiyo kwenye kiumbe halisi sahihi katika eneo lenye mwendo la kuona. Suluhisho lao linafaa kutumia fizikia ya kamera za tukio kuunda namna ya hisia ambayo kwa asili ina anga na wakati, sawa na jinsi wanyama wengine hutumia mwanga wa kibayolojia kwa utambulisho.
Mtiririko wa Mantiki na Nguvu: Hoja yao inashawishi. Wanaanza na tatizo halisi, lisilotatuliwa (utambulisho wa wahusika wenye umbo moja), wanakataa suluhisho zilizopo kwa sababu wazi, na wanapendekeza muunganisho mpya wa teknolojia mbili zinazoibuka. Matumizi ya kamera za tukio ni ya busara sana. Kama ilivyoelezwa katika utafiti kutoka Kikundi cha Robotiki na Ufahamu wa Chuo Kikuu cha Zurich, faida za kamera za tukio katika hali za kasi ya juu na anuwai ya juu ya mwendo huwafanya wafae kwa jukumu hili la kipokezi cha VLC, na kushinda kikwazo cha blur ya mwendo cha RGB-VLC kulingana na sura. Maendeleo ya majaribio kutoka kwa uigizaji hadi roboti halisi yana mantiki ya kimetodolojia.
Kasoro na Mapungufu Muhimu: Hata hivyo, uchambuzi unahisi kuwa na upofu kuhusu uwezo wa kupanuka. Makala hiyo inashughulikia mfumo peke yake. Nini kinatokea katika kundi nene la wahusika 100, wote wakiwaka na kuzima taa za LED? Kamera ya tukio ingejaa matukio, na kusababisha kuingiliwa—tatizo la kawaida la upatikanaji mwingi wasiloulitatua. Pia wanapita juu ya gharama kubwa ya kihesabu ya kukusanya na kufafanua matukio kwa wakati halisi, ambayo inaweza kuwa kikwazo kwa wahusika wenye nguvu ndogo. Ikilinganishwa na unyenyekevu mzuri wa uwekaji wa eneo wa UWB (ambao pia unaweza kutoa muktadha wa anga, ingawa kwa muunganisho wa kuona wa moja kwa moja mdogo), mfumo wao unaongeza utata wa vifaa.
Ufahamu Unaotumika na Uamuzi: Huu ni mwelekeo wa utafiti wenye uwezo mkubwa, unaobainisha kikoa maalum, sio suluhisho tayari kutumika. Kwa tasnia, hitimisho ni kufuatilia muunganiko wa utambuzi kulingana na tukio na mawasiliano ya nuru. Matumizi ya haraka yanawezekana katika roboti za ushirikiano zilizodhibitiwa, za kiwango kidogo (k.m., timu za roboti za kiwanda) ambapo kuchanganyikiwa kwa kuona ni tatizo halisi la usalama na ufanisi. Watafiti wanapaswa kulenga kukabiliana na tatizo la kuingiliwa kwa upatikanaji mwingi, labda kwa kutumia dhana kutoka kwa CDMA au LED zenye mwelekeo, na kuendeleza chips za kufafanua zenye nguvu ndogo sana. Kazi hii inapata A kwa ubunifu na kutambua tatizo kuu, lakini B- kwa uandali wa utekelezaji wa vitendo. Inafungua mlango; kutembea ndani yake kutahitaji kutatua matatizo magumu zaidi katika nadharia ya mawasiliano na ushirikiano wa mifumo.
7. Mfumo wa Uchambuzi na Mfano wa Kimawazo
Hali: Robot tatu sawa za usafirishaji ghala (T1, T2, T3) zinahitaji kuratibu kupita kwenye njia nyembamba. T1 iko kwenye mlango na anaweza kuona T2 na T3 ndani, lakini hajui ni ipi ni ipi.
Mchakato Hatua kwa Hatua na Tukio-VLC:
- Ufahamu: Kamera ya tukio ya T1 hugundua matone mawili yanayosonga (wahusika). Wakati huo huo, hugundua muundo mbili tofauti, wa mzunguko wa juu wa matukio uliowekwa juu ya maeneo hayo ya matone.
- Kufafanua na Kuunganisha: Kichakataji kwenye roboti kinakusanya matukio kwa anga, na kutenganisha miundo. Kinafafanua Muundo A kama kitambulisho "T2" na Muundo B kama "T3". Sasa kinajua kiwambo cha kushoto ni T2 na cha kulia ni T3.
- Kitendo: T1 anahitaji T2 asonge mbele. Anatumia ujumbe wa redio ulioelekezwa hasa kwa kitambulisho "T2" na amri "songa mbele 1m". Kwa sababu kitambulisho kiliunganishwa kwa kuona, T1 ana hakika anamwamrisha kihusika sahihi.
- Uthibitishaji: T1 anaona kiwambo cha kushoto (kilichounganishwa kwa kuona na T2) kusonga mbele, na kuthibitisha amri ilitekelezwa na kihusika kilichokusudiwa.
Tofauti na Redio Pekee: Kwa redio pekee, T1 hutangaza "yeyote aliye kushoto, songa mbele." T2 na T3 wote wanapokea. Kila mmoja anapaswa kutumia sensor zake mwenyewe kujua ikiwa yeye ni "kushoto" kuhusiana na T1—kazi ngumu na yenye uwezekano wa makosa ya uwekaji wa eneo wa kibinafsi. Tukio-VLC hukata utata huu kwa kufanya kiungo hicho kiwe wazi na cha nje (kutoka kwa mtazamo wa T1).
8. Matumizi ya Baadaye na Mwelekeo wa Utafiti
Matumizi ya Haraka:
- Robotiki ya Ushirikiano ya Viwandani: Timu za mikono ya roboti au majukwaa ya kusonga katika viwanda vya kisasa kwa kukabidhi vyombo na usanikishaji ulioratibiwa.
- Uratibu wa Kundi la Ndege: Urambazaji wa karibu wa umbo ambapo ndege zinahitaji kutambua kwa uaminifu majirani zao wa karibu kwa kuzuia mgongano na utekelezaji wa mabadiliko.
- Msafara wa Magari Yenye Kujitawala: Ingawa ni changamoto nje, inaweza kutumika katika maeneo yaliyodhibitiwa ya mizigo kwa utambulisho na kuunganisha lori/trela.
Mwelekeo wa Utafiti wa Muda Mrefu:
- Upatikanaji Mwingi na Mtandao: Kuendeleza itifaki (TDMA, CDMA) kwa idadi kubwa ya wahusika ili kuepuka kuingiliwa kwa LED. Kutumia mgawanyiko wa urefu wa wimbi (LED za rangi tofauti) ni upanuzi rahisi.
- Uhamishaji wa Data wa Kiwango cha Juu: Kuhamia zaidi ya vitambulisho rahisi hadi kutuma taarifa za msingi za hali (k.m., kiwango cha betri, nia) moja kwa moja kupitia kiungo cha nuru.
- Ushirikiano wa Neuromorphic: Kutekeleza mfuatano mzima wa kufafanua kwenye vichakataji vya neuromorphic, na kufananisha data ya sensor kulingana na tukio na usindikaji kulingana na tukio kwa ufanisi mkubwa wa nishati, kama ilivyochunguzwa na taasisi kama Mradi wa Ubongo wa Binadamu.
- VLC Yenye Mwelekeo Mbili: Kuwapa wahusika kamera ya tukio na kirekebishaji cha kasi ya juu cha LED, na kuwezesha chaneli kamili za mawasiliano ya nuru zenye utambuzi wa anga kati ya jozi za wahusika.
- Kuweka Viwango: Kufafanua mpango wa kawaida wa kurekebisha na muundo wa kitambulisho kwa ushirikiano, sawa na jinsi viwango vya Bluetooth au WiFi vilivyobadilika.
Muunganiko wa utafiti wa kuona kulingana na tukio na mawasiliano ya nuru, kama ulivyoonyeshwa hapa, unaweza kuwa teknolojia ya msingi kwa kizazi kijacho cha mifumo ya kujitawala yenye ushirikiano wa kweli na utambuzi wa muktadha.
9. Marejeo
- Nakagawa, H., Miyatani, Y., & Kanezaki, A. (2024). Kuunganisha Utafiti wa Kuona na Mawasiliano ya Wahusika Wengi Kupitia Mawasiliano ya Mwanga Unaonekana Kwa Kutumia Kamera za Tukio. Proc. of AAMAS 2024.
- Gallego, G., et al. (2022). Utafiti wa Kuona Kulingana na Tukio: Uchunguzi. IEEE Transactions on Pattern Analysis and Machine Intelligence. (Uchunguzi wa msingi juu ya teknolojia ya kamera ya tukio).
- Chuo Kikuu cha Zurich, Kikundi cha Robotiki na Ufahamu. (2023). Utafiti juu ya Utafiti wa Kuona Kulingana na Tukio. [Mtandaoni]. Inapatikana: https://rpg.ifi.uzh.ch/
- Kiwango cha IEEE cha Mitandao ya Eneo na Jiji–Sehemu ya 15.7: Mawasiliano ya Kifupi ya Wimbi la Nuru Kwa Kutumia Mwanga Unaonekana. (2018). (Kiwango cha msingi cha VLC).
- Mradi wa Ubongo wa Binadamu. Jukwaa la Kikokotoo cha Neuromorphic. [Mtandaoni]. Inapatikana: https://www.humanbrainproject.eu/en/
- Ozkil, A. G., et al. (2009). Robot za Huduma Hospitalini. Mapitio. (Inaangazia hitaji la ulimwengu halisi la utambulisho wa roboti).
- Schmuck, P., et al. (2019). SLAM ya Monocular ya Ushirikiano wa UAV Nyingi. IEEE ICRA. (Mfano wa MAS ambapo utambulisho wa kihusika ni muhimu).
- Lichtsteiner, P., Posch, C., & Delbruck, T. (2008). Sensor ya Utafiti wa Kuona ya Tofauti ya Muda Isiyolingana ya 128x128 120 dB 15 μs. IEEE Journal of Solid-State Circuits. (Makala ya kwanza ya kamera ya tukio).