ভাষা নির্বাচন করুন

অপটিক্যাল ক্যামেরা কমিউনিকেশনে নিউরাল ইকুয়ালাইজেশন ব্যবহার করে ৫১২-কালার শিফট কীং সিগন্যাল ডিমডুলেশনের প্রথম প্রদর্শন

ত্রুটিমুক্ত ডিমডুলেশনের জন্য একটি সিএমওএস ইমেজ সেন্সর এবং একটি মাল্টি-লেবেল নিউরাল নেটওয়ার্ক ইকুয়ালাইজার ব্যবহার করে ৫১২-সিএসকে ওসিসি ট্রান্সমিশনের পরীক্ষামূলক প্রদর্শন।
rgbcw.org | PDF Size: 0.4 MB
রেটিং: 4.5/5
আপনার রেটিং
আপনি ইতিমধ্যে এই ডকুমেন্ট রেট করেছেন
PDF ডকুমেন্ট কভার - অপটিক্যাল ক্যামেরা কমিউনিকেশনে নিউরাল ইকুয়ালাইজেশন ব্যবহার করে ৫১২-কালার শিফট কীং সিগন্যাল ডিমডুলেশনের প্রথম প্রদর্শন

সূচিপত্র

1. ভূমিকা

অপটিক্যাল ক্যামেরা কমিউনিকেশন (ওসিসি) হলো পরবর্তী প্রজন্মের অপটিক্যাল ওয়্যারলেস কমিউনিকেশনের জন্য একটি সম্ভাবনাময় প্রযুক্তি, যা ক্যামেরায় সর্বব্যাপী সিএমওএস ইমেজ সেন্সরকে রিসিভার হিসেবে ব্যবহার করে। এটি লাইসেন্স-মুক্ত, সাশ্রয়ী চ্যানেল সরবরাহ করে। একটি মূল চ্যালেঞ্জ হলো ক্যামেরার ফ্রেম রেট এবং এক্সপোজার সময় দ্বারা সীমাবদ্ধ থাকা অবস্থায় ফ্লিকার-মুক্ত অপারেশন বজায় রেখে ডেটা থ্রুপুট বাড়ানো। কালার-শিফট কীং (সিএসকে), আইইইই ৮০২.১৫.৭ থেকে একটি মড্যুলেশন স্কিম, ডেটা রেট বাড়ানোর জন্য ডেটাকে সিআইই ১৯৩১ ক্রোমাটিসিটি স্পেসের রঙে ম্যাপ করে। তবে, ক্যামেরার স্পেকট্রাল সংবেদনশীলতার কারণে ক্রসটক ক্ষতিপূরণের প্রয়োজন হয়। পূর্ববর্তী প্রদর্শনগুলো স্বল্প দূরত্বে সর্বোচ্চ ৩২-সিএসকে অর্জন করেছিল। এই গবেষণাপত্রটি প্রথম পরীক্ষামূলক প্রদর্শন উপস্থাপন করে যেখানে ৪ মিটার দূরত্বে ত্রুটিমুক্ত ডিমডুলেশনের সাথে ৫১২-সিএসকে সিগন্যাল ট্রান্সমিশন করা হয়েছে, ননলিনিয়ার ক্রসটক মোকাবেলায় একটি নিউরাল নেটওয়ার্ক-ভিত্তিক ইকুয়ালাইজার ব্যবহার করে।

2. রিসিভার কনফিগারেশন

রিসিভার সিস্টেমটি একটি সনি আইএমএক্স৫৩০ সিএমওএস ইমেজ সেন্সর মডিউলের উপর ভিত্তি করে তৈরি, যাতে একটি ৫০মিমি লেন্স রয়েছে এবং এটি পোস্ট-প্রসেসিং (ডিমোসাইকিং, ডিনয়েজিং, হোয়াইট ব্যালেন্সিং) ছাড়াই ১২-বিট র রজিবি ডেটা আউটপুট করতে সক্ষম।

2.1 ক্যামেরা সিস্টেম ও র ডেটা

সনি ক্যামেরা সিস্টেম খাঁটি র ইমেজ ডেটা আউটপুট করে, যা যেকোনো কালার সংশোধনের মাধ্যমে বিকৃতি প্রবর্তনের আগে সঠিক সিগন্যাল প্রসেসিংয়ের জন্য অপরিহার্য মূল সেন্সর রিডিং সংরক্ষণ করে।

2.2 কালার স্পেস রূপান্তর

র আরজিবি মানগুলো একটি স্ট্যান্ডার্ড ট্রান্সফর্মেশন ম্যাট্রিক্স ব্যবহার করে সিআইই ১৯৩১ (x, y) ক্রোমাটিসিটি স্থানাঙ্কে রূপান্তরিত হয়: $$\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0.4124 & 0.3576 & 0.1805 \\ 0.2126 & 0.7152 & 0.0722 \end{pmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$$

2.3 নিউরাল নেটওয়ার্ক ইকুয়ালাইজার

একটি মাল্টি-লেবেল শ্রেণীবিভাগ নিউরাল নেটওয়ার্ক ননলিনিয়ার ক্রসটক ক্ষতিপূরণের জন্য একটি ইকুয়ালাইজার হিসেবে কাজ করে। এটিতে ২টি ইনপুট ইউনিট (x, y), $N_h$ হিডেন লেয়ার যাতে $N_u$ ইউনিট রয়েছে, এবং $M=log_2(512)=9$টি আউটপুট ইউনিট (প্রতি সিম্বলে বিট) রয়েছে। নেটওয়ার্কটি একটি পোস্টেরিয়র সম্ভাব্যতা বন্টন $p(1|x,y)$ আউটপুট করে, যেখান থেকে এলডিপিসি ডিকোডারে ইনপুট দেওয়ার জন্য লগ-লাইকলিহুড রেশিও (এলএলআর) গণনা করা হয়। ৫১২-সিএসকের জন্য কনস্টেলেশন পয়েন্টগুলো নীল শীর্ষবিন্দু (x=0.1805, y=0.0722) থেকে শুরু করে ত্রিভুজাকারে সাজানো হয়েছে।

3. পরীক্ষার ফলাফল

3.1 পরীক্ষামূলক সেটআপ

ট্রান্সমিশনের জন্য একটি ৮x৮ এলইডি সমতল অ্যারে (প্যানেল আকার: ৬.৫ সেমি) ব্যবহার করা হয়েছিল। সক্রিয় এলইডির সংখ্যা ১x১ থেকে ৮x৮ পর্যন্ত পরিবর্তন করা হয়েছিল যাতে দখলকৃত ইমেজ এলাকা (আলোর তীব্রতা) এর উপর ভিত্তি করে বিট এরর রেট (বিইআর) মূল্যায়ন করা যায়। ট্রান্সমিশন দূরত্ব ৪ মিটারে স্থির রাখা হয়েছিল।

3.2 বিইআর কর্মদক্ষতা

সিস্টেমটি ৫১২-সিএসকের জন্য ত্রুটিমুক্ত ডিমডুলেশন অর্জন করেছে। ধারণকৃত ইমেজে কার্যকর এলইডি এলাকার বিপরীতে বিইআর বৈশিষ্ট্য মূল্যায়ন করা হয়েছিল। নিউরাল ইকুয়ালাইজার সফলভাবে ক্রসটক প্রশমিত করেছে, যেখানে ঐতিহ্যগত রৈখিক পদ্ধতি ব্যর্থ হতো, এই উচ্চ মড্যুলেশন অর্ডারে নির্ভরযোগ্য ডিমডুলেশন সক্ষম করেছে।

মূল কর্মদক্ষতা মেট্রিক

মড্যুলেশন অর্ডার: ৫১২-সিএসকে (৯ বিট/সিম্বল)

ট্রান্সমিশন দূরত্ব: ৪ মিটার

ফলাফল: ত্রুটিমুক্ত ডিমডুলেশন অর্জিত

4. মূল অন্তর্দৃষ্টি ও বিশ্লেষণ

মূল অন্তর্দৃষ্টি

এই কাজটি কেবল সিএসকে ৫১২ রঙে ঠেলে দেওয়ার বিষয়ে নয়; এটি পদার্থবিজ্ঞান-ভিত্তিক সিগন্যাল পরিষ্কার করা থেকে ডেটা-চালিত পুনর্গঠনের দিকে একটি কৌশলগত মোড়। প্রকৃত অগ্রগতি হলো গুরুতর ইন্টার-চ্যানেল ক্রসটককে ফিল্টার করার জন্য একটি শব্দ সমস্যা হিসেবে নয়, বরং একটি নির্ধারক, ননলিনিয়ার বিকৃতি মানচিত্র হিসেবে বিবেচনা করা যা একটি নিউরাল নেটওয়ার্ক দ্বারা শেখা এবং বিপরীত করা হবে। এটি কম্পিউটেশনাল ইমেজিংয়ে দেখা প্যারাডাইম শিফটের প্রতিফলন ঘটায়, যেখানে CycleGAN গবেষণাপত্রে (Zhu et al., 2017) আলোচিত গভীর শিক্ষণ মডেলগুলোর মতো ডোমেনগুলোর মধ্যে (যেমন, শব্দযুক্ত থেকে পরিষ্কার) জোড়া উদাহরণ ছাড়াই অনুবাদ করতে শেখে। এখানে, এনএন ক্যামেরার স্পেকট্রাল 'ফিঙ্গারপ্রিন্ট'-এর বিপরীতটি শেখে।

যুক্তিসঙ্গত প্রবাহ

যুক্তিটি আকর্ষণীয়: ১) উচ্চ-ক্রমের সিএসকে ক্রসটক দ্বারা বাধাগ্রস্ত। ২) ক্যামেরা ক্রসটক জটিল ও ননলিনিয়ার। ৩) অতএব, প্রাপ্ত ডেটার উপর প্রশিক্ষিত একটি সার্বজনীন ফাংশন অনুমানকারী (একটি নিউরাল নেটওয়ার্ক) ব্যবহার করে এটি মডেল ও বাতিল করুন। র সেন্সর ডেটা -> সিআইই ১৯৩১ রূপান্তর -> এনএন ইকুয়ালাইজার -> এলডিপিসি ডিকোডার এই প্রবাহটি একটি আধুনিক, হাইব্রিড সিগন্যাল প্রসেসিং চেইন। এটি চতুরতার সাথে স্ট্যান্ডার্ডাইজড সিআইই স্পেসকে একটি স্থিতিশীল মধ্যবর্তী উপস্থাপনা হিসেবে ব্যবহার করে, কালার সায়েন্সকে কমিউনিকেশন থিওরি থেকে আলাদা করে।

শক্তি ও ত্রুটি

শক্তি: প্রদর্শনটি অভিজ্ঞতামূলকভাবে দৃঢ়, একটি ব্যবহারিক ৪মি দূরত্বে রেকর্ড ৫১২-সিএসকে অর্জন করেছে। র সেন্সর ডেটা ব্যবহার করা ধ্বংসাত্মক ক্যামেরা আইএসপি পাইপলাইন এড়িয়ে যায়—একটি গুরুত্বপূর্ণ, প্রায়শই উপেক্ষিত কৌশল। পদ্ধতিটি রিসিভার-অজ্ঞেয়বাদী; যেকোনো ক্যামেরার জন্য এনএন পুনরায় প্রশিক্ষণ দেওয়া যেতে পারে। ত্রুটি: পদ্ধতিটি স্বভাবতই ডেটা-ক্ষুধার্ত এবং প্রতি-ক্যামেরা ক্যালিব্রেশন প্রয়োজন। গবেষণাপত্রটি এনএনের জটিলতা, বিলম্ব এবং শক্তি খরচ সম্পর্কে নীরব—রিয়েল-টাইম, মোবাইল ওসিসির জন্য মারাত্মক বিবরণ। ৮x৮ এলইডি অ্যারে একটি ভারী ট্রান্সমিটার, যা সর্বব্যাপী আলোর উৎসের সুবিধা নেওয়ার ওসিসির লক্ষ্যের সাথে সাংঘর্ষিক। আইইইই কমসকের ভিএলসি গবেষণায় উল্লিখিত হিসাবে, স্কেলেবিলিটি এবং ইন্টারঅপারেবিলিটি উল্লেখযোগ্য বাধা হিসেবেই রয়ে গেছে।

কার্যকরী অন্তর্দৃষ্টি

গবেষকদের জন্য: ভবিষ্যৎ হালকা-ওজনের, সম্ভবত ফেডারেটেড লার্নিং মডেলগুলোর দিকে, যেগুলো ডিভাইসে ক্যালিব্রেশনের জন্য। ট্রান্সফরমার-ভিত্তিক আর্কিটেকচার অন্বেষণ করুন যা ফিডফরোয়ার্ড এনএনগুলোর চেয়ে ধারাবাহিক সিম্বল বিকৃতি ভালোভাবে পরিচালনা করতে পারে। শিল্পের জন্য: এই প্রযুক্তিটি বিশেষ, স্থির-ইনস্টলেশন পরিস্থিতির জন্য প্রস্তুত (যাদুঘর গাইড, কারখানার রোবট যোগাযোগ) যেখানে ট্রান্সমিটার ও রিসিভার স্থির। ক্যামেরা সেন্সর প্রস্তুতকারকদের সাথে (এই গবেষণাপত্রের মতো সনির সাথে) অংশীদারিত্ব করুন যাতে প্রাক-প্রশিক্ষিত বা সহজে প্রশিক্ষণযোগ্য ইকুয়ালাইজার ব্লক সরাসরি সেন্সরের ডিজিটাল ব্যাকএন্ডে এম্বেড করা যায়, "ওসিসি-প্রস্তুত" ক্যামেরাগুলোকে একটি বিক্রয়যোগ্য বৈশিষ্ট্য করে তোলে।

5. প্রযুক্তিগত বিবরণ

মূল প্রযুক্তিগত চ্যালেঞ্জ হলো আদর্শ সিআইই ১৯৩১ কালার স্পেস এবং ক্যামেরার প্রকৃত স্পেকট্রাল সংবেদনশীলতার মধ্যে অসামঞ্জস্য, যেমন পিডিএফ-এর চিত্র ১(খ)-তে দেখানো হয়েছে। এটি প্রেরিত তীব্রতার রৈখিক মিশ্রণ হিসেবে প্রাপ্ত (R, G, B) মানের কারণ হয়। (x, y)-তে রূপান্তর সাহায্য করে কিন্তু ননলিনিয়ারিটিগুলো দূর করে না। $N_h$ হিডেন লেয়ার সহ নিউরাল নেটওয়ার্কটি $f: (x, y) \rightarrow \mathbf{p}$ ফাংশনটি শেখে, যেখানে $\mathbf{p$ হলো বিট সম্ভাবনার একটি ৯-মাত্রিক ভেক্টর। $k$-তম বিটের জন্য এলএলআর হিসাব করা হয়: $$LLR(k) = \log \frac{p(b_k=1 | x, y)}{p(b_k=0 | x, y)}$$ এই এলএলআরগুলো শক্তিশালী এলডিপিসি ডিকোডারের জন্য নরম ইনপুট সরবরাহ করে, চূড়ান্ত ত্রুটিমুক্ত ফলাফল অর্জনের জন্য ফরোয়ার্ড এরর সংশোধন সক্ষম করে।

6. বিশ্লেষণ কাঠামোর উদাহরণ

কেস: ওসিসির জন্য একটি নতুন ক্যামেরা মূল্যায়ন। এই গবেষণা যেকোনো ক্যামেরার উচ্চ-ক্রম সিএসকের জন্য উপযুক্ততা নির্ধারণের জন্য একটি কাঠামো প্রদান করে।

  1. ডেটা অর্জন: একটি ক্যালিব্রেটেড এলইডি অ্যারে ব্যবহার করে পরিচিত ৫১২-সিএসকে সিম্বল প্রেরণ করুন। পরীক্ষাধীন ক্যামেরা দিয়ে র সেন্সর ডেটা ক্যাপচার করুন।
  2. প্রাক-প্রসেসিং: স্ট্যান্ডার্ড ম্যাট্রিক্স ব্যবহার করে র আরজিবি প্যাচগুলোকে সিআইই ১৯৩১ (x, y) স্থানাঙ্কে রূপান্তর করুন।
  3. মডেল প্রশিক্ষণ: প্রাপ্ত (x, y) ক্লাস্টারগুলোকে ৫১২টি প্রেরিত সিম্বল লেবেলে ফেরত ম্যাপ করার জন্য একটি মাল্টি-লেবেল নিউরাল নেটওয়ার্ক (যেমন, একটি সাধারণ ৩-স্তর এমএলপি) প্রশিক্ষণ দিন। প্রশিক্ষণ সেট হলো পরিচিত সিম্বল ম্যাপিং।
  4. কর্মদক্ষতা মেট্রিক: এলডিপিসি ডিকোডিংয়ের পর চূড়ান্ত বৈধতা নির্ভুলতা বা বিইআর সরাসরি ক্যামেরার সামর্থ্য নির্দেশ করে। উচ্চ নির্ভুলতা নির্দেশ করে কম অন্তর্নিহিত বিকৃতি বা উচ্চ রৈখিকতা, যা এটিকে একটি ভালো ওসিসি রিসিভার করে তোলে।
  5. তুলনা: বিভিন্ন ক্যামেরার জন্য পুনরাবৃত্তি করুন। প্রয়োজনীয় নিউরাল নেটওয়ার্ক জটিলতা (গভীরতা $N_h$, প্রস্থ $N_u$) ক্যামেরার ক্রসটক তীব্রতার জন্য একটি প্রক্সি হয়ে ওঠে।
এই কাঠামোটি স্পেস-শিট বিশ্লেষণের বাইরে গিয়ে একটি কার্যকরী, যোগাযোগ-কেন্দ্রিক মূল্যায়নের দিকে এগিয়ে যায়।

7. ভবিষ্যতের প্রয়োগ ও দিকনির্দেশনা

প্রয়োগ:

  • সুনির্দিষ্ট ইনডোর পজিশনিং: উচ্চ-ডেটা-রেট ওসিসি আইডি কোডের পাশাপাশি জটিল অবস্থানের ফিঙ্গারপ্রিন্ট বা মানচিত্র প্রেরণ করতে পারে।
  • অগমেন্টেড রিয়েলিটি (এআর) সংযোগ: স্মার্ট লাইটগুলি বস্তু বা শিল্পকর্ম সম্পর্কিত মেটাডেটা সরাসরি স্মার্টফোন ক্যামেরায় সম্প্রচার করতে পারে, ক্লাউড লুকআপ ছাড়াই নিরবচ্ছিন্ন এআর সক্ষম করে।
  • আরএফ-সংবেদনশীল এলাকায় শিল্প আইওটি: বিদ্যমান সুবিধা আলো ব্যবহার করে হাসপাতাল বা বিমানে রোবট, সেন্সর এবং নিয়ন্ত্রকগুলোর মধ্যে যোগাযোগ।
  • পানির নিচে যোগাযোগ: নীল-সবুজ এলইডি সিএসকে ব্যবহার করে নিমজ্জিত যানবাহন এবং সেন্সরগুলোর জন্য উচ্চতর ডেটা রেট সরবরাহ করতে পারে।
গবেষণার দিকনির্দেশনা:
  • এন্ড-টু-এন্ড লার্নিং: পৃথক ব্লক (ডিমডুলেশন, ইকুয়ালাইজেশন, ডিকোডিং) এর বাইরে গিয়ে সরাসরি বিইআর ন্যূনতমকরণের জন্য প্রশিক্ষিত একটি একক গভীর নেটওয়ার্কের দিকে অগ্রসর হওয়া।
  • গতিশীল চ্যানেল ক্ষতিপূরণ: এমন এনএন তৈরি করা যা ক্যামেরা অটো-এক্সপোজার, মোশন ব্লার বা পরিবেষ্টিত আলোর পরিবর্তনের মতো পরিবর্তনশীল অবস্থার সাথে রিয়েল-টাইমে খাপ খাইয়ে নিতে পারে।
  • এনএন আর্কিটেকচারের মানকীকরণ: ইকুয়ালাইজেশনের জন্য হালকা-ওজনের, মানকীকৃত এনএন মডেল প্রস্তাব করা যা ক্যামেরা হার্ডওয়্যার বা ফার্মওয়্যারে বাস্তবায়িত হতে পারে।
  • ৬জি ভিশনের সাথে একীকরণ: নেক্সট জি অ্যালায়েন্সের হোয়াইট পেপারগুলিতে অন্বেষণ করা হয়েছে, ৬জির ভিন্নধর্মী নেটওয়ার্ক আর্কিটেকচারের মধ্যে একটি পরিপূরক প্রযুক্তি হিসেবে ওসিসিকে অবস্থান দেওয়া।

8. তথ্যসূত্র

  1. H.-W. Chen et al., "8-CSK data transmission over 4 cm," Relevant Conference, 2019.
  2. C. Zhu et al., "16-CSK over 80 cm using a quadrichromatic LED," Relevant Journal, 2016.
  3. N. Murata et al., "16-digital CSK over 100 cm based on IEEE 802.15.7," Relevant Conference, 2016.
  4. P. Hu et al., "Tri-LEDs based 32-CSK over 3 cm," Relevant Journal, 2019.
  5. R. Singh et al., "Tri-LEDs based 32-CSK," Relevant Conference, 2014.
  6. J.-Y. Zhu et al., "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks," IEEE International Conference on Computer Vision (ICCV), 2017. (শিক্ষণ-ভিত্তিক ডোমেন অনুবাদ ধারণার জন্য বহিরাগত উৎস)
  7. IEEE Communications Society, "Visible Light Communication: A Roadmap for Standardization," Technical Report, 2022. (শিল্প চ্যালেঞ্জের জন্য বহিরাগত উৎস)
  8. Next G Alliance, "6G Vision and Framework," White Paper, 2023. (ভবিষ্যত নেটওয়ার্ক একীকরণের জন্য বহিরাগত উৎস)
  9. "Commission Internationale de l'Eclairage (CIE) 1931 color space," Standard.
  10. Sony Semiconductor Solutions Corporation, "IMX530 Sensor Datasheet," Technical Specification.