Аналоговые сети Колмогорова-Арнольда для эффективной аппроксимации функций в гибкой электронике

1. Введение

В данной статье представлена новая систематическая методология аппроксимации функций в гибкой электронике (ГЭ) с использованием аналоговой реализации сетей Колмогорова-Арнольда (KAN). Основная решаемая проблема — это неизбежный компромисс в ГЭ между вычислительной мощностью и строгими ограничениями по физическому размеру, энергопотреблению и стоимости производства. Традиционные цифровые подходы становятся неприемлемо затратными по площади и мощности для таких применений ГЭ, как носимые устройства и датчики Интернета вещей. Предлагаемое решение использует библиотеку аналоговых базовых блоков (ABB) для построения KAN на основе сплайнов, предлагая универсальный и аппаратно-эффективный путь для встраивания интеллектуальной обработки данных непосредственно на гибкую подложку, вблизи сенсора.

125x

Сокращение площади по сравнению с 8-битным цифровым сплайном

10.59%

Достигнутая экономия энергии

≤ 7.58%

Максимальная ошибка аппроксимации

2. Предпосылки и мотивация

2.1 Ограничения гибкой электроники

Гибкая электроника, часто основанная на таких материалах, как оксид индия-галлия-цинка (IGZO), позволяет создавать устройства новых форм-факторов: носимые устройства, медицинские пластыри, экологические датчики. Однако по сравнению с кремниевыми КМОП-технологиями для них характерны большие размеры элементов, что делает сложные цифровые схемы неэффективными по занимаемой площади. Кроме того, приложения требуют сверхнизкого энергопотребления для увеличения срока службы батареи или совместимости с системами сбора энергии. Это создает острую потребность в вычислительных парадигмах, изначально экономно использующих аппаратные ресурсы.

2.2 Сети Колмогорова-Арнольда (KAN)

Сети KAN, недавно вновь привлекшие внимание благодаря работе Liu et al. (2024), предлагают убедительную альтернативу традиционным многослойным перцептронам (MLP). Вместо фиксированных функций активации в узлах, KAN размещают обучаемые одномерные функции (обычно сплайны) на ребрах (весах) сети. В основе этого лежит теорема представления Колмогорова-Арнольда, утверждающая, что любую многомерную непрерывную функцию можно представить в виде конечной композиции непрерывных функций одной переменной и операции сложения. Такая структура естественным образом подходит для эффективной аналоговой реализации, поскольку сложные функции разбиваются на более простые, композируемые операции.

3. Предлагаемая архитектура аналоговых KAN

3.1 Аналоговые базовые блоки (ABB)

Основой подхода является набор предварительно охарактеризованных, низкопотребляющих аналоговых схем, выполняющих фундаментальные математические операции: Сложение, Умножение и Возведение в квадрат. Эти блоки спроектированы с учетом технологических вариаций и паразитных эффектов процессов ГЭ. Их модульная природа позволяет осуществлять систематическую композицию.

3.2 Построение сплайнов с помощью ABB

Каждая обучаемая одномерная функция в KAN (сплайн) строится путем комбинирования ABB. Сплайн, определяемый кусочно-полиномиальными функциями между узлами, может быть реализован путем избирательной активации и суммирования выходов блоков умножителя и возведения в квадрат, настроенных с полиномиальными коэффициентами. Такой аналоговый сплайн заменяет цифровую таблицу поиска (LUT) или арифметический блок, экономя значительную площадь.

3.3 Сборка сети KAN

Полный слой KAN собирается путем подключения входных переменных к набору аналоговых сплайн-блоков (по одному на каждое ребро/вес). Выходы сплайнов, сходящихся на одном узле, суммируются с помощью блоков сложения ABB. Этот процесс повторяется для построения глубины сети. Параметры (коэффициенты сплайнов) определяются вне системы путем обучения, а затем жестко задаются в виде смещений и коэффициентов усиления аналоговой схемы.

4. Техническая реализация и детали

4.1 Математическая формулировка

Ядро слоя KAN преобразует входной вектор $\mathbf{x} \in \mathbb{R}^n$ в выходной вектор $\mathbf{y} \in \mathbb{R}^m$ через обучаемые одномерные функции $\Phi_{q,p}$: $$\mathbf{y} = \left( y_1, y_2, ..., y_m \right)$$ $$y_q = \sum_{p=1}^{n} \Phi_{q,p}(x_p), \quad q = 1,...,m$$ В аналоговой реализации каждая $\Phi_{q,p}(\cdot)$ представляет собой физическую сплайн-схему. Суммирование выполняется блоком сложения ABB в токовом или потенциальном режиме.

4.2 Схемотехника и паразитные эффекты

Блок умножения ABB может быть основан на ячейке Гилберта или принципе транслинейности для работы при низком напряжении. Блок возведения в квадрат может быть получен из умножителя с объединенными входами. Ключевые неидеальности включают: разброс параметров транзисторов ($\sigma_V_T$), влияющий на точность коэффициентов; конечное выходное сопротивление, вызывающее ошибки нагрузки; и паразитные емкости, ограничивающие полосу пропускания. Эти факторы в совокупности определяют измеренную ошибку аппроксимации.

5. Экспериментальные результаты и анализ

5.1 Метрики аппаратной эффективности

Предложенный аналоговый KAN сравнивался с эквивалентной цифровой реализацией сплайна с 8-битной точностью в процессе, совместимом с ГЭ. Результаты впечатляют:

Площадь: Сокращение в 125 раз. Аналоговый дизайн устраняет необходимость в больших цифровых регистрах, умножителях и памяти для LUT.
Мощность: Экономия 10.59%. Аналоговые вычисления избегают высокого динамического энергопотребления, связанного с тактированием и переключением цифровых схем.

Это демонстрирует значительное аппаратное преимущество аналоговых вычислений в материале для ограниченных платформ.

5.2 Анализ ошибки аппроксимации

Компромиссом за аппаратную эффективность является вычислительная точность. Система вносит максимальную ошибку аппроксимации в 7.58%. Эта ошибка проистекает из двух основных источников:

Ошибка проектирования: Внутренняя ошибка от использования конечного числа сегментов сплайна для аппроксимации целевой функции.
Паразитная ошибка: Ошибки, вносимые аналоговыми неидеальностями (разброс, шум, паразитные эффекты) в ABB.

Ошибка остается в приемлемых пределах для многих применений ГЭ (например, калибровка датчиков, обнаружение трендов в биосигналах), где сверхвысокая точность часто уступает по важности низкому энергопотреблению и постоянной готовности к работе.

Ключевые выводы

Системный дизайн: Предоставляет универсальную, воспроизводимую методологию для аналоговой аппроксимации функций, выходя за рамки ситуационного проектирования схем.
Синергия аппаратуры и KAN: Структура KAN разлагает сложные функции на простые, удобные для аналоговой реализации одномерные операции.
Компромисс точности и эффективности: Достигает значительной экономии площади и энергии за счет принятия контролируемого, осознанного с точки зрения приложения уровня ошибки аппроксимации.
Оптимизация для ГЭ: Дизайн напрямую решает ключевые ограничения (площадь, мощность) платформ гибкой электроники.

6. Пример использования и структура фреймворка

Сценарий: Реализация легковесного детектора аномалий для гибкого монитора сердечного ритма. Устройству необходимо вычислять простой индекс здоровья $H$ по двум входам: вариабельности сердечного ритма (HRV) $x_1$ и асимметрии пульсовой волны $x_2$. Известно эмпирическое соотношение $H = f(x_1, x_2)$, но оно нелинейно.

Применение фреймворка:

Декомпозиция функции: С использованием предложенного фреймворка $f(x_1, x_2)$ аппроксимируется двухслойным KAN со структурой [2, 3, 1]. Сеть обучается вне системы на наборе данных.
Отображение на ABB: Обученные одномерные функции (сплайны) на 6 ребрах первого слоя и 3 ребрах второго слоя отображаются в полиномиальные коэффициенты.
Создание экземпляра схемы: Для каждого сплайна определяется необходимое количество сегментов кусочно-полиномиальной функции. Соответствующие блоки умножителя и возведения в квадрат ABB настраиваются коэффициентами (в виде напряжений/токов смещения) и соединяются с блоками сложения ABB в соответствии с графом KAN.
Развертывание: Эта аналоговая схема KAN изготавливается непосредственно на гибком пластыре. Она непрерывно потребляет микроватты мощности, обрабатывая данные с датчиков в реальном времени для выявления аномалий без оцифровки или беспроводной передачи исходных данных.

Этот пример иллюстрирует сквозной процесс от функции до экономичной аппаратной реализации.

7. Перспективы применения и направления развития

Ближайшие применения:

Умные биомедицинские пластыри: Обработка сигналов на пластыре для ЭКГ, ЭЭГ или ЭМГ, позволяющая выполнять локальное выделение признаков (например, детектирование QRS-комплекса) перед передачей данных.
Концентраторы экологических датчиков: Внутрисистемная калибровка и слияние данных для датчиков температуры, влажности и газов в узлах Интернета вещей.
Распознавание жестов в носимых устройствах: Сверхнизкопотребляющая предобработка данных от гибких массивов датчиков деформации или давления.

Направления будущих исследований:

Обучение, устойчивое к ошибкам: Разработка алгоритмов обучения, совместно оптимизирующих параметры KAN как для точности, так и для устойчивости к неидеальностям аналоговых схем (аналогично обучению нейронных сетей с учетом аппаратуры).
Адаптивные и реконфигурируемые ABB: Исследование схем, в которых коэффициенты сплайнов могут быть незначительно скорректированы после изготовления для компенсации технологических вариаций или адаптации к различным задачам.
Интеграция с сенсорикой: Проектирование ABB, которые напрямую взаимодействуют с определенными типами датчиков (например, фотодиодами, пьезорезистивными элементами), приближаясь к истинному слиянию аналогового сенсора и процессора.
Масштабируемость до более глубоких сетей: Исследование архитектурных методов и схемотехнических решений для управления накоплением шума и ошибок в более глубоких аналоговых KAN для более сложных задач.

Конвергенция алгоритмических инноваций (KAN) и аппаратно-ориентированного проектирования прокладывает путь к созданию по-настоящему интеллектуальных и автономных гибких систем.

8. Ссылки

Z. Liu et al., "KAN: Kolmogorov-Arnold Networks," arXiv:2404.19756, 2024. (Основополагающая статья, возродившая интерес к KAN).
Y. Chen et al., "Flexible Hybrid Electronics: A Review," Advanced Materials Technologies, vol. 6, no. 2, 2021.
M. Payvand et al., "In-Memory Computing with Emerging Memory Technologies: A Review," Proceedings of the IEEE, 2023. (Контекст об альтернативных эффективных вычислительных парадигмах).
J. Zhu et al., "Analog Neural Networks: An Overview," in IEEE Circuits and Systems Magazine, 2021. (Основы аппаратного обеспечения аналогового машинного обучения).
International Roadmap for Devices and Systems (IRDS™), "More than Moore" White Paper, 2022. (Обсуждает роль гетерогенной интеграции и специализированной аппаратуры, такой как ГЭ).
B. Murmann, "Mixed-Signal Computing for Deep Neural Network Inference," IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 2021. (Релевантно для анализа компромисса точности и эффективности).

9. Оригинальный анализ и экспертное мнение

Основная идея

Эта работа — не просто очередная статья по аналоговой схемотехнике; это стратегический план по выходу из цифровых ограничений в гибкой электронике. Авторы верно определяют, что грубый перенос цифровых архитектур фон Неймана в ГЭ является тупиковым путем из-за затрат на площадь и мощность. Их гениальность заключается в осознании того, что математическая структура KAN изоморфна аналоговому графу прохождения сигнала. Это не просто трюк реализации — это фундаментальное соответствие алгоритма и субстрата. Пока другие пытаются втиснуть квантованные нейронные сети в ГЭ, эта команда задается вопросом: какой алгоритм рожден аналоговым? Ответ, вдохновленный 60-летней теоремой представления, удивительно элегантен.

Логика изложения

Аргументация развивается с убедительной логикой: 1) ГЭ нуждается в сверхэффективных вычислениях; 2) Цифровые технологии неэффективны для этой среды; 3) Следовательно, необходимо исследовать аналоговые; 4) Но аналоговое проектирование часто является кустарным и плохо масштабируемым; 5) Решение: Использовать KAN для предоставления систематической, не зависящей от конкретной функции структуры, которая направляет аналоговое проектирование. Последовательность от ABB (примитивы) к сплайнам (составные функции) и к KAN (сетевое вычисление) создает четкую иерархию абстракций. Это зеркально отражает цифровой поток проектирования (вентили -> АЛУ -> процессоры), что крайне важно для внедрения. Это преобразует аналоговое проектирование из "черной магии" в несколько автоматизированную, воспроизводимую инженерную дисциплину для конкретных вычислительных задач.

Сильные стороны и недостатки

Сильные стороны: Сокращение площади в 125 раз — это сокрушительный удар. В мире ГЭ площадь — это стоимость, и это делает сложную обработку на сенсоре экономически жизнеспособной. Системная методология — самый долговечный вклад статьи — она предоставляет шаблон. Выбор KAN прозорлив, используя их текущий академический импульс (как видно по взрывной скорости цитирования оригинальной статьи KAN на arXiv) для практической аппаратной выгоды.

Недостатки: Ошибка в 7.58% — это "слон в комнате". В статье это легкомысленно обозначается как "приемлемо для многих приложений", что верно, но ограничивает область применения. Это не универсальный вычислительный движок; это специализированный ускоритель для задач, допускающих ошибки. Обучение полностью проводится вне системы и оторвано от аппаратных неидеальностей — серьезный недостаток. Как отмечено в литературе по аппаратно-ориентированному машинному обучению (например, в работах B. Murmann), игнорирование паразитных эффектов во время обучения приводит к значительному ухудшению производительности на кремнии. Дизайн статичен; после изготовления функция фиксирована, отсутствует адаптивность, требуемая некоторыми периферийными приложениями.

Практические рекомендации

Для исследователей: Следующий непосредственный шаг — обучение с аппаратурой в контуре. Использовать модели неидеальностей ABB (разброс, шум) на этапе обучения KAN для создания схем, изначально устойчивых к ним, аналогично тому, как обучение с учетом квантования (QAT) улучшило цифровые сети с низкой точностью. Для индустрии: Эта технология созрела для стартапов, фокусирующихся на "детерминированном аналоговом IP" — продаже предварительно верифицированных, настраиваемых макросов ABB и сплайнов для фабрик ГЭ. Для продуктовых менеджеров: Рассмотрите сенсорные системы, где сокращение/предобработка данных является узким местом (например, необработанное видео/аудио в носимых устройствах). Аналоговый KAN-фронтенд мог бы фильтровать и извлекать признаки, уменьшая скорость передачи данных на порядки перед попаданием на цифровой радиомодуль, что значительно продлевает срок службы батареи. Эта работа не просто предлагает схему; она сигнализирует о сдвиге в сторону совместной эволюции алгоритмов и аппаратуры для следующего поколения интеллектуальной материи.