Адаптивное управление с прогнозирующими моделями при переменной структуре пространства состояний с приложением к системам сетевого управления движением и автоматизации медицинского оборудования

Аннатоция итогового отчета

В ходе выполнения проекта получены теоретические и экспериментальные результаты, показывающие, что мультиагентный подход позволяет более гибко управлять сложными системами в сравнении с традиционными подходами. Исследования теоретических вопросов адаптивного управления в изменяющейся динамической среде актуализируют развитие методов адаптивного мультиагентного управления в условиях неопределенностей и существенных внешних возмущений. Проблемы управления сетевой системой осложняются динамическим изменением ее характеристик из-за наличия внутренних процессов взаимодействия. Современные технологии позволяют наблюдать и управлять процессами внутри сетевой системы. Появление/изменение кластеров (подгрупп агентов) привносит дополнительные факторы неопределенности в систему управления группами роботов, определяемые динамическими и пространственными характеристиками образующихся/изменяющихся кластеров. В опубликованной в рамках выполнения проекта коллективной монографии дан всесторонний анализ современного состояния и перспектив исследований по теме Самоорганизация и искусственный интеллект в группах автономных роботов: методология, теория, практика. Возможности использования самоорганизации при прохождении миссий в условиях существенных неопределенностей группой из 100 достаточно дешевых роботов без централизованного управления и без составления карты мира продемонстрированы на созданном в рамках выполнения проекта стенде Рой 100 роботов. Самоорганизация обеспечивается вычислительно сверхэкономными алгоритмами автономной навигации (типа протокола локального голосования), следующих парадигме непосредственной реакции каждого робота (агента) на свои сенсорные данные о текущей ситуации и соответствующие данные от ограниченного числа его соседей (локальные коммуникации). Вместе с тем на макроуровне эти алгоритмы обеспечивают определенные гарантии достижения поставленной общей цели. Другой важный пример использования самоорганизации для решения сложных задач исследован при сравнении различных подходов к одной из важных комбинаторных задач - проблеме поиска гамильтонова пути в графе. Основанные на присущих природе принципах самоорганизации ДНК-вычисления требуют только линейно растущего времени. Благодаря усовершенствованиям в методах биофизики, которые необходимы при ДНК-вычислениях, в ходе выполнения проекта обоснована и реализована более быстрая модернизированная процедура, в которую добавлены некоторые новые этапы ДНК-вычислений.

При выполнении проекта было показано, что локальные взаимодействия между агентами часто приводят к их групповой синхронизации, также именуемой кластеризацией. Важно отметить, что сама кластеризация представляет из себя часто более быстрый процесс, чем изменения в окружающей (систему) среде. При этом, как правило, цели управления определяются поведением системы на больших временных интервалах. Если рассматриваемый временной интервал намного больше, чем время, в течение которого формируются кластеры, то в таком случае образовавшиеся кластеры можно считать новыми переменными в модели медленного времени. Такие переменные называют мезоскопическими, поскольку их масштаб находится между уровнем всей системы (макро-уровень) и уровнем отдельных агентов (микро-уровень). В проекте предложена и обоснована схема синтеза адаптивного макро- управления на основе робастного метода, использующего прогнозирующие модели, который подстраивается за конечное (малое) число наблюдений к сформировавшейся быстро (на коротком интервале времени) новой структуре объекта и потом на конечном интервале времени позволяет оптимизировать характеристики динамики объекта, проведен детальный анализ времени и условий формирования кластеров в сетевых структурах с помощью алгоритмов типа локального голосования. Исследование возможностей синтеза обратной связи для макро-управлений, неразрушающих образующиеся кластеры, основывается на выведенных оценках скорости формирования кластеров и полученных условиях на запас прочности при формировании кластеров за счет выбора параметров (коэффициентов) в алгоритме. Этот запас прочности позволяет выписать ограничения на класс макро-управлений, в которые должны укладываться нелинейности в макро-модели для сохранения структуры кластеров неизменной. При разрушении кластеров фактически происходит формирование нового макро-окружения и перезапускается процесс образования новых кластеров.

Детализированные модели сложных систем, состоящих из большого числа элементарных компонентов (миниатюрных агентов), очень сложны для управления из-за технологических барьеров и колоссальной сложности задач ввиду их огромной размерности. На уровне элементарных компонентов систем во многих приложениях невозможно верифицировать модели движения агентов с традиционно высокой степенью точности из-за их миниатюризации и высокой частоты управляющих воздействий. Использование новых мезоскопических переменных может позволить синтезировать меньше разных управляющих входов, чем при рассмотрении системы как совокупности большого количества агентов, поскольку такие входы будут общими для целых кластеров. Для реализации этой идеи в ходе выполнения проекта формализован фреймворк потоки кластеров, который для примера используется при анализе нелинейной системы взаимодействующих осцилляторов модели Курамото - сложной системы с эффектами возможностей возникновения кластеров. При этом установлены достаточные условия возникновения в системе кластерной синхронизации (разбиение всей системы на кластеры, в которых поведение осцилляторов синхронизировано) и получены ограничения на класс мезоскопических управлений, при которых установившаяся в системе кластерная синхронизация сохраняется. Показано, что кластеризация приводит к разреженному представлению динамических траекторий системы, что позволяет применить метод опознания со сжатием (compressive sensing) для получения динамических характеристик образовавшихся кластеров. Предложен двухэтапный алгоритм наблюдений: сначала пространство состояний ограничивается и дискретизируется, а затем происходит непосредственно сжатие, по которому далее делается реконструкция, позволяющая получить интегральные характеристики кластеров. На основании этих полученных характеристик далее с помощью общих методов управления с прогнозирующими моделями при заданной цели управления в пространстве размерности не более s можно синтезировать мезоуправления для каждого из кластеров, учитывая ограничения, полученные на управления. Работоспособность нового фреймворка иллюстрируется примерами имитационного моделирования.

Серьезной проблемой организации коллективной работы большой группы робототехнических устройств, цель которых мониторинг состояния и перемещений окружающих объектов, является задача распределения объектов (целей) между наблюдателями. В ходе выполнения проекта предложен и обоснован новый способ оптимизации назначений наблюдателей на объекты, основанный на решении системы линейных матричных неравенств для оптимизационной задачи \ell_1-оптимизации специального вида. Этот новый способ позволяет перейти к мультиагентным технологиям вместо традиционных централизованных решений. Существенное внимание было уделено решению задачи о наблюдении за системами сложной структуры при наличии коммуникационных ограничений, а именно, оценке наименьшей скорости передачи информации, при которой можно построить наблюдатель для состояния системы.

В условиях изменения структуры пространства состояний актуально развитие методов кратковременного обучения, в которых классификатор должен быть обучен таким образом, чтобы он мог адаптироваться к новым классам, которых не было в тренировочных данных. Кроме того, важны случаи, когда только небольшое количество примеров каждого класса доступно при классификации. Для решения таких задач предложен новый рандомизированный алгоритм стохастической аппроксимации на основе новой многозадачной функции потерь, подобной используемой в методе сетей прототипов, дано теоретическое обоснование алгоритма и приведен анализ экспериментов. Для решения проблемы кластеризации в системах с моделями данных типа разреженной смеси гауссовых распределений при значительных неопределенностях в модели данных и измерениях штрафных функций предложена модифицированная версия алгоритма на основе рандомизированного алгоритма стохастической аппроксимации, для которой дано математическое обоснование и доказана устойчивость к внешним воздействиям. Алгоритм обрабатывает данные последовательно, на лету. Для решения задач многомерной оптимизации исследована применимость нового подхода последовательной оптимизации на подпространствах, при котором исходная задача оптимизации последовательно сводится к задачам оптимизации в низкоразмерных подпространствах. Разработан новый метод, основанный на комбинации шагов квазиньютоновского метода и метода сопряженных градиентов, для которого установлены некоторые теоретические оценки. В частности, для задачи квадратичного программирования доказывается линейная сходимость за конечное число шагов.

В модели динамики мнений со случайным внешним воздействием изучены механизмы образования кластеров. Рассмотрена модель, являющаяся обобщением модели Хегсельманна-Краузе (динамики мнений с ограниченным доверием) на случай агентов, описываемых стохастическими уравнениями в непрерывном времени. Кроме того, в отличие от классических моделей, в рассмотренной модели присутствуют радикально настроенные индивидуумы, не поддающиеся влиянию окружающих, однако транслирующих им свое мнение. В предположении, что число агентов велико, их распределение можно аппроксимировать решением нелинейного уравнением Фоккера-Планка, для которого получены математические условия разрешимости, а также численные методы решения. С помощью этих методов, получены эмпирические результаты о зависимости образующихся кластеров мнений от дисперсии случайного внешнего воздействия и относительной массы радикальных агентов.

Для нелинейной системы с множественными положениями равновесия установлены критерии устойчивости. Уравнения такого типа описывают широкий класс систем (маятник, электрическая машина, вибрационные установки, фазовые системы автоподстройки частоты). Критерии получены соединением двух методов: метода нелокального сведения Леонова и процедуры Бакаева-Гужа (сведение к случаю нелинейности с нулевым средним) и формулируются в частотно-алгебраической форме. Частотное условие устойчивости типично для критериев устойчивости нелинейных систем (кругового критерия, критерия Попова и др.), однако содержит набор скалярных параметров, которые должны удовлетворять алгебраическим условиям. Также был проведен анализ устойчивости осцилляторов и сетей осцилляторов, описываемых моделью Лурье с бесконечномерной линейной частью и периодической нелинейностью, получены условия глобальной "устойчивости" таких систем, понимаемой как сходимость каждого решения к одному из положений равновесия (как правило, система имеет бесконечную последовательность равновесий).

Проведено исследование применимости разработанных методов в приложении к модели самолета с двигателем с переменным по мощности вектором тяги, обеспечивающим управление на макро-уровне, и с сетевым микро- управлением массивом миниатюрных роботизированных элементов из датчиков и исполнительных механизмов, распределенных по поверхности.

Для предотвращения возрастающих колебаний крыла самолета при изгибно-крутильном флаттере представлен новый мультиагентный метод управления крылом самолета, предполагающий, что поверхность крыла состоит из контролируемых перьев (агентов). С использованием предлагаемого метода теоретически становится возможным увеличить максимальную скорость полета самолета без возникновения флаттера. Проведено исследование эффективности метода скоростного градиента в задаче синтеза стабилизирующего управления при условии шоковой кратковременной нагрузки системы. Взаимосвязи пространственно-временных корреляций в интегральных термодинамических соотношениях между силами и потоками и внутренней структурой системы позволили описать самоорганизацию новых динамических структур в открытой системе. Предлагаемый подход к эволюции структуры позволяет по-новому взглянуть на устойчивость состояния системы.

Для УЗИ томографии с аппаратом из 2048 датчиков, соединенных в кольцо, для определения характерных патологий внутренних органов при медицинских исследованиях описаны подходы к решению следующих ключевых подзадач: расчет времени прохождения сигнала (Time of flight, TOF), обнаружение особых областей, расчет плотности особых областей. Повышение точности расчета времени прихода сигнала позволяет повысить качество определения плотности тканей в выявленных особых областях, которое проводится с помощью решения сложных нелинейных оптимизационных задач. Для решения оптимизационных задач большой размерности в условиях поступления на вход интенсивных потоков входных данных в ходе выполнения проекта был предложен и обоснован новый алгоритм, совмещающий рандомизированный алгоритм стохастической аппроксимации и алгоритм консенсуса.

Результаты исследования опубликованы в 28 статьях и 1 научной монографии. Разработанный веб-сайт проекта позволяет интересующимся пользователем уточнить всю необходимую информацию о проекте и его результатах. Реализованные в виде программного обеспечения алгоритмы доступны для скачивания и тестирования из репозитория программ, доступ к которому организован через веб-сайт проекта. Научная значимость и новизна полученных результатов подтверждаются публикациями в ведущих научных журналах. Масштабность предлагаемого исследования обоснована широким спектром возможных приложений как в робототехнике и медицине, так и в экономике, физике, биологии, социологии и др. науках.