Адаптивное управление с прогнозирующими моделями при переменной структуре пространства состояний с приложением к системам сетевого управления движением и автоматизации медицинского оборудования

Аннатоция итогового отчета

В ходе выполнения работ по проекту в 2016-18 гг. году продемонстрированы новые возможности интеллектуального управления сложными мехатронными системами, открывающиеся благодаря миниатюризации и увеличению быстродействия вычислителей, датчиков и исполнительных устройств.

Для мультиагентных робототехнических систем (больших групп роботов, роботизированных устройств, агентов) предложены и обоснованы новые подходы к синтезу адаптивного управления на основе прогнозирующих моделей в динамической среде при переменной структуре пространства состояний, работоспособные на переходных процессах и при высокой неопределенности внешних условий (например, в турбулентном потоке). Суть новых подходов заключается в переходе от централизованных иерархических моделей к децентрализованным, мультиагентным, в которых сложность решения трудных задач в пространстве огромной размерности (обычно NP-сложных задач) заменяется на решение большого количества достаточно простых локальных задач для интеллектуальных агентов (роботов) с автономными сенсорами, вычислителями и актуаторами. За счет сложной системы сетевого взаимодействия в итоге достигается решение общей сложной задачи. В приложениях к системам сетевого управления движением в основе нового подхода лежат исследование условий кластеризации (разбиения на подгруппы) агентов за счет локальных взаимодействий на "микро-уровне" в "быстром времени", последующая дискретизация системы как по времени так и по пространству состояний (переход к "динамике кластеров" в медленном времени), синтез адаптивного "макро-управления" на основе прогнозирующих моделей на конечном интервале времени пока не поменялась кластерная структура.

В рамках проблемы разработки методов интеллектуального анализа, управления и прогнозирования функционирования робототехнических систем для отслеживания движения группы объектов сетью сенсоров (роботов-наблюдателей) решена задача оптимизации распределения объектов между наблюдателями. При ограничении количества наблюдателей за одним объектом предложено использовать циклический алгоритм стохастической аппроксимации, для которого получены оценки точности в зависимости от выбранных параметров алгоритма.

Для задач анализа неструктурированных данных предложены и обоснованы методы построения паттернов динамических моделей, протестированные при решении проблемы классификации текстовых документов.

В системе, состоящей из большого числа агентов, с одной стороны, при наличии согласованности в поведении некоторых групп агентов (кластеров) общая размерность пространства состояний снижается. С другой стороны, действие возмущений может приводить к нарушению согласованности поведения агентов в некоторой группе, что будет соответствовать перестроению структуры кластеров и изменению размерности пространства состояний. Проведенное исследование теоретических вопросов адаптивного управления в изменяющейся динамической среде при переменной структуре пространства состояний объектов и среды показало практическую актуальность таких новых задач и принципиальные возможности достижения новых, недоступных ранее технологий. В результате выполнения проекта был сделан вывод о достаточно типичном процессе формирования кластерных структур в процессе функционирования больших сложных систем (групп роботов, роботизированных устройств, агентов) с локальными взаимодействиями. Кластеры (подгруппы роботов) в таких системах динамически возникают/изменяются в ``быстром'' времени за счет локальных обратных связей между роботами на микро-уровне и могут достаточно долго не разрушаться при некоторых общих (макро) воздействиях на подгруппы роботов. Такие системы (группы роботов и т.п.) на интервалах времени с неизменной кластерной структурой в ``медленном'' времени при дискретизации с шагом большим, чем время переходного процесса формирования/изменения кластеров, могут адекватно описываться конечномерными динамическими моделями с макро-переменными состояний, представляющими собой интегральные по интервалу дискретизации и по кластерам характеристики микро-переменных состояний исходной системы (например, положения центра масс кластера, скорости центра масс и скорости вращения) и кусочно-постоянным макро-управлениями, применяемыми одновременно ко всем элементам кластера на протяжении интервала дискретизации. Формализация процесса принятия управляющего решения обычно связывается с заданием цели управления, в определении которой участвуют реализовавшиеся траектория системы и совокупность управляющих воздействий. При выполнении проекта для макро-управлений группой роботов были рассмотрены интегральные цели управления, задаваемые интегралами по пространству и времени от некоторой функции качества управления. Решение общей задачи на всем допустимом интервале времени естественным образом распадается на последовательность задач управления на конечных интервалах времени (при неизменной кластерной структуре). При этом на каждом таком интервале времени в силу аддитивности интегралов можно рассматривать задачи только относительно макро-переменных состояний и макро-управлений. Основные трудности решения задач на таких конечных интервалах возникают из-за того, что заранее обычно трудно спрогнозировать, какая кластерная структура сформируется и, следовательно, практически невозможно провести предварительную валидацию системы.

Для решения проблемы определения моментов существенных "переключений", близкой по смыслу традиционным задачам о разладке, исследованы возможности использования метода Filtered Derivative Algorithm (FDA), основанного на тесте отношения правдоподобия. Основная идея состоит в вычислении скорости изменения градиента функции отношения правдоподобия. Обнаружению изменений в характеристиках динамической системы соответствует превышение градиентом некоторого порога.

Изучение вопросов адаптивного управления в изменчивой среде и с изменяющейся во времени структурой пространства состояний актуализировало исследования алгоритмов идентификации работоспособных на конечном интервале времени при малом количестве точек наблюдений. Для задач идентификации при малом числе наблюдений метод ``знако-возмущенных сумм'' был расширен для применения в нелинейных задачах. В проекте предлагается для формирования макро-управлений при неизменной кластерной структуре использовать робастные алгоритмы управления с прогнозирующими моделями. Так как степень априорной неопределенности о моделях очень высока, то было предложено для адаптации на конечном интервале времени использовать рандомизированные стратегии управления с прогнозирующими моделями в условиях неопределенностей на основе алгоритма ``исключения областей знакодоминирующих корреляций''.

При управлении большим количеством роботов (агентов) возникают серьезные проблемы получения достоверной информации о траекториях движения всех агентов состоянии, причем обычно требуется обеспечить достаточно высокое быстродействие работы системы для принятия решения в реальном времени. Для отслеживания группы движущихся объектов сетью сенсоров (роботов-наблюдателей) решена задача оптимизации распределения объектов между сенсорами. При ограничении количества наблюдателей за одним объектом предложено использовать циклический алгоритм стохастической аппроксимации, для которого получены оценки точности в зависимости от выбранных параметров алгоритма.

Для решения задач идентификации и оптимизации выпуклой вещественнозначной функции векторного аргумента обосновано использование нескольких квази-ньютоновских методов, основанных на подходе проекции-аппроксимации-восстановления.

В сложных системах адаптация к изменениям структуры внешних возмущений часто происходит за счет внутренней самоорганизации подсистем (агентов). Исследование таких процессов приводит к изучению свойств достижения полной или частичной синхронизации (называемых также консенсусом и кластеризацией) в разных сложных системах. Участниками проекта были получены существенные новые результаты связанные с динамикой мнений в социальных системах (в частности, были предложены и исследованы модификации моделей Фридкина-Джонсена и Хегсельманна-Краузе, новая динамическая модель формирования мнений в процессах голосования при ограниченной достоверности), самосинхронизацией и вынужденной синхронизацией в сетях биологических осцилляторов (в частности, осцилляторов Гудвина и импульсно связанных нейронов), координацией мобильных роботов (в частности, алгоритмов удержания агентов внутри заданного многогранного множества и их выстраивания на окружности вокруг заданной цели), кластеризацией при делении актинидов, выведен аналог критерия устойчивости Джури-Ли для нелинейных сетевых систем с дискретным временем. Для случая, когда узлы (агенты) сети являются динамическими системами, описываемыми известной линейной моделью, а связи между агентами нелинейны и стационарны (не меняются со временем), так же как и граф (топология) взаимодействий, показано, что система достигает синхронизации (консенсуса) при выполнении некоторого частотного условия; если при этом динамика каждого агента устойчива, то вся сеть сходится к глобально устойчивому положению равновесия. Алгоритмы консенсуса естественно возникают в некоторых моделях статистической механики. Консенсус при равномерном распределении соответствует максимуму энтропии. Аналогичные алгоритмы максимизации энтропии (MAXENT) для других типов энтропий, возникающих в статистической физике, также приводят к неравномерным распределениям, соответствующим кластерному поведению.

Для схем синхронизации (называемых маятниковыми системами или системами с цилиндрическим фазовым пространством), описываемых сингулярно-возмущенными интегро-дифференциальными уравнениями Вольтерра с периодическими нелинейностями, модификация методов абсолютной устойчивости, взятая из работ В.М. Попова, позволила установить эффективные критерии для градиентного поведения маятниковой системы, а также ее робастной устойчивости по отношению к широкому классу возмущений.

Разработанные новые общие подходы были апробированы в нескольких прикладных задачах.

В условиях турбулентности для задачи сетевого адаптивного управления большим массивом роботизированных подвижных элементов распределенных на всей поверхности планера (``перьев'') при воздействии переменного ветра предложено использовать в контуре обратной связи новый мультиагентный алгоритм, основанный на методе скоростного градиента, позволяющий эффективно выравнивать влияния возмущающих сил на разные элементы крыла. Работоспособность алгоритма протестирована на натурном стенде в условиях воздействия на крыло турбулентных потоков.

Среди медицинских приложений результатов о вынужденной синхронизации системы связанных биологических осцилляторов, описываемых моделью Гудвина с внешним периодическим воздействием, получено объяснение возможностей как синхронизации суточных (циркадных) ритмов в организме при внешней освещенностью, имеющей период 24 часа, так и быстрого приспособления к смене часовых поясов.

Для задач анализа неструктурированных данных предложены и обоснованы методы построения паттернов динамических моделей, протестированные при решении проблемы классификации текстовых документов. Большинство методов анализа данных рассматривает исследуемый объект как статический набор описывающих его характеристик, не учитывая динамики процесса их формирования. В то же время динамика формирования свойств объекта может служить его отличительной характеристикой, признаком, по которому в множестве объектов можно выделить схожие группы. Новые методы расширяют возможности методов анализа данных и в медицинской области, позволяя учитывать неструктурированные данные и динамику их изменений в процессе принятия решений. Для решения задачи автоматизации дефибрилятора разработана архитектура и прототип приложения для тестирования различных алгоритмов машинного обучения при конечной обучающей выборке.

Результаты проекта имеют широкий спектр возможных приложений как в робототехнике, так и в экономике, физике, биологии, социологии и др. науках. Полученный по итогам выполнения проекта патент на изобретение "Аэродинамическое крыло летательного аппарата с адаптивно изменяющейся поверхностью" является основой последующих опытно-конструкторских разработок прототипов будущих летательных аппаратов, формируя научный и технологический задел в передовой высокотехнологической отрасли авиастроения, создавая основу новых технологий. Мультиагентный алгоритм формирования подгрупп роботов-наблюдателей для отслеживания перемещений большой группы автономных агентов (роботов) разработан в таком виде, что может непосредственно применяться в разных практических приложениях, удовлетворяя большому количеству ограничений реального времени. Полученные результаты по достижению консенсуса в сетях и кластеризации внедряются в исследования в экономике, логистике и при изучении доминирующих мнений в социальных сетях, так как достижение "равновесных" состояний лежит в основе многих классических подходов. Переход от изучения свойств сетей дискретных объектов к сетевым континуальным системам позволит "перенести" многие из полученных результатов на актуальные физические задачи при контроле/управлении в сложных системах. Полученные результаты исследований возможных приложений разработанных алгоритмов в медицине для автоматизации работы дефибрилятора могут также быть использованы в последующих опытно-конструкторских разработках.

Результаты исследования опубликованы в 30 статьях и 1 научной монографии.

Популяризации идей проекта служат публикации и передачи в средствах массовой информации, а также веб-сайт проекта. Реализованные в виде программного обеспечения алгоритмы доступны для скачивания и тестирования из репозитория программ.

Результаты проекта внесли существенный вклад в развитие интеллектуальных технологий в робототехнических и мехатронных системах и в разработку адаптивных систем управления для работы в динамической среде. Научная значимость и новизна результатов проекта определяются недостаточным в настоящее время уровнем теоретических и практических исследований вопросов адаптивного управления робототехническими системами в изменяющейся динамической среде при переменной структуре пространства состояний. Масштабность проведенного исследования обоснована широким спектром возможных приложений как в робототехнике, так и в экономике, физике, биологии, социологии и др. науках.