afdc57940718e368bf2d89b614aa23c3.ppt
- Количество слайдов: 21
n Яковлев n Андрей Россия, Москва, профессор МГТУ им. Н. Э. Баумана, академик Международной и Российской инженерных академий n К вопросу анализа и оптимизации адаптивно – игровых систем (АИС)
конфликта Неопределенность – недостаточность априорной информации (неполная определенность цели, внешней среды, характеристик стратегии, параметров и структуры объекта управления). Конфликт-явления и ситуации, в которых участвуют две (или более) сторон, имеющие различные интересы и обладающие возможностями применять для достижения целей разнообразные средства и действия. Сотрудничество- деятельность, в которой происходит объединение участников (коалиций) операции для достижения их целей Случайные С неизвестными распределениями С неизвестными параметрами распределения С неизвестным законом распределения Неслучайные Природная неопределенность Поведенческая неопределенность Целевая неопределенность
адаптации Адаптивные (обучающиеся) системы –класс систем, который способен с течением времени улучшать свое функционирование. (Цыпкин Яков Залманович) Традиционный адаптивный подход (дискретный алгоритм) опознания: a[n]= a[n-1] + Г[n]F’[n-1]{y[n ] – a[n-1]f(x[n])}f(x[n]), где а[n]- вектор определяемых параметров, Г[n]-квадратная дискретная матрица, элементы которой постоянны или зависят от n, F’{. } – градиент случайного функционала, f(x[n]) – линейные независимые функции, формирующие разделяющую функцию y[n]=aтf[n], известную с точностью до параметра а. Адаптивные системы управления: *Самонастраивающиеся, в тои числе и экстремальные (с адаптацией параметров); *Самоорганизующиеся (с адаптацией структуры); * Самообучающиеся (с адаптацией алгоритмов).
Абстрактная модель D = < S, R> = < А, S, Ф, Н, G, Y, F, W, K, P, R R, I>, где А- множество целей, S - множество стратегий, Ф - множество факторов внешней среды, Н- ножество операций м G -множество исходов операции, R- коалиции интересов и n действий, Y- вектор характеристик операций, F- множество операторов соответствия «результат-показатель» W - множество показателей эффективности решений, K- множество критериев эффективности решений, Р- множество отношений предпочтения ЛПР, I- множество информированности ЛПР. Игра: 1. Кто и как в конфликте участвует? Ф Каковы его исходы? 2. Кто в этих исходах заинтересован и каковы его результаты? Стратегические игры: более одной коалиции Ri, i. >1, 2, … Бескоалиционные игры: Rи = Rд. Антагонистические игры: ЛПР (P, I) W = - W. Неатагонистические игры: W = - W.
Технические АИС: СУ управления подвижными объектами (морскими, воздушными, космическими); системы управления энергосистемами (атомными и электрическими станциями), телекоммуникациями и т. п. Человеко-машинные АИС: ручного и полуавтоматического управления, автоматизированные и др. Интеллектуальные АИС: управление социальноэкономическими системами (формирование концепций, стратегий, системных программ и проектов), управление инвестиционноинновационной и научной деятельностью (введение в хозяйственный оборот РНТД и интеллектуальной собственности и т. п. ), решение международных конфликтов и образование региональных содружеств. Глобальные АИС: мониторинг окружающей среды, анализ глобальных изменений в мире, обеспечение безопасности человека на море и в космосе, прогноз природных и техногенных катастроф, управление межпланетными полетами,
Игровые системы (ИС) Адаптивно-игровые системы (АИС) Адаптивные системы (АС) ИС (теория игр): необходима дополнительная информация о игроках, их коалициях и интересах; новое понимание оптимальности на основе принципа Парето, равновесия Нэша, переговорных процессов (Д. Харшаньи, Р. Зельтон, Р. Ауманн и Т. Шиллинг. ) АС (теория адаптации): параметрическая, структурная, алгоритмическая априорная неопределенность; идентификации неопределенностей осуществляется путем использования рабочей информации; достижения целей в процессе функционирования системы (Фельдбаум Алекс. Арон. , Цыпкин Я. З. , Андреев Н. И. , Петров Б. Н. ) АИС (инженерная интеграция теорий игр и адаптации): наличие различных типов неопределенностей, частичное раскрытие неопределенностей на основе алгоритмов адаптации (обучения и идентификации), обеспечения получения гарантированных результатов в результате решения игровых задач.
ЭВМ Блок идентификации Априорная информация Алгоритмы управления, в том числе и адаптивные Игровые решающие устройства Органы управления Объект управления Внешняя среда, включающая метасистему
Внешняя среда Данные системы: X 0 (q, g) – начальные условия, возмущения-(WС, VС), неопределенные параметры (q, g), игроки и их интересы X 0 (q, g) X(t) = F(t; x, q, g) + P VС VС (t; P WС(t; q, g) C(t; q, g) Y(t; q, g) = B (t; q, g)X(t; q, g) + C (t; q, g) WС(t; q, g) АИС Основная система управления Z(t) = Ф{t; аи 1, …, аиn; аа 1, …, аик} Игровые алгоритмы Адаптивные алгоритмы
S = (F, D) –система, состоящая из регулятора D и объекта управления F, где заданы отображения F = {f: M x V Y}, D = ( d: Y x V M}, и алгоритмы оценивания и управления задаются в традиционной форме: H= {h: T x Y x M Z}, K = {k: T x Z x V M}, где Т – множество моментов времени, М-множество управлений, Н- множество алгоритмов оценивания, К – множество алгоритмов управления, Z- множество оценок состояния системы. Регулятор с игровым решающим устройством: Т k: Aи x T x Z x V M} h: Aи x T x Y x M Z}, Z а и: Y x N x Z x M A иk X A иh Формирование параметров как результат решения игры
G(t; gj) + + Z(t) + H(t) E(t) Y(t) W(t 1, t 2) X(t; gj) G-полезный сигнал; Z- помеха. Все вероятностные характеристики полезного сигнала и помехи известны за исключением дисперсии Dgi полезного сигнала (неизвестны априорные вероятности). Возникает конфликт. Игрок А имеет своими стратегиями параметры аi, сторона В управляет выбором дисперсии gj. Сформулируем матричную антагонистическую игру, характеризуемую матрицей для вероятности невыхода ошибки из заданных допусков при нормальном законе распределения ошибки Рij = Pij(С 1
А Ра 11 Ра 12 Ра 21 Ра 22 В Рв 11 Рв 12 Рв 21 Рв 22 Раij = -Рвij Дж. Нэш: Любая конечная бескоалиционная игра n лиц имеет хотя бы одну ситуацию равновесия в смешанных стратегиях Кооперативная игра сталкиваемся с коалицией. Кооперативная игра может рассматриваться как бескоалиционная игра. Дж. Харшаньи, Рейнхард Зельдан. Общая теория выбора равновесных ситуаций. – СПб, ЭШ, 2001. Борьба за -10 2 5 -2 рынки фирм A B 1 -1 6 -1 Аи. B 1 А 1 - выбор фирмой А первого рынка; А 2 -второго рынка. В 1 - выбор фирмой В второго рынка; В 2 - второго рынка. Компания В более крупная. Выигрыш А только на разных рянках.
Адаптация- процесс изменения параметров, структуры и алгоритмов системы на основе текущей информации с целью достижения определенного, обычно оптимального состояния Регулятор с адаптивным управлением: Т k: Aа x T x Z x V M h: Aа x T x Y x M Z, Z а а: Y x N x Z x M A а k х Aа h Формирование параметров на основе алгоритмов адаптации
АИС Т V k: Aаиx T x Z x V M M} h: Aаи x T x Y x M Z а и: Y x Т x Z x M A иk х A иh ааи: Aиk х Aиh Aаk х Aаh х. Y x Т x Z x M а а: Y x Т x Z x M Aаиk х Aаиh A а k х Aа h Z},
Вычисление апостериорных вероятностей Pi = Р(qi/t, 0), где i=1, 2, …, n (адаптивная часть) Алгоритмы решения игры на основе априорной информации Измеритель У(t)= B X(t) +CW X(t) Оценка измеренного сигнала Z(t) Фильтр КБ P 1 P 2 …. для q 1 Фильтр КБ для q 2 ………… Фильтр КБ для qn Сумматор Pn
управления (СПУ) СПУ находят эффективное применение в управлении полетом самолетами, вертолетами, космическими кораблями (КК) и орбитальными станциями (ОС). Моделирование систем полуавтоматического управления КК / Авторы: Г. Т. Береговой, А. И. Яковлев, Туманов А. В. и др. // Под редакцией д. т. н. А. И. Яковлева. – М. : Машиностроение, 1986. A. I. Yakovlev. Hybrid complex of the aircraft intellectualized systems simulation at the stage of their research projecting. AIAA-93 -3559 -CP. Полеты летчиков (космонавтов) показали: • Летчик во время полета может решать интеллектуальные задачи. • Деятельность летчиков протекает в весьма специфических условиях, что требует специальной системы отбора, обучения, подготовки и тренировки. • Конструирование летательных аппаратов и их систем управления требует учета факторов полета. • Определяющим фактором повышения эффективности СПУ летательных аппаратов является проведение эффективного моделирования и тренировок летчиков. Важнейшую роль в подготовке к полету космонавтов играет возможность человека адаптироваться и интеллектуально
управления Внешняя среда (факторы полета, центр управления полетом) Пилот Датчики и информационные системы (экипаж) Бортовой вычислительный Исполнительные органы комплекс Летательный аппарат Интеллектуальная система полуавтоматического управления
управления Датчики состояния летчика Датчики перегрузок Бортовой компьютер Перегрузочный костюм Летчик самолета Информационная система Система управления Внешняя среда Система регулирования давления перегрузочного костюма, воздействий на летчика Самолет
управления спуском КК Информационная система, средства наблюдения Пилот-космонавт Бортовой вычислительный комплекс, обеспечивающий реализацию алгоритмов адаптации и игровых решающих устройств Датчики Исполнительные органы Космический корабль Внешняя среда
КК Основные группы показателей эффективности АИС ПУ КК Системные Финансовые Медико -биологические Социально-экономические Эргономические Субъективные Информационные Технические Интеллектуальные При выборе лучшей АИС полуавтоматического управления КК возникает необходимость определять не только эффективность достижения целей системой, но и обязательно оценивать эффективность работы летчика-космонавта, его состояние, профессиональную подготовку, интеллектуальные способности и воздействие на него факторов космического полета
Исходные данные Инфокоммуникац ионная система моделирования внешней среды, движения КК, операций человека управления Воздействия на человека -оператора Кабина Дисплей Оператор Управление Информационная система регистрации результатов эксперимента Конструктораразработчики АИС Медики Руководитель Специалисты по проведению эксперимента
Российско – Словенской центр по инновациям МОН РФ Российская группа по коммерциализации РНТД МО РС Программа партнерства в инновационной сфере Предложения и запросы на РНТД HI -TEC Международный центр сотрудничества МГТУ им. Н, Э, Баумана Университет проекты Любляны Научные, консалтинговые, образовательные инновационные организации, создающие и реализующие проекты и программы