Все замкнутые системы при структурном и бесструктурном управлении (и самоуправлении) строятся на основе одной из следующих схем управления и (или) их сочетании в объемлющей замкнутой системе. Разные схемы (не способы) управления обеспечивают для одних и тех же объектов в одних и тех же условиях различную гибкость реагирования на возмущающие воздействия и различный максимально достижимый уровень качества управления. Будучи реализованы на одних и тех же объектах, они обеспечивают им разные запасы устойчивости управления. Схемы управления отличаются одна от другой распределением по компонентам замкнутой системы полной функции управления.
Структура, реализующая схему управления, может быть полностью размещена на объекте, либо какие-то её элементы могут быть размещены вне управляемого объекта по разным причинам. Частным случаем такого варианта является дистанционное управление, когда на объекте размещены преимущественно исполнительные элементы структуры, которые не жалко потерять или которые заведомо невозможно сохранить. Последнее часто имеет место по отношению к команде политиков, изображающих реальную власть, а также при употреблении роботов в опасной обстановке (хотя в толпо-“элитарном” обществе политики редко не представляют собой роботов — биороботов).
ПРОГРАММНОЕ УПРАВЛЕНИЕ
Внешние обратные связи после включения схемы в процесс управления в замкнутой системе отсутствуют: текущая информация о состоянии внешней среды и положении объекта в ней в системе управления не используется.
Управляющий сигнал является функцией времени и, возможно, информации, поступающей по каналам внутренних обратных связей. Учёт влияния на поведение объекта всех возмущающих воздействий производится на стадии проектирования и создания объекта и (или) системы управления им и программы управления. Уровень максимально возможного качества управления является функцией соответствия программы управления реальным условиям её реализации, поскольку замкнутая система не реагирует на реальное воздействие внешней среды. Гибкость поведения отсутствует.
ПРОГРАММНО-АДАПТИВНОЕ УПРАВЛЕНИЕ
Внешние обратные связи в системе есть. Управляющий сигнал является функцией реальных параметров внешней среды и замкнутой системы, информация о которых поступает по цепям внешних и внутренних обратных связей. Но в то же время управляющий сигнал является и однозначной функцией программы (закона управления) в том смысле, что одинаковой информации, поступающей по цепям обратных связей, всегда соответствует один и тот же управляющий сигнал. Эту тождественность реакции «вход — выход» можно понимать и в смысле соответствия статистических характеристик управляющего сигнала информации, поступающей по цепям обратных связей. Реакция системы на возмущение до некоторой степени гибкая в том смысле, что управляющий сигнал и реакция замкнутой системы на возмущения — функция этих возмущений.
Программно адаптивная схема может реализовывать разные принципы управления. Отметим два наиболее часто встречающихся: управление по возмущению, и управление по отклонению. В первом случае система управления вырабатывает управляющий сигнал на основе измерения в процессе управления возмущающего непосредственно воздействия. Во втором случае система управления вырабатывает управляющий сигнал на основе измерения контрольных параметров и оценки их отклонений от значений, характеризующих идеальный режим управления. При необходимости оба принципа могут сочетаться в одной и той же системе управления.
Предположим, что мы проектируем систему автоматического управления температурным режимом в помещении. Мы можем построить её так, что обогреватели будут включаться в результате регистрации системой падения температуры в помещении ниже заданного значения. Это будет реализацией принципа управления по отклонению. Но мы можем построить систему такого назначения и иначе. Поскольку температура в помещении обычно падает после того, снизится среднесуточная температура наружного воздуха, остынут стены помещения и в него попадёт холодный наружный воздух, то мы имеем возможность регистрировать температуру наружного воздуха, вычислять среднесуточную температуру, и, не дожидаясь того момента, когда стены остынут и начнётся снижение температуры в помещении, давать команду на включение обогревателя в каком-то режиме немедленно в случае снижения среднесуточной температуры до заданного порогового значения. Кроме того, режим функционирования обогревателя может быть функцией разницы среднесуточной наружной температуры и текущего значения температуры в помещении. В последнем варианте в программно-адаптивной схеме управления будут сочетаться оба принципа управления — по возмущению и по отклонению.
Если нет возможности измерять контрольный параметр непосредственно в процессе управления (то есть в отношении него разорваны внешние и внутренние обратные связи), то в таком случае вместо не поддающегося непосредственному измерению значения контрольного параметра может быть использована его косвенная оценка на основе его производных, интегральных и иным образом информационно с ним связанных параметров, которые измеряются непосредственно. Однако в этом случае программно-адаптивное управление имеет свойство неограниченно накапливать с течением времени ошибку рассогласования по контрольному параметру. Причина неограниченного накопления ошибки управления по контрольному параметру — накопление ошибок измерения и преобразования измеренных величин в процессе косвенной оценки необходимой характеристики.
Примерами такого рода ошибок полна летопись морских катастроф, когда навигаторы, не видя берега в течение многих недель, из-за плохой погоды не видя звезд, вынуждены были определять место корабля по счислению (на основе расчетов), и из-за ошибок в измерении скорости хода, ошибок в оценке влияния ветра и течений, неточности хода корабельных хронометров (часов) и ошибочного показания компасов теряли точные координаты (место) и гибли на камнях, которые по их расчетам должны были находиться за много миль от них. Таков же механизм накопления ошибок инерциальными навигационными системами, употребляемыми в ракетно-космической технике, на подводных лодках и системах оружия, в которых текущие координаты объекта определяются на основе ввода исходных координат, измерения ускорений и их двукратного интегрирования.
Качество управления при употреблении программной схемы ниже в сопоставлении с программно-адаптивной при одинаковой алгоритмике моделирования поведения объекта, положенной в основу формирования управляющего сигнала. Но и возможное качество управления при программно-адаптивной схеме может оказаться ниже минимально необходимого уровня в сложившихся условиях.
Допустим, что в какой-то момент времени вектор ошибки управления равен нулю. Но в какой-то момент времени, даже в тот же самый, замкнутая система будет подвергаться ненулевому возмущающему воздействию. Если бы в состав замкнутой системы входила идеальная система управления, то она формировала бы управляющий сигнал так, что управляющее воздействие в каждый момент времени в точности компенсировало бы возмущающее воздействие, вследствие чего вектор ошибки управления сохранял бы своё нулевое значение неограниченно долгое время.
Но в большинстве случаев возмущающее воздействие прямому измерению не поддаётся. Но даже если что-то и возможно измерить, то существует порог чувствительности средств измерения величин всех факторов, на основе информации о которых формируется управляющий сигнал. Информация при передаче искажается в некоторых пределах в самой системе. Системе управления требуется время на формирование и передачу управляющего сигнала. Средства управления также обладают ограниченным быстродействием. Сам объект управления обладает характеристиками инерции, и ему необходимо время, чтобы отреагировать на возмущающее воздействие, в результате чего возмущенное движение объекта также успевает набрать инерцию и требуется более мощное управляющее воздействие, чтобы вернуть объект к исходному режиму; но объекту необходимо время и для реакции на управляющее воздействие. По этим причинам управляющее воздействие, соответствующее в некоторой мере вызвавшему его возмущающему воздействию, в программно-адаптивной схеме управления неизбежно запаздывает. Даже если мощность средств управления достаточна, чтобы полностью компенсировать возмущающее воздействие, она не может быть полностью использована вследствие того, что всегда имеет место фазовый сдвиг между возмущающим воздействием и компенсирующим его управляющим. По этой причине объект всегда находится под возмущающим воздействием факторов, реально учитываемых системой управления, не говоря уж о воздействии не учитываемых факторов: неопознанных, признанных мало влияющими, оказавшихся ниже порогов чувствительности средств измерения и т.п. Соответственно замкнутая система — колебательная система, преобразующая возмущающее воздействие и управляющее воздействие в вектор ошибки управления, изменения которого в устойчивом процессе управления носят колебательный характер.
Потребность уменьшить вектор ошибки управления приводит к схеме «предиктор-корректор» — предуказатель-поправщик, предсказатель-поправщик. Смысл слова «предуказатель» объемлет смысл слова «предсказатель», но на Западе и в отечественной научной традиции уже принят термин «предиктор-корректор», однако не в общем управленческом смысле, а в ограниченном: в технике и вычислительной математике . Поэтому мы, оговорив по-русски особенности нашего понимания — «предуказатель-поправщик», а не «предсказатель-поправщик» — сохраняем уже прижившееся на Западе термин «предиктор-корректор», однако расширив область его применения введением в контекст достаточно общей теории управления.
УПРАВЛЕНИЕ ПО СХЕМЕ ПРЕДИКТОР-КОРРЕКТОР
Оно строится на основе прогнозирования в самом процессе управления поведения замкнутой системы, исходя из информации о текущем и прошлых состояниях замкнутой системы и воздействии на неё окружающей среды. Прогнозная информация подаётся на вход программно-адаптивного модуля системы управления. Вследствие этого система управления реагирует не только на уже свершившиеся отклонения замкнутой системы от идеального режима, но и на те, которые только имеют тенденцию к осуществлению (в случае, если прогнозирование достаточно точное). Если программно-адаптивное управление замыкает прямые и обратные связи через уже свершившеесяпрошлое, то в схеме предиктор -корректор некоторая часть прямых и обратных связей замыкается через прогнозируемое будущее . Информация о свершившемся прошлом и о настоящем в схеме предиктор-корректор, кроме прогнозирования и выработки управляющего сигнала, также используется как основа для минимизации (периодического обнуления) в процессе управления составляющей вектора ошибки, обусловленной накоплением с течением времени ошибок прогнозирования.
При сопоставлении программно-адаптивной схемы и предиктора-корректора на основе вектора состояния,используемого программно-адаптивной схемой, одному и тому же вектору состояния в схеме предиктор-корректор будут соответствовать разные управляющие сигналы, поскольку в основе прогноза предиктора-корректора лежит вектор состояния большей размерности, чем в программно-адаптивной схеме. На основе информации, выходящей за пределы тождественной части векторов состояния, используемых в обеих схемах, предиктор-корректор будет получать разные прогнозы, что и выразится в несовпадении управляющих сигналов, вырабатываемых в программно-адаптивных модулях обеих схем управления. То есть предиктор-корректор «умнее» и обеспечивает более гибкое, нешаблонное управление по сравнению с предыдущими схемами.
При условии достаточно высокой точности прогноза схема предиктор-корректор обеспечивает наиболее высокое качество управления за счет того, что в ряде случаев сводит до нуля (при необходимости — до отрицательных величин: это — упреждающее управление) фазовый сдвиг между возмущающим воздействием и управляющим воздействием, обеспечивающим компенсацию возмущения. Это позволяет употребить ресурсы замкнутой системы на повышение запаса устойчивости управления и производительности замкнутой системы в отношении вектора целей управления. При других схемах управления эти резервы не могут быть использованы или расходуются на компенсацию той составляющей отклонений от идеального режима, которая обусловлена фазовым сдвигом управляющего воздействия относительно возмущающего по сравнению с теоретическим случаем отсутствия фазового сдвига между возмущением и управляющим воздействием.