Теория автоматического регулирования — возникновение и основные задачи
До сих пор мы говорили о двух направлениях гуманитарной мысли, которые сегодня оказывают непосредственное влияние на формирование представлений о том, что такое управление и какова его «технология», то есть каковы правила, которыми должен руководствоваться управляющий.
Долгое время руководители-практики и не нуждались в другом. Они управляли человеческими коллективами и их производственной деятельностью на основании своего опыта или давно устоявшихся методов.
Но, начиная с какого-то определенного уровня, сложности объекта управления традиционных подходов становилось уже недостаточно. Чтобы сопоставлять варианты возможных управленческих решений, кибернет должен уже уметь оценивать их последствия количественно. Давайте вдумаемся в смысл управленческого процесса.
Перед каждым управляющим (менеджером, кибернетом, военачальником и т. д.) всегда стоит определенная цель. Это может быть обеспечение выполнения плана, получение максимального дохода, передислокация армии и т. д. Для достижения ее ему предоставляется определенный ресурс: деньги, машины, люди… Без этих двух факторов: целей и средств для их достижения говорить об управлении смысла не имеет.
Итак, цели и средства. Предположим, что и то и другое у управляющего есть. Его задача — так использовать средства, чтобы как можно ближе подойти к цели или с наименьшими затратами, достигнуть ее наиболее безболезненно. А мешать этому будут самые различные обстоятельства, с которыми управляющему предстоит еще справиться: на рынке могут оказаться не те цены и не тот спрос, на которые он рассчитывал, поставщики не смогут своевременно обеспечить его производство кондиционным сырьем, транспортники — транспортными средствами и т. д., в общем, не та конъюнктура.
И, распределяя свой ресурс, управляющий непрерывно прогнозирует результат своих действий. Он анализирует, сопоставляет: «Если я сделаю так, получится то-то, если иначе, то и результат будет иной».
Он все время ведет своеобразный мысленный диалог. И в этом смысле управляющий во многом похож на исследователя.
Если ситуация относительно проста, то ему не очень трудно проследить всю цепочку следствий и легко оценить то, что получится из замысла, во что выльется его способ действия. Для этого ему достаточно общих стандартных рецептов. Вот почему до поры до времени практика управления довольствовалась тем уровнем анализа, который обеспечивал вербальный, то есть словесный, анализ.
Но по мере развития техники и технологии, усложнения хозяйственных связей, да и всего жизненного уклада управляющему уже трудно проследить действия всех логических цепочек, предусмотреть последствия своих собственных действий. Да и требования к точности оценок результатов управленческих решений сегодня совершенно иные, чем были еще полстолетия назад. Современное производство отличается высокой синхронизацией операций. На заводах типа ВАЗ, например, потоки конвейерных линий должны быть согласованы до долей секунды. Все поставки смежников прямо с колес идут в цех. И подобный ритм во всем. К такому режиму подстраиваются и остальные службы завода, каждый сбой которых влечет многомиллионные потери.
И так во всем: в проектировании народнохозяйственных комплексов, при составлении производственных планов, всюду при современных масштабах производства необходима удивительная, я бы сказал, филигранная притертость хозяйственных звеньев.
Но высокая точность, разумеется, не может быть получена дедовскими методами. Управляющему приходится искать способы, позволяющие более ясно увидеть результат своих решений, и эти способы предоставляет ему математика, особенно сейчас, когда она располагает могучими средствами вычислительной техники, позволяющими не только обрабатывать информацию, но и на моделях, имитирующих функционирование того или иного народнохозяйственного организма, предсказывать его будущее, его эволюцию в зависимости от тех решений, которые управляющий сочтет нужным принять. Значит, уже недостаточно словесной характеристики предполагаемых действий, мало бухгалтерских расчетов, проводимых вручную; нужны расчеты, основанные на использовании математических моделей изучаемых процессов, нужны математические методы их анализа.
Поэтому правомерно, что специалисты, занимающиеся использованием ЭВМ в управлении экономикой, однажды начали изучать приемы и методы «Теории технического управления» (ТТУ). При этом оказалось, что в ТТУ уже развиты разнообразные идеи и методы, которые подошли и для управления процессами, протекающими в экономической сфере.
Возникла «Теория технического управления» еще в 40-х годах прошлого века. Она развилась в обширную дисциплину по изучению работы различных регуляторов и созданию основ их проектирования. Важнейшее достоинство ТТУ — это разработка количественных методов оценки качества управляющих устройств. Конечно, сама ТТУ еще довольно бедна для того, чтобы стать основой науки управления процессами общественной природы. Но она является одним из важных элементов современной теории управления производственной деятельностью, и без ее инструментария количественного анализа сегодня вряд ли возможно представить себе хорошо функционирующую систему хозяйственного управления.
«Теория технического управления» долгое время именовалась «Теорией автоматического регулирования» — название, которое сейчас постепенно забывается. Она оформилась в связи с исследованиями центробежного регулятора Уатта, предназначенного для регулирования числа оборотов вала паровой машины. Правда, этим исследованиям предшествовал еще целый ряд работ, которым по тем или иным причинам не суждено было стать родоначальниками новой теории (исследования регулятора Сименса, работы астронома Эри по управлению телескопом и др.). Тем не менее считается, что изобретение регулятора Уатта — событие эпохальное.
Дело даже не в том, что был изобретен еще один механизм для управления паровой машины, — регулятор Уатта впервые реализовал автоматическое управление, управление без вмешательства субъекта, без вмешательства людей. Раньше к паровой машине приставлялся человек, который менял направление и количество подаваемого в цилиндр пара, регулировал ее работу. Теперь все делалось само по себе. Появилось не просто техническое изобретение — родился новый взгляд на принцип управления. Расскажем все по порядку. Сначала — что такое регулятор Уатта, как он работает и каковы проблемы его проектирования и использования.
Представим себе вал трансмиссии, которая в стародавние времена с помощью приводных ремней заставляла работать токарные, сверлильные и прочие станки.
Даже при самой ритмичной работе каждый рабочий-станочник по-своему нагружал трансмиссию. Он то менял заготовки деталей, то менял инструмент, то производил операции, требующие разных затрат мощности, и т. д. Нагрузка на трансмиссию в силу этого все время менялась, и при одной и той же мощности паровой машины, при одной и той же величине вращающего момента вала трансмиссии число оборотов вала менялось. Следовательно, менялись условия работы станков. А это уже недопустимо! Надо было стабилизировать количество оборотов трансмиссии, для чего надо было изменить количество пара, подаваемого в цилиндры. Эту задачу и решал регулятор Уатта. Делал он это так.
Когда нагрузка на вал увеличивалась, он автоматически увеличивал отверстие, через которое пар поступал в цилиндры машины из парового котла, увеличивая тем самым подачу пара. И прикрывал заслонку, когда нагрузка на вал падала, уменьшая подачу пара.
Так появилась первая техническая конструкция, автоматически реализующая обратную связь. Конечно, это утверждение не совсем точное. Технические системы с обратной связью придумывались еще в античную эпоху Героном и Филоном. И регулятор Уатта лишний раз доказывает справедливость утверждения, что «все новое — это хорошо забытое старое»! Но если идеи античных ученых были опытами, опередившими на тысячелетия потребности общества, то регулятор Уатта отвечал жизненной необходимости развивающейся техники и положил начало современному машиностроению. Идея его конструкции была удивительно проста.
Рис. 2
Представим себе две симметричные массы (центробежные кулачки), связанные с вращающимся валом OO' (см. рисунок). Эти массы стягиваются пружиной, старающейся уменьшить угол α — угол, на который массы отклоняются от оси при вращении вала. Чем больше число его оборотов, тем больше центробежная сила, действующая на массы m 1 и m 2 ) и тем больше будет угол а.
И обратно, с уменьшением числа оборотов вала угол отклонения а уменьшается. Следовательно, нам достаточно связать этот угол с ходом заслонки, регулирующей подачу пара из котла в цилиндр, чтобы реализовать процесс управления числом оборотов трансмиссии с целью обеспечения постоянства этой величины.
Таким образом, регулятор Уатта «чувствует» (фиксирует, автоматически измеряет) изменение нагрузки на вал, «следит» за изменением числа его оборотов и соответственно этому изменению меняет количество пара, поступающего в цилиндр. Так регулятор Уатта способен совершенно автоматически сохранять необходимое число оборотов вала трансмиссии независимо от нагрузки.
На основе этой идеи были построены первые регуляторы паровых машин. Никакой специальной теории тогда инженерам не требовалось — уж очень просты были первые регуляторы. Но техника развивалась, росли скорости работы станков, повышалась мощность паровых машин, за счет лучшей обработки деталей уменьшалось трение в регуляторах, совершенствовалось многое другое. Однако вместе с усложнением всей системы «станки трансмиссия — паровая машина — регулятор» регулятор все чаще и чаще переставал выполнять свои обязанности; число оборотов вала колебалось, появлялись вибрации, системы все чаще и чаще стали выходить на аварийные режимы. Инженеры поняли, что для хорошей работы регулятора необходимо правильно рассчитать его параметры, и прежде всего соотношение между углом, на который расходятся центробежные кулачки, и ходом заслонки, регулирующей подачу пара.
Кроме того, надо было понять роль трения в регуляторе (как показал опыт, уменьшение трения часто не улучшало качества регулирования, а ухудшало его).
Одним словом, практика управления производством на предприятиях, оснащенных паровыми машинами, потребовала создания теории, способной рассчитывать параметры регулятора, обеспечивающие устойчивый режим его работы. Это значит, что жизнь поставила задачу создания математической модели регулятора Уатта и методов ее анализа. Эту задачу практически одновременно и независимо друг от друга решали английский физик Дж. Максвелл и русский инженер И. Вышнеградский. Они положили начало новой дисциплине, которую стали называть «Теорией регулирования».
От «Теории регулирования» к «Теории технического управления»
Задача проектирования регулятора Уатта несла в себе уже все основные идеи будущей теории технического управления системами.
Исследования Д. Максвелла и И. Вышнеградского дали в руки инженерам такую схему проектирования регулятора, которая обеспечивала его устойчивую работу.
Они не только показали возможность построения математических моделей процессов регулирования работы сложных технических систем, но и доказали, что именно с построения такой модели и должно начинаться проектирование каждого регулирующего устройства.
Любое моделирование — неисчерпаемо сложно.
Но при создании модели для исследования практических задач не следует переусложнять ее и строить, так сказать, минимальную модель. А это всегда искусство, это талант исследователя: надо, чтобы она, с одной стороны, достаточно точно (с позиций практики) описывала процесс, а с другой — не была бы перегружена второстепенными деталями.
Первая модель, которую строил И. Вышнеградский, была, с точки зрения математика, совсем простая — она описывалась линейным дифференциальным уравнением третьего порядка с постоянными коэффициентами. Это значит, что сколько бы ни было параметров у регулирующего механизма, его поведение определяется только тремя величинами.
Следующий шаг — формулировка цели. Он также ответствен и труден, ибо надо на математическом языке сказать, что значит хороший регулятор. И впервые в работах Дж. Максвелла и И. Вышнеградского была найдена та формулировка цели управления, которая на протяжении целого столетия определяла развитие дисциплины.
С точки зрения инженера, требования к регулятору достаточно просты при любом изменении нагрузки он должен обеспечивать постоянство числа оборотов вала. Это требование можно перевести на язык математика очень большим числом способов. Но из них надо выбрать такую формулировку критерия, определяющего качество работы регулятора, чтобы выполнение требований критерия удовлетворяло требование практики.
И И. Вышнеградский и Дж. Максвелл в качестве такого критерия выбирают условия асимптотической устойчивости работы регулятора. Оно означает, что любое отклонение от заданного установившегося режима вращения с течением времени должно затухнуть, исчезнуть. Другими словами, при любом сбое в нагрузке режим вращения со временем должен восстановиться.
Заметим, что при такой конструкции регулятора число оборотов вала всегда будет немного отличаться от заданного. Но ведь инженеру не требуется абсолютное их совпадение. Важно, чтобы регулятор обеспечивал достаточно малое отклонение от расчетного режима.
А это требование может быть проверено лишь на практике.
Забегая вперед, скажем, что требование устойчивости оказалось не просто приемлемым — в течение целого столетия оно помогало проектантам создавать конструкции, вполне удовлетворяющие практику. Так удачное представление критерия на языке математики оказывается ключом при создании управляющих систем.
Последний, заключительный, этап исследования регулятора должен состоять в том, чтобы выбранное условие устойчивости записать в такой форме, в какой представлены требования к регулятору. Потом уже дело инженера так выбрать параметры регулятора, чтобы они удовлетворяли выбранным условиям. Этот этап требует математического анализа модели. В модели регулятора Уатта все оказалось более или менее просто. Теория И. Вышнеградского точно указывала границы допустимых значений параметров регулятора. Она позволяла подобрать «хороший регулятор» для любой системы «станок — паровая машина».
Новая теория позволила И. Вышнеградскому сделать ряд важных заключений:
а) не надо стремиться делать слишком малым трение о валик регулятора; б) не следует делать грузики слишком массивными; в) нужно стараться увеличивать степень неравномерности величины, характеризующей зависимость угловой скорости вала машины от величины внешней нагрузки («без неравномерности нет регулятора» — основной тезис И. Вышнеградского).
Эти правила были совсем не очевидными. Более того, они противоречили тем тенденциям, которые возникали в инженерной практике тех времен, например, считалось, что чем меньше трение в регуляторе, тем он лучше. Так теоретическим путем были устранены трудности проектирования регуляторов Уатта, а рекомендации науки, казалось, противоречившие интуиции инженеров, не только утвердили престиж новой теории, но и сыграли немаловажную роль в утверждении математических методов в инженерных дисциплинах.
Итак, задача о регуляторе Уатта оказалась решенной полностью. Более того, было установлено, что как бы ни был устроен регулятор Уатта, он будет обеспечивать устойчивую работу трансмиссии, если только его параметры удовлетворяют перечисленным выше условиям. Заметим, что теория не дает однозначных рекомендаций. И эта неоднозначность очень удобна, поскольку она предоставляет инженеру, проектирующему регулятор, возможность варьировать в определенных границах параметры так, как ему удобно, и дает простор для творчества.
Теория регулятора Уатта дала начало целому потоку исследований. Оказалось, что принципы автоматического управления, систематизированные Дж. Максвеллом и И. Вышнеградским, довольно универсальны. Они дают возможность проектировать механизмы, управляющие работой ректификационных колонн нефтехимии, поддерживающие заданную температуру в химических реакторах, обеспечивать заданный режим полета самолета и т. д.
Выяснилось также, что математические методы, предложенные И. Вышнеградским и Дж. Максвеллом, при соответствующем развитии годятся и для задач, возникающих в практике управления. В XIX и первых десятилетиях XX века этот факт послужил источником многочисленных исследований чисто математического характера. Усилиями Рауса в Англии, Д. Стодолы в Чехии, Н. Жуковского в России и ряда других крупных ученых и инженеров «Теория регулирования» превратилась постепенно в самостоятельную науку.
Вместе с «Теорией регулирования» развивались также другие технические дисциплины, определявшие правила инженерного проектирования регуляторов. Оказалось, что, несмотря на различие условий, в которых работают, скажем, автопилот и регулятор температуры в химическом реакторе, у них много общего — я бы сказал, общие принципы, общая организация, единая структура.
Так, всякая система регулирования должна иметь некоторый чувствительный регистрирующий орган, позволяющий оценивать состояние системы и показывать, насколько она отклоняется от предписанного ей режима.
В автопилоте таким чувствительным органом является гироскоп: благодаря способности его оси сохранять положение в пространстве он позволяет обнаруживать непредусмотренный крен самолета, отклонение его курса и т. д. В реакторах, где важно сохранять постоянство температуры, чувствительным элементом является термометр либо иное устройство, измеряющее температуру.
В регуляторе Уатта это угол отклонения центробежных грузиков от их расчетного положения. Назовем условно этот элемент системы регулирования информационной системой, поскольку он поставляет нам данные о ее состоянии.
Далее, любая система регулирования имеет блок, который именуется блоком выработки сигнала, или, имея в виду последующие разговоры, назовем его блоком принятия решения. В автопилоте это гироскоп, по сигналу которого вырабатывается команда поворота рулей или элеронов, компенсирующая отклонения. В ректификационных колоннах это устройство, обеспечивающее регулирование температуры процесса. В паровых двигателях это система, регулирующая соотношение длины хода заслонок, открывающих доступ пара в паровую машину, и угол отклонения грузиков от его расчетного положения. В современных сложных системах регулирования в этом блоке может присутствовать и электронная вычислительная машина.
Наконец, в любой системе регулирования должны быть управляющие органы и силовой агрегат, который их приводит в действие. В автопилоте управляющие органы — это рули высоты и поворота и элероны. Силовой агрегат — рулевая машинка. В системе регулирования паровой машины управляющий орган — это заслонка, пропускающая пар в цилиндры паровой машины. Силовой агрегат сам центробежный механизм (регулятор прямого действия).
Общим признаком всех систем регулирования является реализация принципа обратной связи: управляющие воздействия на управляющую систему оказываются функциями и следствиями отклонения системы от предписанного ей режима работы. Эти функции могут быть самой разной природы, самого разного уровня сложности. Если обратные связи в системе достаточно просты, то такие системы называются рефлексными. Система, снабженная регулятором Уатта, является рефлексной: увеличилось число оборотов трансмиссии на 10 процентов — на столько же процентов уменьшается подача пара; уменьшилось число оборотов — увеличивается подача пара.
Понятие «рефлексные системы» идет из физиологии, и возникло оно в школе академика И. Павлова. Реакция организма на раздражитель называется рефлексом, если она связана с возбуждением простой функциональной связью. Позднее мы убедимся, что далеко не все обратные связи рефлексные и описываются достаточно простой зависимостью.
Есть еще одно общее у этих задач, что послужило поводом называть эту дисциплину «Теорией регулирования». Все перечисленные системы имели своей целью регулирование установившихся стационарных режимов.
Автопилот призван обеспечить равномерный и прямолинейный по*лет самолета независимо от силы воздушных течений, неравномерности работы двигателя или других причин, не предусмотренных заранее расчетами.
Терморегулятор в химическом реакторе должен держать постоянной заданную температуру в зоне реакции. Регулятор Уатта должен обеспечивать равномерное вращение вала трансмиссии. Решения именно этих технических проблем породили определенные классы математических задач, составивших содержание исследований в данной области в течение почти ста лет.
И наконец, еще одно немаловажное обстоятельство.
Основным требованием, которому должны были удовлетворять все регуляторы, — была устойчивость. Но условие устойчивости не выделяет единственного решения:
обеспечить устойчивость можно многими способами. Поэтому конструктор получал определенную свободу выбора. Создавая тот или иной механизм, он всегда сталкивается с необходимостью удовлетворить различным и подчас противоречивым требованиям. Требование повышения качества трудно согласуется, например, с требованием снижения себестоимости. Увеличение прочности и надежности приводит к увеличению веса конструкции самолета, то есть к ухудшению его летных характеристик, и т. д. Поэтому та свобода выбора параметров, которую допускает «Теория регулирования», позволяла конструктору выполнять и другие требования, которые перед ним возникают, находить разумные между ними соотношения. Это обстоятельство породило целый ряд новых проблем, которые подготовили следующий этап развития теории. Поясним это на одном примере.
Пусть речь идет все о том же автопилоте пассажирского самолета. Его задача — обеспечить равномерный установившийся полет самолета. Для этого он должен быть способен парировать, например, любые случайные порывы ветра. Сделать это можно, как мы выяснили, бесчисленным числом способов, Но это означает, что среди них можно найти и такой, который лучше других, однако уже по какому-либо другому критерию. Таким критерием может быть, например, удобство пассажиров — оно определяется величиной перегрузок. Мы все знаем, как неприятны случайные ускорения, воспринимаемые нами как толчки. И всегда очень ценим умение шофера не только соблюдать правила уличного движения, но и вести машину так плавно, чтобы пассажиры не замечали ускорений, замедлений и резких поворотов.
Значит, и от автопилота мы можем потребовать нечто подобное. Потребовать, чтобы он не только обеспечивал устойчивость полета, но и старался компенсировать случайные помехи так, чтобы перегрузки были по возможности малыми.
Вот каковой была постановка задач регулирования, в которой впервые появилось понятие качества регулирования. Инженеры начали ею заниматься еще в довоенное время. Именно в те годы впервые появилась идея оптимизации применительно к управлению. Эта идея требовала не просто обеспечения достижения цели управления, а достижения ее наилучшим образом.
К концу 30-х годов развитие «Теории регулирования» казалось, закончилось: проблемы, которые вызвали ее появление и оформление как самостоятельной дисциплины, оказались решенными. Методы, развитые ею к этому времени, позволяли решать практически все задачи, возникающие в инженерной практике, и вполне удовлетворяли запросы практики. «Теория регулирования» стала постепенно превращаться в стандартную дисциплину, подобную «Деталям машин» или «Сопромату» с их строго канонизированными постановками задач и методами решения.
Но человеческая практика, научно-технический прогресс непрерывно усложняют жизнь и ставят новые задачи. Исследователь всегда подобен путнику, идущему через перевалы. Перед каждым новым ему кажется, что он последний. Но, поднявшись на него, он видит, что перед ним новый, еще более высокий, поднявшись на него, он опять видит перед собой новый перевал и т. д.
Но если у него достаточно сил, то он знает, что однажды доберется до самого высокого и увидит то, что скрывается за ним. То же случилось и с «Теорией регулирования». Преодолев трудности решения задач, которые наука унаследовала от И. Вышнеградского и Дж. Максвелла, ученые увидели задачи, которые оказались не только естественным развитием старых, но и требовали нового видения проблем управления и нового математического аппарата.
Я не сомневаюсь, что крупные ученые еще раньше видели эти новые задачи и имели принципиальные соображения, как их решать, еще в довоенное время.
Но только после войны бурное развитие техники потребовало практического решения этих новых задач науки и техники.
Современная теория технического управления системами
Итак, с «Теорией регулирования» связаны две фундаментальные идеи, развитию которых и посвящена главным образом эта дисциплина. Первая — это идея обратной связи. Вторая — представление о качестве управления.
«Теория регулирования» предложила способы проектирования обратной связи и оценки качества для относительно простых технических систем. Но развитие техники и технологии стало выдвигать новые задачи, потребовавшие нового расширения теории. Постепенно возникла знакомая нам «Теория технического управления», которая является прямой наследницей «Теории регулирования». Основное качественное усложнение тематики произошло в связи с созданием ракетной техники.
Ракета так же, как самолет или химический реактор, является управляемой системой. Но задачи управления, здесь возникающие, совершенно непохожи на самолетные. Поясним содержание этих новых задач на хорошо известном примере вывода космических аппаратов на орбиту.
Перед конструктором обычно ставится вполне определенная цель: обеспечить вывод космического аппарата на заданную орбиту, например орбиту спутника Земли.
Для ее достижения он располагает целым рядом возможностей. Прежде всего это варьирование величиной тяги; другими словами, он может распоряжаться подачей в камеру сгорания того или иного количества горючего и окислителя. Кроме того, он может менять положение газовых рулей, направляющих газовый поток ракетного двигателя. Как распорядиться этими возможностями, как обеспечить достижение цели, причем наилучшим образом?
Проблема выбора этих управленческих воздействий, или, как иногда говорят, управляющих функций, оказалась весьма сложной и потребовала создания не только специальных методов расчета, но и выявила ряд других трудностей.
Чтобы провести расчеты, которые позволили бы определить управляющие функции, обеспечивающие достижение цели управления, необходимо знать плотность воздуха, скорость и направление ветра, особенности работы двигателя и многое другое, что никогда вполне точно заранее знать невозможно.
Значит, конструктор должен задаться каким-то определенным сценарием внешней неконтролируемой обстановки (так мы будем называть предполагаемый комплекс значений величин, определяющих внешние условия). Не сделав подобного предположения, просто невозможно провести необходимые вычисления. Следовательно, этот предварительный расчет достижения орбиты, который даст нам возможность определить потребный ресурс (запас горючего в первую очередь) и способ его использования, мы проводим для некоторой идеальной, абстрактной обстановки, так как заранее знать, какова будет реальная, нам, увы, не дано.
Выбор управляющих воздействий имеет одну очень важную особенность: если задача вообще имеет решение, то есть если ресурса достаточно для достижения цели, то вывод аппарата на орбиту может быть осуществлен бесчисленным множеством способов. Поэтому одновременно с заданием цели управления ставится вопрос о том критерии, по которому мы будем отбирать необходимые нам управляющие воздействия из тех, которые обеспечивают достижение цели.
Поскольку, как говорят, «грамм в космосе стоит тонну на земле», то таким критерием (принципом отбора) у нас будет количество затрачиваемого горючего, необходимого для достижения орбиты. Поэтому из множества вариантов управления мы выберем тот, где минимальная затрата топлива.
Для решения подобных задач сейчас развиты относительно простые и надежные методы. Однако в то время их еще не существовало, и потребовались немалые усилия ученых и математиков, чтобы их найти. Сейчас создана специальная теория, которая получила название «Теория оптимального управления». Главным результатом ее является так называемый принцип максимума, открытий академиком Л. Понтрягиным в начале 50-х годов. Он позволяет свести большинство практических задач определения оптимального управления, по которым можно рассчитывать оптимальную траекторию, к известным уже математике задачам с хорошо разработанным методом решения.
Воспользовавшись этим методом расчета, мы сможем найти траекторию, которая, будет оптимальной по выбранному критерию. Эту траекторию называют программной или просто «оптимальной программой».
В свою очередь, управление, обеспечивающее движение по этой траектории, называется оптимальным или программным.
Оптимальная траектория в задаче о полете космического аппарата играет ту же роль, что и заданное число оборотов вала в теории регулятора Уатта или заданный курс при расчете параметров автопилота.
На последнем остановимся подробнее. Предположим, что мы решим воспользоваться автопилотом при полете, скажем, из Москвы в Новосибирск. Прежде чем передать ему управление, мы должны определить курс, то есть указать направление полета, высоту полета (так называемый эшелон), пункты поворота, иными словами, должны составить для него программу полета, рассчитать программную траекторию. Но поскольку эта задача довольно проста (так же как и определение скорости вращения вала трансмиссии) и требует применения лишь четырех действий арифметики, то для ее решения определенной теории не требовалось. В задачах же космической техники выбор программной траектории превратился в трудную проблему, потребовавшую создания специальной теории! Необходимость расчета программной траектории управляемого объекта и была тем новым, что вошло в «Теорию технического управления» в послевоенный период.
В предыдущем разделе обращалось внимание на появление идей оптимизации в проблемах управления.
Но там шла речь лишь об использовании дополнительных возможностей: в области устойчивости надо было выбрать соотношение параметров регулятора так, чтобы была гарантирована не только устойчивость, но и обеспечивалась бы минимальная перегрузка. Теперь задача стала бесконечно более трудной.
Но выбор оптимальной программы — лишь первый шаг в той системе расчетов, которая необходима для достижения цели.
В самом деле, если, заложив программу управления в наш космический корабль, отправим его в путь, мы можем быть уверены, что он никогда до цели не долетит.
Дело в том, что реальная обстановка наверняка окажется отличной от той, какую мы предусмотрели в нашем сценарии. И ветер будет несколько отличен от расчетного, и температура воздуха будет не той, какую мы заложили в расчеты, и т. д. Одним словом, возникнет так много помех, что наше расчетное оптимальное управление будет вести аппарат совсем не по оптимальной траектории. Острословы говорят, что оптимальной траекторией называется та траектория, по которой ракета никогда не летает!
Есть ли выход из сложившейся ситуации? Да. На ракету надо поместить еще и автомат управления — специальный механизм, который, подобно автопилоту, будет реализовывать обратную связь. Он будет изменять нашу программу управления всякий раз, как только аппарат отклонится от программной расчетной траектории под действием не предусмотренных нами помех.
С проблемой организации обратной связи мы уже знакомились. На космическом аппарате такая связь должна состоять, во-первых, из программно-информационной системы, в память которой закладывается информация о программной расчетной траектории. Снабжена она должна быть устройствами, способными измерять положения ракеты в пространстве и сопоставлять их с программной траекторией.
Во-вторых, в ней должен быть блок собственно обратной связи — механизм, перерабатывающий эту информацию и вырабатывающий команды об изменении углов, на которые должны повернуться газовые рули, о количестве подаваемого горючего и о других управляющих воздействиях. Надо заметить, что здесь идет речь лишь о корректирующих (малых) изменениях управляющих величин, поскольку основные уже заложены в расчетную программу.
Ну и, в-третьих, последний блок — силовое устройство, изменяющее положение рулей, всевозможных рычагов, заслонок и т. п.
Может показаться, что все это было и в любой системе регулирования. Однако здесь есть одна принципиальная разница. Чем проще программная траектория, тем легче построить систему обратной связи — автомат стабилизации. В «Теории регулирования» это было движение с постоянными характеристиками. Самолет какое-то время летит по прямой, с постоянной скоростью, на постоянной высоте. А ракета? Ее скорость, например, за короткое время изменяется от нуля до 8 километров в секунду. Поэтому требования к автомату, который ведет ракету по такой траектории, совсем иные, чем к автопилоту. Надо было создать новые методы его расчета методы расчета «ракетных» автопилотов. И сегодня мы научились это делать! И это свидетельствует о том, каким могучим инструментом управления обладает сегодня человек и как это много даст, если мы научимся применять эти знания и умения в других областях человеческой деятельности, для управления производством, в частности.
Так «Теория технического управления», сформировавшаяся в 50-е годы и включившая в себя «Теорию регулирования» как важнейшую составную часть, завоевала себе «место под солнцем»! В ней возникло много новых разделов, таких, например, как «Теория оптимального управления», существенно расширивших область применения средств управления. Одним из важнейших ее разделов стал метод Оптимальных программ, или Программный метод, на котором мы и остановимся несколько подробнее.
Программный метод в теории технического управления системами
Сейчас Программный метод принято называть Программно-целевым. Наверное, такое уточнение особого смысла не имеет. Ведь говорить об управлении можно лишь тогда и только тогда, когда существует цель управления. И тем не менее такой лингвистический нонсенс, как мы увидим, имеет известное оправдание.
Начнем с того, что первый этап Программного метода — это назначение цели. Для технических систем, какими бы они ни были, цели назначаются извне: проектанты их не разрабатывают, а получают свыше, они им задаются. Космический аппарат можно вывести на круговую орбиту радиусом и в 200 километров и в 400, а на какую именно — руководители вывода сами не решают, а получают указание.
Создавая нефтегазовый комплекс, инженеры-проектировщики и управленцы получают готовое задание от вышестоящих организаций или заказчиков с точным указанием основных характеристик комплекса, сроков строительства и в течение скольких лет этот комплекс должен выдавать заданное количество продуктов нефти и газа. Откуда взялись эти задания и каким образом их удалось сформулировать, строителей и эксплуатационников не волнует: задания ими не разрабатываются, а им задаются! Если окажется, что поставленная цель недостижима — система не может обеспечить заданной добычи, — инженеры возвращают задание заказчику со своими комментариями. И только.
Итак, цель для технической системы задается «верхним уровнем», а весь механизм управления настроен на достижение этой цели. Можно сказать и так: цель является отправным пунктом планирования ресурсов! Или, другими словами, планирование производится от поставленной цели.
Сказанное может показаться тавтологией, повторением очевидных истин. Но в дальнейшем мы увидим, что эти совершенно очевидные истины служат источником далеко не благодушных дискуссий, а степень их понимания является главной оценкой интеллекта и профессиональной культуры управляющего, плановика, проектировщика!
Второй этап реализации Программного метода — это построение программы (или плана) такого распределения ресурсов управления, которое обеспечивает достижение цели. Если ресурса достаточно, например, если в баках ракеты достаточно горючего для вывода ее на орбиту, то цель может быть достигнута многими способами, и тогда возникает проблема оценки и сравнения этих способов, И вот здесь-то и возникают многочисленные трудности, часто носящие совсем не технический характер.
Сегодня многие произносят слова «оптимальное решение», не всегда отдавая себе отчет в том, насколько условным может быть эта самая оптимальность. Разные дополнительные требования и условия так связывают проектировщика, что у него практически нет никаких возможностей сравнивать свое решение с чем-нибудь иным. Проектируя пассажирский самолет, он обязан обеспечить заданную посадочную скорость, заданные условия безопасности, заданную крейсерскую скорость, заданные экономические требования и многое другое. Эти ограничения так сужают его возможности, что он оказывается в положении человека, попавшего в узкий извилистый коридор: полметра влево стена, полметра вправо — тоже стена, и весь его выбор, вся оптимизация сводятся к тому, чтобы идти посредине этого коридора. И оказывается, что ему остается найти лишь одно-единственное допустимое управляющее решение, которое обеспечивает достижение цели.
Но мы остановимся на вопросе, который, может быть, является самым трудным в практике и теории управления, — на вопросе о неоднозначности оценки решения, на необходимости уметь согласовывать противоречивые требования. Проектировщик или управляющий всегда должен отыскивать компромиссы, находить проход между Сциллой и Харибдой. Самый простой пример компромисса, с которым мы всегда сталкиваемся в повседневной практике, — это компромисс между качеством и стоимостью. Конструктору всегда хочется сделать свою конструкцию и подешевле и получше. Эти желания противоречивы: чтобы сделать машину более надежной и красивой, надо затратить больше труда, а значит, она станет более дорогой. И каких-либо общих рецептов, позволяющих увязать эти противоречивые критерии (требования), не существует. И все же в ТТУ разработаны приемы анализа подобных «неразрешимых» конфликтов и отыскания приемлемых для практики решений.
Один из них получил название метода двухэтапной оптимизации. Сегодня он лежит в основе технологии Программного метода управления народным хозяйством, и нам стоит в нем разобраться.
Чтобы пояснить существо дела, вернемся снова к проблеме вывода космического аппарата и рассмотрим случай стыковки его с орбитальной станцией. Рассчитывая траекторию, конструктор должен примирить два противоречивых требования: экономичность и точность.
Затратить как можно меньше горючего и как можно точнее вывести аппарат в точку встречи с орбитальной станцией. Но эти два критерия противоречивы. В самом деле, чтобы обеспечить точность вывода, система управления должна быть способной парировать все не предусмотренные полетной программой случайные внешние воздействия, о которых уже говорилось. Но ничего не дается даром: работа, системы управления требует затраты энергии — того же горючего. Значит, чем точнее мы выведем аппарат в заданную точку встречи (чем лучше нам удастся справиться со случайными внешними помехами), тем больше израсходуем горючего, тем дороже нам будет стоить вывод. Задача кажется неразрешимой! Однако инженеры научились находить выход из этой «безвыходной» ситуации, научились находить приемлемый для практики компромисс. Это крупнейшее завоевание ТТУ.
Проследим еще раз за ходом рассуждений на том же примере космического аппарата.
На первом этапе наших расчетов мы выбираем определенный сценарий внешней обстановки: характер движения атмосферы, параметры работы двигателей, одним словом, мы считаем вполне определенными все те величины, от которых зависит траектория полета. И для этих фиксированных, на самом деле гипотетических, условий мы и проводим расчет программы, выбирая ее наиболее экономной с точки зрения расчета горючего.
Но в предыдущем параграфе говорилось, что по оптимальной траектории ракета никогда не летает — ей мешают помехи. Чтобы парировать их действие, ставится стабилизатор (программный регулятор) — система обратной связи, которая измеряет отклонения от программной траектории и корректирует полет таким образом, чтобы он был как можно ближе к программному.
Точнее говоря, с помощью этого корректирующего управления мы добиваемся наилучшего значения второго критерия — максимальной точности. Создается впечатление, что конструкторам удалось каким-то образом «надуть» природу одновременно провести оптимизацию по обоим критериям: обеспечить при наименьших затратах горючего максимальную точность. Но «надуть» природу невозможно. В действительности они лишь нашли приемлемый компромисс: при относительно небольших затратах топлива ими достигнута нужная точность, и таким образом найден способ управления, обеспечивающий выполнение основного задания — стыковку с орбитальной станцией.
Конечно, описанный метод отыскания компромисса не всегда может быть использован. Он хорош лишь в том случае, если затраты горючего на коррекцию малы по сравнению с затратами на реализацию основной программы, то есть на вывод корабля на орбиту.
Тем не менее область применения Программного метода чрезвычайно широка и все время расширяется по мере усложнения технических систем. Схема его может быть изображена в виде следующей цепочки процедур:
формирование цели — расчет программы — построение механизма обратной связи.
Дальнейшее развитие метода
Итак, Программный метод в той форме, в какой мы его представили, пригоден тогда, когда случайные неконтролируемые факторы, когда «помехи» не очень существенны и преодоление их требует относительно небольшой затраты ресурсов. Но бывает, что необходимо создавать системы управления, работающие в условиях, когда «помехи» эти становятся очень большими. Пример тому — система управления водохранилищами.
Запасы воды в водохранилищах, как правило, зависят лишь от зимних снегопадов, и в конце апреля инженеры-гидрологи, отвечающие за ее использование, довольно точно знают тот ресурс, которым они могут распоряжаться. А вот потребности в воде они заранее знать не могут и не могут их рассчитать, так как они в сельском хозяйстве зависят от того, сколько выпадет осадков, сколько будет солнечных дней и прочих погодных факторов, величины которых варьируют в самых широких пределах. И, несмотря на подобную неопределенность, перед инженерами стоит задача создать такую систему управления, которая обеспечивала бы по возможности более высокий урожай на поливных землях.
Здесь также можно задать некоторый погодный сценарий и решить задачу оптимального управления — найти такое распределение воды из водохранилища, которое при погодных условиях, предполагаемых сценарием, обеспечивало бы максимальный урожай.
Для этого нам понадобятся модели роста растений (они сегодня существуют), и, проведя с их помощью расчеты, можно установить, сколько и в какие сроки надо подавать воды на поля, то есть можно построить своеобразную программную траекторию. Но можно ли ее принять в качестве основы управления? Ведь при управлении ракетой мы принимали программную траекторию, зная, что все неконтролируемые факторы будут относительно малыми и наш космический аппарат при автоматической коррекции будет стремиться идти вдоль этой траектории и достигнет цели. А при том уровне неопределенности, который имеет место в сельскохозяйственном производстве, может ли вообще существовать такая программная траектория? Имеет ли смысл стараться строить систему коррекции так, чтобы придерживаться той траектории, которая определена нашей программой? Может быть, лучше, исходя из реальной погодной ситуации и состояния посевов, заново составить план перераспределения водных и других ресурсов, находящихся в распоряжении управляющего? То есть составить новый сценарий, используя новый прогноз погоды, более точный, более реалистичный, чем первоначальный?
Таким образом, мы приходим к новой схеме управления — новому варианту процедур Программного метода. Сначала, по первоначальному прогнозу погоды строится первая программа использования воды так, будто погодные условия до конца сезона будут такими, какими мы их заложили в расчет, но следуем этой программе лишь в течение небольшого отрезка времени — недели или декады. Затем на основании новой информации составляется новый прогноз погоды и строится новая программа и т. д. Таким образом, все управление строится по одному типу и сводится к последовательному расчету оптимальной программы, систематическому сбору новой информации, построению нового прогноза и составлению нового сценария, новой программы.
Эта процедура позволяет по-иному организовать управление на основе принципа обратной связи. Здесь обратная связь реализуется с помощью многократного повторения расчета программной траектории на основе новой информации о погодных условиях и состоянии посевов.
Подобный метод управления (организации обратной связи) часто называют «методом водохранилища», поскольку он впервые описан именно для систем водопользования в сельском хозяйстве. Но нашел он широкое применение и в экономике, где получил название «метода скользящего плана». Однако гораздо раньше ирригаторов он применялся навигаторами парусных судов, в распоряжении которых были только компас для определения стран света, секстант для определения своей широты и хронометр для определения долготы. Предположим, корабль покидает Гибралтар, с тем чтобы пересечь океан и достигнуть какого-либо порта в Америке, например Гаваны. Капитан (или штурман), зная вероятностный характер ветров и течений, прокладывает курс — по нашей терминологии, он рассчитывает программную траекторию — и следует ему.
Но течения и ветры оказались несколько отличными от расчетных, и корабль сносит в сторону от намеченного курса. Утром штурман снова определяет положение своего корабля и, учитывая новую информацию о ветрах и течениях, прокладывает новый курс (строит новую программу), а не возвращается на старый маршрут.
По существу, это та же схема «метода скользящего плана», но здесь есть одна особенность, на которую хотелось бы обратить внимание. В такой системе управления имеется еще один важный элемент — рулевой.
Помимо течений и ветра, на корабль действуют волны, также сбивая корабль с курса. Рулевой, которому задан курс, все время «организует» обратную связь, удерживая корабль на заданном курсе (в последние десятилетия на судах устанавливается авторулевой — аналог самолетного автопилота, — выполняющий функцию рулевого).
Изложенный способ управления можно было бы назвать методом последовательных целей — (или методом последовательного прицеливания). В самом деле, штурман каждое утро определяет свое местоположение и, прокладывая курс, нацеливает корабль на порт прибытия. А в промежутке это делает рулевой (авторулевой), выдерживая направление.
И еще одно замечание. Изложенный вариант Программного метода управления кораблем использует две петли обратной связи. «Верхняя» реализуется изменением программ, программной траектории, в которой компенсируются медленно изменяющиеся «длительные» помехи. Выбор новой цели, новой программы производится штурманом. «Нижняя» петля обратной связи компенсирует постоянно возникающие «мелкие», или короткопериодические, помехи; за это дело ответствен рулевой (авторулевой).
Обычно чем сложнее система, тем большее количество петель обратной связи необходимо для ее стабилизации, для обеспечения необходимого уровня ее эффективности.
Мы рассказали о Программном методе управления системами, и хотелось бы, чтобы у читателя возникло ощущение того, что техника сегодня уже располагает целым арсеналом идей и средств, обеспечивающих управление в условиях, когда внешняя обстановка не может нами полностью контролироваться. Программный метод — это очень рациональный и гибкий способ управления системами в условиях, когда им приходится «работать» при неизвестной и изменяющейся внешней обстановке. И идеи адаптации, идеи этого метода являются сегодня стержнем ТТУ.
Пока мы говорили только об управлении такими объектами, для которых цель ставится извне и точно формулируется. Но, оказывается, существуют системы, где цели возникают внутри самой системы и где возможности назначать цель заложены в организации обратной связи. Это системы общественной природы, о которых мы будем говорить позже.