Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...
Топ:
Когда производится ограждение поезда, остановившегося на перегоне: Во всех случаях немедленно должно быть ограждено место препятствия для движения поездов на смежном пути двухпутного...
Установка замедленного коксования: Чем выше температура и ниже давление, тем место разрыва углеродной цепи всё больше смещается к её концу и значительно возрастает...
Выпускная квалификационная работа: Основная часть ВКР, как правило, состоит из двух-трех глав, каждая из которых, в свою очередь...
Интересное:
Искусственное повышение поверхности территории: Варианты искусственного повышения поверхности территории необходимо выбирать на основе анализа следующих характеристик защищаемой территории...
Что нужно делать при лейкемии: Прежде всего, необходимо выяснить, не страдаете ли вы каким-либо душевным недугом...
Инженерная защита территорий, зданий и сооружений от опасных геологических процессов: Изучение оползневых явлений, оценка устойчивости склонов и проектирование противооползневых сооружений — актуальнейшие задачи, стоящие перед отечественными...
Дисциплины:
|
из
5.00
|
Заказать работу |
Содержание книги
Поиск на нашем сайте
|
|
|
|
Условия оптимальности, которые дают метод динамического программирования, могут быть положены в основу создания приближенных методов решения задач определения оптимального управления.
Метод последовательных приближений.
Пусть требуется найти оптимальную программу управления системой
,
,
,
,
.
В соответствии с методом динамического программирования оптимальное управление должно удовлетворять уравнению Беллмана

при условии
. Уравнение Беллмана можно представить в следующей форме:
,
.
Так как при оптимальном управлении функция
обращается в нуль, то полная производная функции будущих потерь, вычисленная вдоль оптимальной траектории, равна
,
.
Допустим, что на итерации
имеем
- некоторое допустимое управление и
- соответствующую ему траекторию. Тогда можно вычислить функцию
:
,
так как
при
.
Теперь построим функцию
.
Минимизируя эту функцию, найдем новое
приближение для управления
. Можно показать, что если указанное построение оказывается возможным, то последовательность управлений
является минимизирующей, т.е.
.
Аппроксимация функции будущих потерь. Метод параметров.
Основное рекуррентное соотношение дает формальный алгоритм численного решения. Однако аналитическое выражение для функции будущих потерь получить в общем виде не удается. Задачу можно решить приближенно, если функцию будущих потерь на каждом шаге аппроксимировать некоторой зависимостью вида
,
где
- некоторые заданные функции,
- параметры, которые определяются типом аппроксимации. Например,
можно определить из условия обращения в минимум следующей квадратичной ошибки:
.
Здесь под
понимаются некоторые характерные точки из допустимого множества векторов
, через
обозначены значения функции будущих потерь, вычисленные для точек
согласно основному рекуррентному соотношению. Дифференцируя последнее выражение по
и приравнивая производные к нулю, получаем
или
,
где
,
.
Искомый вектор параметров, обеспечивающий наилучшее приближение функции будущих потерь в смысле квадратичной ошибки
, определяется следующим образом:
.
При выборе структуры функций
необходимо учитывать ограничение, в силу которого должно иметь место условие
.
Приближенное решение уравнения Беллмана.
Метод параметров легко распространяется и на непрерывный случай, т.е. он может быть применен для приближенного решения уравнения Беллмана:
,
.
Представим
в виде
,
где
- заданные функции,
- функции времени, определяемые из условия
,
где
- множество допустимых векторов
.
Отсюда получаем
,
,
.
Продифференцировав по времени, получим
.
Производную
можно приближенно определить из уравнения Беллмана, тогда
.
Граничное условие для
получается из условия
.
|
|
|
Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...
Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...
Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...
© cyberpediasu.com 2017-2026 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!