Проект Российского Фонда Фундаментальных Исследований «Высокоэффективные параллельные методы глобальной оптимизации для задач суперкомпьютерного моделирования».
При выполнении проекта «Высокоэффективные параллельные методы глобальной оптимизации для задач суперкомпьютерного моделирования» в 2019 году был разработан новый алгоритм глобального поиска. Отличительной особенностью разработанного алгоритма является использование численных оценок значений производных, построенных на основе накопленной поисковой информации; дополнительных испытаний для вычисления производных не требуется. Использование в алгоритме оценок значений производных позволяет значительно повысить эффективность его работы. На основе разработанных алгоритмов подготовлены пилотные варианты программ, а также проведены вычислительные эксперименты. Результаты выполненных экспериментов подтверждают, что разработанный подход является перспективным. Для разработанного алгоритма проведено теоретическое обоснование. Результаты исследований опубликованы в статье [Gergel, V., Goryachih, A. Multidimensional global optimization using numerical estimates of objective function derivatives // Optimization Methods and Software. doi: 10.1080/10556788.2019.1630624].
В 2019 году в рамках проекта был разработан новый адаптивный метод глобального поиска с использованием численных оценок значений производных (AGMND) [1]. При разработке метода использовался информационно-статистический подход к глобальному поиску, предложенный Стронгиным Р.Г. [8]. На основе базового алгоритма глобального поиска с использованием значений производных минимизируемой функции (алгоритм представлен в [2, 3]), был разработан метод, в котором значения производных оцениваются численно путем обработки доступной поисковой информации.
Для разработанного алгоритма было проведено теоретическое обоснование сходимости. Сформулированы и доказаны теоремы, гарантирующие сходимость последовательности точек испытаний, порождаемой новым алгоритмом, к точке глобального минимума.
Для разработанного метода была выполнена пилотная программная реализация. С использованием разработанного программного обеспечения было выполнено сравнение метода AGMND с известными алгоритмами аналогичного назначения. В экспериментах сравнивались известные методы: метод Гальперина (GM) [6], метод Пиявского (PM) [7], алгоритм Стронгина (GSA)[8], алгоритм Брента (BA) [9] и разработанный метод AGMND. Эффективность разработанных методов оценивалась путем решения набора из 20 одномерных тестовых задач глобальной оптимизации. Отметим, что среди выбранного множества алгоритмов, алгоритм Брента использует оценку вторых производных в качестве параметра. В серии экспериментов в алгоритме Брента была использована точная верхняя оценка.
Среднее количество проведенных испытаний, выполненное каждым из методов:
Результаты выполненных экспериментов подтверждают, что разработанный подход является перспективным.
Международная конференция, «Numerical Computations: Theory And Algorithms 2019 (NUMTA2019)», Изола Капо Риццуто, Кротоне, Италия, 15-21 июня 2019г.
Международная конференция, «Суперкомпьютерные дни в России», Москва, 23-24 сентября 2019 г.
На основе проведенного анализа выбрана рекурсивная (многошаговая) схема редукции размерности, позволяющая перейти от решения многомерной задачи оптимизации к семейству рекурсивно связанных одномерных задач. В выбранной схеме редукции размерности для каждой из полученных одномерных задач могут применяться эффективные одномерные алгоритмы глобального поиска [2]. Следует отметить, что одномерные функции на верхнем уровне рекурсии, возникающие при использовании многошаговой схемы, могут не обладать свойством гладкости, т.е. иметь разрывы производной типа конечного скачка. Для преодоления указанной проблемы был разработан подход, в котором обеспечивается обнаружение имеющихся разрывов оптимизируемой функции (точки разрывов априори не известны) и предложен алгоритм глобального поиска для решения подобных задач оптимизации [3-5].
Разработка алгоритмов выполнялась в два этапа.
На первом этапе для оценки эффективности разработанных одномерных методов были выполнены вычислительные эксперименты для сравнения предложенных алгоритмов с другими широко известными методами многоэкстремальной оптимизации. Результаты экспериментов показали, что использование в ходе вычислений значений производных позволяет сократить число итерации более чем в 10 раз. Алгоритм с численной оценкой значений производных (AGMND) оказался наиболее эффективным. Результаты вычислительных экспериментов также показали, что процедура выявления точек разрыва производной оптимизируемой функции является избыточной и алгоритм AGMND, в котором данная процедура отсутствует, является устойчивым к наличию разрывов производной.
На втором этапе была разработана общая вычислительная схема, которая позволяет применять алгоритмы одномерной оптимизации для решения многомерных задач глобального поиска. Для оценки применимости одномерных алгоритмов в рамках такого подхода были выполнены вычислительные эксперименты, в каждом из которых проводилось решение серии двумерных задач глобальной оптимизации. При выполнении вычислительных алгоритмов рассматривались несколько различных вариантов сочетания одномерных алгоритмов на разных уровнях рекурсивной схемы редукции размерности. Из результатов выполненных вычислительных экспериментов следует, что использование метода AGMND на каждом уровне рекурсии позволяет достичь наилучшей производительности (наименьшего количества поисковых испытаний) [2].
За основу были взяты теоретические условия сходимости алгоритма с использованием «точных» производных, процедуры вычисления значений которых заданы априори. Сформулированы условия сходимости новых разработанных алгоритмов, в которых значения производных вычисляются численно с использованием поисковой информации, получаемой в процессе глобального поиска.
На основе предложенных алгоритмов многомерного глобального поиска разработаны пилотные варианты программных реализаций, которые использовались для проведения вычислительных экспериментов.
С использованием разработанных программных реализаций проведен ряд вычислительных экспериментов. Результаты экспериментов показали преимущество алгоритма глобального поиска с численной оценкой значений производных как в случае решения одномерных задач, так и в случае многомерных задач.
По результатам исследований в 2020 г. опубликована статья в рецензируемом научном журнале [1] и еще одна работа принята к опубликованию [2]. Результаты выполнения проекта в 2020 г. были представлены на научных конференциях [3-5].
В соответствии с поставленными задачами при выполнении проекта были получены следующие результаты.
1. Новые методы использования численных оценок значений производных для решения вычислительно-трудоемких задач глобальной оптимизации
В результате выполнения проекта разработан новый адаптивный метод глобального поиска с использованием численных оценок значений производных (AGMND) [1]. При разработке метода использовался информационно-статистический подход к глобальному поиску [6]. На основе базового алгоритма глобального поиска с использованием значений производных минимизируемой функции (алгоритм представлен в [2, 3]), был разработан метод, в котором значения производных оцениваются численно путем обработки доступной поисковой информации.
2. Развитие математического аппарата исследования предлагаемых алгоритмов в рамках единой информационно-статистической теории глобальной оптимизации
Разработка новых алгоритмов (AGMND и его модификаций) сопровождалась их теоретическим обоснованием. Для всех алгоритмов были сформулированы и доказаны теоремы, гарантирующие сходимость последовательности точек испытаний, порождаемой новым алгоритмом, к точке глобального минимума. Формулировки теорем и доказательства опубликованы в [1].
3. Разработка многомерных вариантов предлагаемых методов с использованием различных схем редукции размерности
Вычислительная сложность решения задач глобальной оптимизации экспоненциально возрастает при увеличении размерности – подобная проблема возрастания вычислительной сложности получила наименование «проклятие размерности». При реализации различных вычислительных схем глобальной оптимизации необходимым является накопление и анализ многомерной поисковой информации.
Уменьшить сложность анализа поисковой информации можно за счет редукции решаемых задач оптимизации с использованием кривых или разверток Пеано, однозначно и непрерывно отображающих отрезок [0,1] на N-мерный гиперкуб. В результате такой редукции многомерная задача глобальной оптимизации сводится к одномерной задаче. Данный подход в случае алгоритма с использованием производных имеет ограниченное применение, так как редуцированная одномерная функция удовлетворяет условию Гельдера и не является гладкой.
Еще одним способом снижения сложности анализа поисковой информации является использование рекурсивной (или многошаговой) схемы редукции размерности. Суть подхода заключается в переходе от решения многомерной задачи оптимизации к семейству рекурсивно связанных одномерных задач. Для каждой из полученных одномерных задач можно напрямую применять эффективные алгоритмы глобального поиска [9].
На основе проведенного анализа возможных схем редукции размерности в ходе исследований выбран второй подход, так как при реализации алгоритмов можно задействовать результаты, полученные при выполнении первого этапа исследований. Вместе с тем стоит отметить, что одномерные функции на верхнем уровне рекурсии, возникающие при использовании многошаговой схемы, могут также не обладать свойством гладкости, т.е. иметь разрывы производной типа конечного скачка. Для преодоления указанной проблемы в рамках исследований реализован подход к учету возникающих разрывов [11-12].
Для решения многомерных задач в ходе выполнения проекта реализовано несколько подходов, основанных на использовании рекурсивной (вложенной) схемы редукции размерности. Реализации отличались алгоритмами, применяемыми для решения одномерных задач оптимизации на разных уровнях рекурсии. Реализованные методы апробировались при решении представительных выборок модельных задач.
4. Анализ возможных схем параллельных вычислений для алгоритмов многомерной оптимизации с использованием численных значений производных
Рассмотрены возможные схемы распараллеливания разработанного алгоритма глобального поиска. На основе проведенного исследования предложен параллельный алгоритм решения вычислительно трудоемких многомерных задач глобальной оптимизации, сочетающий использование схемы вложенной редукции размерности и численных оценок производных целевой функции. Результаты численных экспериментов демонстрируют значительное сокращение времени решения задач в параллельном варианте алгоритма [15].
В качестве задела для реализации будущих проектов рассмотрена возможность использования набора инструментов Intel OneApi для реализации алгоритмов глобального поиска. Intel OneApi позволяет разрабатывать единый код для разных вычислительных устройств. Результаты исследований представлены на международной конференции [14].
5. Разработка пилотных вариантов программ, реализующих алгоритмы с численными оценками производных для многомерных задач глобальной оптимизации
Все предложенные алгоритмы решения задач глобальной оптимизации с использованием численных оценок значений производных вошли в состав пилотного варианта программной системы, ориентированного на решение сложных задач оптимального выбора. Указанные задачи возникают, например, при идентификации параметров математических моделей, описывающих сложных явления и процессы. Анализ подобных моделей является трудоемкой операцией и может быть выполнен только с использованием современных суперкомпьютерных систем.
Апробация разработанных программ была проведена при решении серий тестовых задач глобальной оптимизации, а также – вычислительно-трудоемких прикладных задач оптимального выбора на суперкомпьютерных системах [4,13].
6. Проведение практической апробации предложенных алгоритмов при решении вычислительно-трудоемких прикладных задач оптимального выбора на суперкомпьютерных системах
Разработанные методы были апробированы при решении вычислительно-трудоемких прикладных задач оптимального выбора.
В качестве примера одной из прикладных задач рассматривается задача поиска -динамического регулятора для обратного маятника с подвижным основанием. Известно [7], что решение данной задачи сводится к разрешимости системы матричных неравенств, часть из которых являются невыпуклыми. В качестве численного примера построен регулятор первого порядка для перевернутого маятника на тележке [4]. Найдены параметры регулятора и соответствующее им минимальное значение уровня гашения возмущений. Время решения данной задачи составило 125 сек (CPU Intel Core i7, 3.6 GHz).
Еще одним примером являлась задача выбора параметров модели турбулентного течения; исследуемая модель формировалась при участии сотрудников ИСП РАН [13]. В исследовании рассматривались математические модели таких опасных природных явлений, как сход оползней, селей и лавин. Проблема прогноза данных явлений является актуальной задачей, т.к. моделирование позволяет прогнозировать разрушения, правильно располагать защитные сооружения и жизненно важные объекты. В модель склоновых потоков, как правило, входят несколько параметров (коэффициенты модели турбулентности), значения которых нельзя указать заранее, но можно выбрать, исходя из соответствия расчета по модели и имеющихся экспериментальных данных. Подобная задача является задачей глобальной оптимизации.
Процесс выбора оптимального набора параметров модели склоновых потоков соответствует задаче глобальной оптимизации с целевой функцией вида «черный ящик». В качестве целевой функции в задаче глобальной оптимизации рассматривалась функция потерь, представляющая собой среднеквадратическую ошибку рассчитанного профиля скорости потока по отношению к экспериментальному профилю на выходной плоскости. Для ускорения процедуры оптимизации использовалась аппроксимация целевой функции при помощи нейросетевой регрессии (NNR). На первом этапе поиска алгоритм работал с целевой функцией напрямую (этап накопления информации). Затем на основе поисковой информации строилась аппроксимация целевой функции, которая использовалось на втором этапе поиска.
Моделирование проводилось на суперкомпьютере ННГУ им. Н.И. Лобачевского (операционная система Linux CentOS 7.2). Каждый узел кластера включает в себя два процессора Intel Sandy Bridge E5-2660 2.2 ГГц, 64 ГБ ОЗУ; центральный процессор имеет 8 ядер. Для вычисления значения целевой функции использовалось программное обеспечение CFD с открытым исходным кодом OpenFOAM v2012. Одно вычисление оптимизируемой функции при заданных значениях параметров занимало в среднем 15 минут с использованием 8 MPI-процессов на узел. Общее время расчетов составило более 20 часов на суперкомпьютере ННГУ им. Н.И. Лобачевского. Результаты проведенных экспериментов позволили найти оптимальные значения шести параметров модели турбулентности, что обеспечило хорошее соответствие модели экспериментальным данным.
Результаты, полученные при выполнении проекта, отражены в 10 публикациях, 3 из которых – в рецензируемых изданиях, индексируемых WebOfScience/Scopus (в том числе статья в журнале Optimization Methods and Software, Q1), 7 публикаций индексируются РИНЦ.
Литература