Текущий выпуск Номер 5, 2024 Том 16

Все выпуски

Результаты поиска по 'accelerated methods':
Найдено статей: 34
  1. Тарасов А.Э., Сердобинцев Е.В.
    Моделирование движения рельсового экипажа в кривой в Simpack Rail
    Компьютерные исследования и моделирование, 2019, т. 11, № 2, с. 249-263

    В статье рассматривается определение одного из показателей динамических качеств (ПДК) железнодорожного подвижного состава — поперечного ускорения кузова — с использованием системы компьютерного моделирования динамики рельсовых экипажей Simpack Rail на комплексном уровне с переменной скоростью движения в графиковом режиме. Для этой цели использована ранее верифицированная с помощью средств кафедры «Электропоезда и локомотивы» РУТ (МИИТ) модель секции типового грузового электровоза колеи 1520 мм. По этой причине вопросы, связанные с построением и проверкой модели электровоза в препроцессоре, в данной статье опускаются. Подробно описано моделирование железнодорожного пути на основе картографических эксплуатационных данных — плана, профиля и возвышения наружного рельса. Приводятся статистические параметры (моменты) выбранной геометрической неровности (источника возмущения) по каждой рельсовой нити, а также параметры плана и профиля выбранного для моделирования участка пути в виде графиков считанных файлов данных. Измерение непогашенного поперечного ускорения кузова производится с учетом горизонтальной составляющей от действия силы тяжести, что воспроизводит принцип работы реальных датчиков измерения ускорения со свободно расположенной массой. В заключение производится сравнение искомого ПДК, определенного по методу среднего значения абсолютного максимума из смоделированного нестационарного процесса со значением, полученным из экспериментальных данных. По результатам сравнения можно сделать вывод о том, что на данный показатель качества с внешней стороны прежде всего влияют скорость и геометрические характеристики рельсового пути, которые в данном случае были смоделированы в строгом соответствии с картографическими данными реального железнодорожного участка, где проводились испытания. Допущенные условности в модели транспортного средства — секции грузового электровоза (сосредоточение инерционно-массовых характеристик тел в центре их тяжести, малость перемещений между телами) — при соблюдении постоянства основных геометрических и упруго-диссипативных характеристик связей тел позволяют в Simpack Rail смоделировать поведение (отклики) системы с необходимой достоверностью.

    Tarasov A.E., Serdobintsev E.V.
    Simulation of rail vehicles ride in Simpack Rail on the curved track
    Computer Research and Modeling, 2019, v. 11, no. 2, pp. 249-263

    The paper studies the determination for one of the dynamic quality parameter (PDK) of railway vehicles — car body lateral acceleration — by using of computer simulation system for railway vehicles dynamic Simpack Rail. This provide the complex simulation environment with variable velocity depending on the train schedule. The rail vehicle model of typical 1520 mm gauge fright locomotive section used for simulation has been verified by means of the chair “Electric multiple unit cars and locomotives” in the Russian University of Transport (RUT (MIIT)). Due to this homologation the questions of model creating and verification in preprocessor are excluded in this paper. The paper gives the detail description of cartographic track modeling in situation plane, heights plane and superelevation plane based on the real operating data. The statistic parameters (moments) for the rail related track excitation and used cartographic track data of the specified track section in this simulation are given as a numeric and graphical results of reading the prepared data files. The measurement of the car body residual lateral acceleration occur under consideration of the earth gravity acceleration part like the accelerometer measurement in the real world. Finally the desired quality parameter determined by simulation is compared with the same one given by a test drive. The calculation method in both cases is based on the middle value of the absolute maximums picked up within the nonstationary realizations of this parameter. Compared results confirm that this quality factor all the first depends on the velocity and track geometry properties. The simulation of the track in this application uses the strong conformity original track data of the test ride track section. The accepted simplification in the rail vehicle model of fright electric locomotive section (body properties related to the center of gravity, small displacements between the bodies) by keeping the geometric and force law characteristics of the force elements and constraints constant allow in Simpack Rail the simulation with necessary validity of system behavior (reactions).

    Просмотров за год: 20.
  2. Долгов Е.В., Колосов Н.С., Фирсов А.А.
    Исследование влияния искрового разряда на смешение струи газообразного топлива со сверхзвуковым воздушным потоком
    Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 849-860

    В работе представлены результаты численного моделирования влияния протяженного искрового разряда на динамику перемешивания инжектируемой газовой струи со сверхзвуковым воздушным потоком. Расчеты проводились в программном комплексе FlowVision. Подача топлива осуществляется при помощи инжектора, расположенного на стенке канала, а разряд организован вблизи стенки ниже по потоку относительно инжектора. Моделирование электрического искрового разряда выполнено при помощи объемного источника тепла. С целью описания принципиального вида плазменного актуатора для ускорения перемешивания в сверхзвуковом потоке (число Маха М = 2) в ходе исследования выполнено варьирование энерговклада в разряд в диапазоне 100–500 мДж на один импульс, а также определено влияние формы и местоположения разряда относительно топливного инжектора. Проведено исследование режимов инжекции топлива в сверхзвуковой воздушный поток и найден оптимальный режим истечения струи газа для исследования влияния искрового разряда на смешение. Разработан метод анализа картины возмущений границы раздела «топливо–окислитель», вызванных работой импульсного искрового разряда. Подготовлена программа в среде LabView для получения количественной характеристики для дальнейшего сравнения полученных результатов с экспериментальными данными.

    Результаты моделирования позволяют сделать вывод, что протяженный искровой разряд, расположенный ниже по потоку относительно инжектора и расположенный вдоль потока, обеспечивает максимальное увеличение границы раздела между струей топлива и основным потоком. Типичная частота повторения импульсов разряда в импульсно-периодическом режиме должна составлять более 6 кГц при длине разряда ~10 мм, чтобы обеспечить постоянное влияние на смешение в потоке со скоростью 500 м/с.

    Dolgov E.V., Kolosov N.S., Firsov A.A.
    The study of the discharge influence on mixing of gaseous fuel jet with the supersonic air flow
    Computer Research and Modeling, 2019, v. 11, no. 5, pp. 849-860

    The paper presents the results of numerical simulation of the effect of a long spark discharge on the mixing dynamics of an injected gas jet with supersonic air flow. The calculations were performed using the CFD software package FlowVision. The fuel was supplied using an injector located on the channel wall, and the discharge was organized near the wall downstream of the injector. Simulation of electrical spark discharge was performed using a volumetric heat source. In order to describe the principal specifications of a plasma actuator to accelerate mixing in a supersonic flow (Mach number M = 2), the research involved varying the energy impact to the discharge in the range of 100–500 mJ per pulse, determining the influence of the shape and location of the discharge. A study of the fuel injection modes in a supersonic air flow has been carried out and an optimal gas jet outflow regime has been found to study the effect of a spark discharge. A method has been developed for analyzing the disturbance pattern of the fuel-oxidant interface caused by the operation of a pulsed spark discharge. A program was prepared in the LabView software environment for obtaining quantitative characteristics for further comparison with the results obtained in the experiment.

    The simulation results allow us to conclude that the long spark discharge located along the flow downstream of the injector provides the maximum increase in the interface between the jet of fuel and the main flow. A typical repetition frequency of discharge pulses in a pulse-periodic mode should be more than 6 kHz with a discharge length of ~10 mm to ensure a continuous effect on the mixing at a flow velocity of 500 m/s.

  3. Гладин Е.Л., Бородич Е.Д.
    Редукция дисперсии для минимаксных задач с небольшой размерностью одной из переменных
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 257-275

    Статья посвящена выпукло-вогнутым седловым задачам, в которых целевая функция является суммой большого числа слагаемых. Такие задачи привлекают значительное внимание математического сообщества в связи с множеством приложений в машинном обучении, включая adversarial learning, adversarial attacks и robust reinforcement learning, и это лишь некоторые из них. Отдельные функции в сумме обычно представляют собой ошибку, связанную с объектом из выборки. Кроме того, формулировка допускает (возможно, негладкий) композитный член. Такие слагаемые часто отражают регуляризацию в задачах машинного обучения. Предполагается, что размерность одной из групп переменных относительно мала (около сотни или меньше), а другой — велика. Такой случай возникает, например, при рассмотрении двойственной формулировки задачи минимизации с умеренным числом ограничений. Предлагаемый подход основан на использовании метода секущей плоскости Вайды для минимизации относительно внешнего блока переменных. Этот алгоритм оптимизации особенно эффективен, когда размерность задачи не очень велика. Неточный оракул для метода Вайды вычисляется через приближенное решение внутренней задачи максимизации, которая решается ускоренным алгоритмом с редукцией дисперсии Katyusha. Таким образом, мы используем структуру задачи для достижения быстрой сходимости. В исследовании получены отдельные оценки сложности для градиентов различных компонент относительно различных переменных. Предложенный подход накладывает слабые предположения о целевой функции. В частности, не требуется ни сильной выпуклости, ни гладкости относительно низкоразмерной группы переменных. Количество шагов предложенного алгоритма, а также арифметическая сложность каждого шага явно зависят от размерности внешней переменной, отсюда предположение, что она относительно мала.

    Gladin E.L., Borodich E.D.
    Variance reduction for minimax problems with a small dimension of one of the variables
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 257-275

    The paper is devoted to convex-concave saddle point problems where the objective is a sum of a large number of functions. Such problems attract considerable attention of the mathematical community due to the variety of applications in machine learning, including adversarial learning, adversarial attacks and robust reinforcement learning, to name a few. The individual functions in the sum usually represent losses related to examples from a data set. Additionally, the formulation admits a possibly nonsmooth composite term. Such terms often reflect regularization in machine learning problems. We assume that the dimension of one of the variable groups is relatively small (about a hundred or less), and the other one is large. This case arises, for example, when one considers the dual formulation for a minimization problem with a moderate number of constraints. The proposed approach is based on using Vaidya’s cutting plane method to minimize with respect to the outer block of variables. This optimization algorithm is especially effective when the dimension of the problem is not very large. An inexact oracle for Vaidya’s method is calculated via an approximate solution of the inner maximization problem, which is solved by the accelerated variance reduced algorithm Katyusha. Thus, we leverage the structure of the problem to achieve fast convergence. Separate complexity bounds for gradients of different components with respect to different variables are obtained in the study. The proposed approach is imposing very mild assumptions about the objective. In particular, neither strong convexity nor smoothness is required with respect to the low-dimensional variable group. The number of steps of the proposed algorithm as well as the arithmetic complexity of each step explicitly depend on the dimensionality of the outer variable, hence the assumption that it is relatively small.

  4. В данной работе представлены результаты экспериментальной проверки некоторых вопросов, касающихся практического использования методов преодоления катастрофической забывчивости нейронных сетей. Проведено сравнение двух таких современных методов: метода эластичного закрепления весов (EWC, Elastic Weight Consolidation) и метода ослабления скоростей весов (WVA, Weight Velocity Attenuation). Разобраныих преимущества и недостатки в сравнении друг с другом. Показано, что метод эластичного закрепления весов (EWC) лучше применять в задачах, где требуется полностью сохранять выученные навыки на всех задачах в очереди обучения, а метод ослабления скоростей весов (WVA) больше подходит для задач последовательного обучения с сильно ограниченными вычислительными ресурсами или же когда требуется не точное сохранение всех навыков, а переиспользование репрезентаций и ускорение обучения от задачи к задаче. Проверено и подтверждено интуитивное предположение, что ослабление метода WVA необходимо применять к оптимизационному шагу, то есть к приращениям весов нейронной сети, а не к самому градиенту функции потерь, и это справедливо для любого градиентного оптимизационного метода, кроме простейшего стохастического градиентного спуска (SGD), для которого оптимизационный шаг и градиент функции потерь пропорциональны. Рассмотрен выбор оптимальной функции ослабления скоростей весов между гиперболической функцией и экспонентой. Показано, что гиперболическое убывание более предпочтительно, так как, несмотря на сравнимое качество при оптимальных значениях гиперпараметра метода WVA, оно более устойчиво к отклонениям гиперпараметра от оптимального значения (данный гиперпараметр в методе WVA обеспечивает баланс между сохранением старых навыков и обучением новой задаче). Приведены эмпирические наблюдения, которые подтверждают гипотезу о том, что оптимальное значение гиперпараметра не зависит от числа задач в очереди последовательного обучения. Следовательно, данный гиперпараметр может подбираться на небольшом числе задач, а использоваться — на более длинных последовательностях.

    Kutalev A.A., Lapina A.A.
    Modern ways to overcome neural networks catastrophic forgetting and empirical investigations on their structural issues
    Computer Research and Modeling, 2023, v. 15, no. 1, pp. 45-56

    This paper presents the results of experimental validation of some structural issues concerning the practical use of methods to overcome catastrophic forgetting of neural networks. A comparison of current effective methods like EWC (Elastic Weight Consolidation) and WVA (Weight Velocity Attenuation) is made and their advantages and disadvantages are considered. It is shown that EWC is better for tasks where full retention of learned skills is required on all the tasks in the training queue, while WVA is more suitable for sequential tasks with very limited computational resources, or when reuse of representations and acceleration of learning from task to task is required rather than exact retention of the skills. The attenuation of the WVA method must be applied to the optimization step, i. e. to the increments of neural network weights, rather than to the loss function gradient itself, and this is true for any gradient optimization method except the simplest stochastic gradient descent (SGD). The choice of the optimal weights attenuation function between the hyperbolic function and the exponent is considered. It is shown that hyperbolic attenuation is preferable because, despite comparable quality at optimal values of the hyperparameter of the WVA method, it is more robust to hyperparameter deviations from the optimal value (this hyperparameter in the WVA method provides a balance between preservation of old skills and learning a new skill). Empirical observations are presented that support the hypothesis that the optimal value of this hyperparameter does not depend on the number of tasks in the sequential learning queue. And, consequently, this hyperparameter can be picked up on a small number of tasks and used on longer sequences.

  5. Ситников С.С., Черемисин Ф.Г.
    Расчет структуры ударной волны в газовой смеси на основе уравнения Больцмана с контролем точности
    Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1107-1123

    В работе проведено исследование структуры ударной волны в бинарной газовой смеси на основе прямого решения кинетического уравнения Больцмана. Для вычисления интеграла столкновений в кинетическом уравнении используется консервативный проекционный метод. Детально описаны применяемые расчетные формулы и методика вычислений. В качестве потенциала взаимодействия молекул используется модель твердых сфер. Численное моделирование проводится с использованием разработанной программно-моделирующей среды, которая позволяет исследовать стационарные и нестационарные течения газовых смесей в различных режимах и для произвольной геометрии задачи. Моделирование выполняется на системе кластерной архитектуры. За счет использования технологий распараллеливания кода достигается значительное ускорение вычислений. С фиксированной точностью, контролируемой параметрами моделирования, получены распределения макроскопических величин компонентов смеси по фронту ударной волны. Расчеты выполнены для различных соотношений молекулярных масс и чисел Маха. Достигнута общая точность моделирования не менее 1% по локальным значениям концентрации и температуры и 3% по ширине фронта ударной волны. Проведено сравнение полученных результатов с существующими расчетными данными. Представленные в данной работе результаты имеют теоретическое значение, а также могут служить в качестве тестового расчета, поскольку они получены с использованием точного уравнения Больцмана.

    Sitnikov S.S., Tcheremissine F.G.
    Computation of a shock wave structure in a gas mixture based on the Boltzmann equation with accuracy control
    Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1107-1123

    In this paper, the structure of a shock wave in a binary gas mixture is studied on the basis of direct solution of the Boltzmann kinetic equation. The conservative projection method is used to evaluate the collision integral in the kinetic equation. The applied evaluation formulas and numerical methods are described in detail. The model of hard spheres is used as an interaction potential of molecules. Numerical simulation is performed using the developed simulation environment software, which makes it possible to study both steady and non-steady flows of gas mixtures in various flow regimes and for an arbitrary geometry of the problem. Modeling is performed on a cluster architecture. Due to the use of code parallelization technologies, a significant acceleration of computations is achieved. With a fixed accuracy controlled by the simulation parameters, the distributions of macroscopic characteristics of the mixture components through the shock wave front were obtained. Computations were conducted for various ratios of molecular masses and Mach numbers. The total accuracy of at least 1% for the local values of molecular density and temperature and 3% for the shock front width was achieved. The obtained results were compared with existing computation data. The results presented in this paper are of theoretical significance, and can serve as a test computation, since they are obtained using the exact Boltzmann equation.

  6. Копысов С.П., Кузьмин И.М., Недожогин Н.С., Новиков А.К., Рычков В.Н., Сагдеева Ю.А., Тонков Л.Е.
    Параллельная реализация конечно-элементных алгоритмов на графических ускорителях в программном комплексе FEStudio
    Компьютерные исследования и моделирование, 2014, т. 6, № 1, с. 79-97

    Рассматриваются новые подходы и алгоритмы распараллеливания вычислений метода конечных элементов, реализованные в программном комплексе FEStudio. Представлена программная модель комплекса, позволяющая расширять возможности распараллеливания на различных уровнях вычислений. Разработаны параллельные алгоритмы численного интегрирования динамических задач и локальных матриц жесткости, формирования и решения систем уравнений с использованием модели параллелизма данных CUDA.

    Kopysov S.P., Kuzmin I.M., Nedozhogin N.S., Novikov A.K., Rychkov V.N., Sagdeeva Y.A., Tonkov L.E.
    Parallel implementation of a finite-element algorithms on a graphics accelerator in the software package FEStudio
    Computer Research and Modeling, 2014, v. 6, no. 1, pp. 79-97

    In this paper, we present new parallel algorithms for finite element analysis implemented in the FEStudio software framework. We describe the programming model of finite element method, which supports parallelism on different stages of numerical simulations. Using this model, we develop parallel algorithms of numerical integration for dynamic problems and local stiffness matrices. For constructing and solving the systems of equations, we use the CUDA programming platform.

    Просмотров за год: 4. Цитирований: 24 (РИНЦ).
  7. Малков С.Ю.
    Моделирование закономерностей мировой динамики
    Компьютерные исследования и моделирование, 2017, т. 9, № 3, с. 419-432

    В статье проведен анализ исторического процесса с использованием методов синергетики (науки о нелинейных развивающихся системах в природе и обществе), развитых в работах Д. С. Чернавского применительно к экономическим и социальным системам. Показано, что социальная самоорганизация в зависимости от условий приводит к формированию как обществ с сильной внутренней конкуренцией (Y-структуры), так и обществ кооперативного типа (Х-структуры). Y-структуры характерны для стран Запада, Х-структуры характерны для стран Востока. Показано, что в XIX и XX веках имело место ускоренное формирование и усиление Y-структур. Однако в настоящее время мировая система вошла в период серьезных структурных перемен в экономической, политической, идеологической сферах: доминирование Y-структур заканчивается. Рассмотрены возможные пути дальнейшего развития мировой системы, связанные с изменением режимов самоорганизации и ограничением внутренней конкуренции. Этот переход будет длительным и сложным. В этих условиях объективно будет возрастать ценность цивилизационного опыта России, на основе которого в ней была сформирована социальная система комбинированного типа. Показано, что в конечном итоге неизбежен переход от нынешнего доминирования Y-структур к абсолютно новой глобальной системе, устойчивость которой будет основана на новой идеологии, новой духовности (то есть новой «условной информации», по Д. С. Чернавскому), делающей разворот от принципов конкуренции к принципам сотрудничества.

    Malkov S.Yu.
    World dynamics patterns modeling
    Computer Research and Modeling, 2017, v. 9, no. 3, pp. 419-432

    In the article is carried out the analysis of historical process with the use of methods of synergetics (science about the nonlinear developing systems in nature and the society), developed in the works of D. S. Chernavskii in connection with to economic and social systems. It is shown that social self-organizing depending on conditions leads to the formation of both the societies with the strong internal competition (Y-structures) and cooperative type societies (X-structures). Y-structures are characteristic for the countries of the West, X-structure are characteristic for the countries of the East. It is shown that in XIX and in XX centuries occurred accelerated shaping and strengthening of Y-structures. However, at present world system entered into the period of serious structural changes in the economic, political, ideological spheres: the domination of Y-structures concludes. Are examined the possible ways of further development of the world system, connected with change in the regimes of self-organizing and limitation of internal competition. This passage will be prolonged and complex. Under these conditions it will objectively grow the value of the civilizational experience of Russia, on basis of which was formed combined type social system. It is shown that ultimately inevitable the passage from the present do-mination of Y-structures to the absolutely new global system, whose stability will be based on the new ideology, the new spirituality (i.e., new “conditional information” according D. S. Chernavskii), which makes a turn from the principles of competition to the principles of collaboration.

    Просмотров за год: 17.
  8. Представлена физико-математическая постановка сопряженной геометрической и газодинамической задачи моделирования внутрикамерных процессов и расчета основных внутрибаллистических характеристик ракетных двигателей на твердом топливе в осесимметричном приближении. Изложены основополагающие методики и численный алгоритм решения задачи. Отслеживание горящей поверхности топлива осуществлено неявным образом с помощью метода уровней на декартовой структурированной вычислительной сетке. Для расчета параметров течения использованы двумерные уравнения газовой динамики. Ввиду несогласованности границ области с узлами вычислительной сетки, в численных расчетах учтено наличие фиктивных точек, лежащих вне рассматриваемой области, но рядом с границей. Для задания значений параметров течения в фиктивных точках применена обратная процедура Лакса – Вендроффа, заключающаяся в построении экстраполяционного полинома, который учитывает как текущее распределение параметров, так и условия на границе. Численное решение полученной системы уравнений основано на использовании WENO-схем пятого и третьего порядка для дискретной аппроксимации по пространственной координате уравнений метода уровней и газовой динамики соответственно и применении методов Рунге – Кутты, обладающих свойством уменьшения полной вариации, для решения полученных полудискретных уравнений. Изложенный численный алгоритм распараллелен с использованием технологии CUDA и в дальнейшем оптимизирован с учетом особенностей архитектуры графических процессоров.

    Программный комплекс использован при расчетах внутрибаллистических характеристик бессоплового двигателя на твердом топливе в течение основного времени работы. На основе полученных численных результатов обсуждается эффективность распараллеливания с использованием технологии CUDA и применения рассмотренных оптимизаций. Показано, что применяемая методика распараллеливания приводит к значительному ускорению по сравнению с использованием центральных процессоров. Представлены распределения основных параметров течения продуктов сгорания в различные промежутки времени. Произведено сравнение полученных результатов квазиодномерного подхода и разработанной численной методики.

    Kiryushkin A.E., Minkov L.L.
    Parallel implementation of numerical algorithm of solving coupled internal ballistics modelling problem for solid rocket motors
    Computer Research and Modeling, 2021, v. 13, no. 1, pp. 47-65

    We present a physico-mathematical statement of coupled geometrical and gas dynamics problem of intrachamber processes simulation and calculation of main internal ballistics characteristics of solid rocket motors in axisymmetric approximation. Method and numerical algorithm of solving the problem are described in this paper. We track the propellant burning surface using the level set method. This method allows us to implicitly represent the surface on a fixed Cartesian grid as zero-level of some function. Two-dimensional gas-dynamics equations describe a flow of combustion products in a solid rocket motor. Due to inconsistency of domain boundaries and nodes of computational grid, presence of ghost points lying outside the computational domain is taken into account. For setting the values of flow parameters in ghost points, we use the inverse Lax – Wendroff procedure. We discretize spatial derivatives of level set and gas-dynamics equations with standard WENO schemes of fifth and third-order respectively and time derivatives using total variation diminishing Runge –Kutta methods. We parallelize the presented numerical algorithm using CUDA technology and further optimize it with regard to peculiarities of graphics processors architecture.

    Created software package is used for calculating internal ballistics characteristics of nozzleless solid rocket motor during main firing phase. On the base of obtained numerical results, we discuss efficiency of parallelization using CUDA technology and applying considered optimizations. It has been shown that implemented parallelization technique leads to a significant acceleration in comparison with central processes. Distributions of key parameters of combustion products flow in different periods of time have been presented in this paper. We make a comparison of obtained results between quasione-dimensional approach and developed numerical technique.

  9. Данилова М.Ю., Малиновский Г.С.
    Метод тяжелого шарика с усреднением
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 277-308

    Методы оптимизации первого порядка являются важным рабочим инструментов для широкого спектра современных приложений в разных областях, среди которых можно выделить экономику, физику, биологию, машинное обучение и управление. Среди методов первого порядка особого внимания заслуживают ускоренные (моментные) методы в силу их практической эффективности. Метод тяжелого шарика (heavy-ball method — HB) — один из первых ускоренных методов. Данный метод был разработан в 1964 г., и для него был проведен анализ сходимости для квадратичных сильно выпуклых функций. С тех пор были предложены и проанализированы разные варианты HB. В частности, HB известен своей простотой реализации и эффективностью при решении невыпуклых задач. Однако, как и другие моментные методы, он имеет немонотонное поведение; более того, при сходимости HB с оптимальными параметрами наблюдается нежелательное явление, называемое пик-эффектом. Чтобы решить эту проблему, в этой статье мы рассматриваем усредненную версию метода тяжелого шарика (averaged heavy-ball method — AHB). Мы показываем, что для квадратичных задач AHB имеет меньшее максимальное отклонение от решения, чем HB. Кроме того, для общих выпуклых и сильно выпуклых функций доказаны неускоренные скорости глобальной сходимости AHB, его версии WAHB cо взвешенным усреднением, а также для AHB с рестартами R-AHB. Насколько нам известно, такие гарантии для HB с усреднением не были явно доказаны для сильно выпуклых задач в существующих работах. Наконец, мы проводим несколько численных экспериментов для минимизации квадратичных и неквадратичных функций, чтобы продемонстрировать преимущества использования усреднения для HB. Кроме того, мы также протестировали еще одну модификацию AHB, называемую методом tail-averaged heavy-ball (TAHB). В экспериментах мы наблюдали, что HB с правильно настроенной схемой усреднения сходится быстрее, чем HB без усреднения, и имеет меньшие осцилляции.

    Danilova M.Y., Malinovskiy G.S.
    Averaged heavy-ball method
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 277-308

    First-order optimization methods are workhorses in a wide range of modern applications in economics, physics, biology, machine learning, control, and other fields. Among other first-order methods accelerated and momentum ones obtain special attention because of their practical efficiency. The heavy-ball method (HB) is one of the first momentum methods. The method was proposed in 1964 and the first analysis was conducted for quadratic strongly convex functions. Since then a number of variations of HB have been proposed and analyzed. In particular, HB is known for its simplicity in implementation and its performance on nonconvex problems. However, as other momentum methods, it has nonmonotone behavior, and for optimal parameters, the method suffers from the so-called peak effect. To address this issue, in this paper, we consider an averaged version of the heavy-ball method (AHB). We show that for quadratic problems AHB has a smaller maximal deviation from the solution than HB. Moreover, for general convex and strongly convex functions, we prove non-accelerated rates of global convergence of AHB, its weighted version WAHB, and for AHB with restarts R-AHB. To the best of our knowledge, such guarantees for HB with averaging were not explicitly proven for strongly convex problems in the existing works. Finally, we conduct several numerical experiments on minimizing quadratic and nonquadratic functions to demonstrate the advantages of using averaging for HB. Moreover, we also tested one more modification of AHB called the tail-averaged heavy-ball method (TAHB). In the experiments, we observed that HB with a properly adjusted averaging scheme converges faster than HB without averaging and has smaller oscillations.

  10. Литвинов В.Н., Чистяков А.Е., Никитина А.В., Атаян А.М., Кузнецова И.Ю.
    Математическое моделирование гидродинамических процессов Азовского моря на многопроцессорной вычислительной системе
    Компьютерные исследования и моделирование, 2024, т. 16, № 3, с. 647-672

    Статья посвящена моделированию гидродинамических процессов мелководных водоемов на примере Азовского моря. В статье приведена математическая модель гидродинамики мелководного водоема, позволяющая вычислить трехмерные поля вектора скорости движения водной среды. Применение регуляризаторов по Б.Н. Четверушкину в уравнении неразрывности привело к изменению способа расчета поля давления, базирующегося на решении волнового уравнения. Построена дискретная конечно-разностная схема для расчета давления в области, линейные размеры которой по вертикали существенно меньше размеров по горизонтальным координатным направлениям, что является характерным для геометрии мелководных водоемов. Описаны метод и алгоритм решения сеточных уравнений с предобуславливателем трехдиагонального вида. Предложенный метод применен для решения сеточных уравнений, возникающих при расчете давления для трехмерной задачи гидродинамики Азовского моря. Показано, что предложенный метод сходится быстрее модифицированного попеременно-треугольного метода. Представлена параллельная реализация предложенного метода решения сеточных уравнений и проведены теоретические и практические оценки ускорения алгоритма с учетом времени латентности вычислительной системы. Приведены результаты вычислительных экспериментов для решения задач гидродинамики Азовского моря с использованием гибридной технологии MPI + OpenMP. Разработанные модели и алгоритмы применялись для реконструкции произошедшей в 2001 году в Азовском море экологической катастрофы и решения задачи движения водной среды в устьевых районах. Численные эксперименты проводились на гибридном вычислительном кластере К-60 ИПМ им. М.В. Келдыша РАН.

    Litvinov V.N., Chistyakov A.E., Nikitina A.V., Atayan A.M., Kuznetsova I.Y.
    Mathematical modeling of hydrodynamics problems of the Azov Sea on a multiprocessor computer system
    Computer Research and Modeling, 2024, v. 16, no. 3, pp. 647-672

    The article is devoted to modeling the shallow water hydrodynamic processes using the example of the Azov Sea. The article presents a mathematical model of the hydrodynamics of a shallow water body, which allows one to calculate three-dimensional fields of the velocity vector of movement of the aquatic environment. Application of regularizers according to B.N.Chetverushkin in the continuity equation led to a change in the method of calculating the pressure field, based on solving the wave equation. A discrete finite-difference scheme has been constructed for calculating pressure in an area whose linear vertical dimensions are significantly smaller than those in horizontal coordinate directions, which is typical for the geometry of shallow water bodies. The method and algorithm for solving grid equations with a tridiagonal preconditioner are described. The proposed method is used to solve grid equations that arise when calculating pressure for the three-dimensional problem of hydrodynamics of the Azov Sea. It is shown that the proposed method converges faster than the modified alternating triangular method. A parallel implementation of the proposed method for solving grid equations is presented and theoretical and practical estimates of the acceleration of the algorithm are carried out taking into account the latency time of the computing system. The results of computational experiments for solving problems of hydrodynamics of the Sea of Azov using the hybrid MPI + OpenMP technology are presented. The developed models and algorithms were used to reconstruct the environmental disaster that occurred in the Sea of Azov in 2001 and to solve the problem of the movement of the aquatic environment in estuary areas. Numerical experiments were carried out on the K-60 hybrid computing cluster of the Keldysh Institute of Applied Mathematics of Russian Academy of Sciences.

Страницы: предыдущая следующая последняя »

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.