Все выпуски
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Моделирование нестационарной структуры потока около спускаемого аппарата в условиях марсианской атмосферы
Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 701-714В статье представлены результаты численного моделирования вихревого пространственного нестационарного движения среды, возникающего около боковой и донной поверхностей десантного модуля при его спуске в атмосфере Марса. Численное исследование проведено для высокоскоростного режима обтекания при различных углах атаки. Математическое моделирование осуществлено на основе модели Навье – Стокса и модели равновесных химических реакций для газового состава марсианской атмосферы. Результаты моделирования показали, что при рассматриваемых условиях движения спускаемого аппарата около его боковой и донной поверхностей реализуется нестационарное течение, имеющее ярко выраженный вихревой характер. Численные расчеты указывают на то, что в зависимости от угла атаки нестационарность и вихревой характер потока могут проявляться как на всей боковой и донной поверхностях аппарата, так и, частично, на их подветренной стороне. Для различных углов атаки приводятся картины вихревой структуры потока около поверхности спускаемого аппарата и в его ближнем следе, а также картины полей температуры и показателя адиабаты. Нестационарный характер обтекания подтверждается представленными временными зависимостями газодинамических параметров потока в различных точках поверхности аппарата. Проведенные параметрические расчеты позволили построить зависимости аэродинамических характеристик спускаемого аппарата от угла атаки. Математическое моделирование осуществляется на основе являющегося методом конечных объемов консервативного численного метода потоков, основанного на конечно-разностной записи законов сохранения аддитивных характеристик среды с использованием upwind-аппроксимаций потоковых переменных. Для моделирования возникающей при обтекании сложной вихревой структуры потока около спускаемого аппарата используются неравномерные вычислительные сетки, включающие до 30 миллионов конечных объемов с экспоненциальным сгущением к поверхности, что позволило выявить мелкомасштабные вихревые образования. Численные исследования проведены на базе разработанного комплекса программ, основанного на параллельных алгоритмах используемого численного метода и реализованного на современных многопроцессорных вычислительных системах. Приведенные в статье результаты численного моделирования получены при использовании до двух тысяч вычислительных ядер многопроцессорного комплекса.
Ключевые слова: математическое моделирование, параллельные алгоритмы, спускаемый аппарат, аэродинамические характеристики, вихревой поток, ближний след.
Simulation of unsteady structure of flow over descent module in the Martian atmosphere conditions
Computer Research and Modeling, 2022, v. 14, no. 4, pp. 701-714The article presents the results of numerical modeling of the vortex spatial non-stationary motion of the medium arising near the lateral and bottom surfaces of the descent module during its movement in the atmosphere of Mars. The numerical study was performed for the high-speed streamline regime at various angles of attack. Mathematical modeling was carried out on the basis of the Navier – Stokes model and the model of equilibrium chemical reactions for the Martian atmosphere gas. The simulation results showed that under the considered conditions of the descent module motion, a non-stationary flow with a pronounced vortex character is realized near its lateral and bottom surfaces. Numerical calculations indicate that, depending on the angle of attack, the nonstationarity and vortex nature of the flow can manifest itself both on the entire lateral and bottom surfaces of the module, and, partially, on their leeward side. For various angles of attack, pictures of the vortex structure of the flow near the surface of the descent vehicle and in its near wake are presented, as well as pictures of the gas-dynamic parameters fields. The non-stationary nature of the flow is confirmed by the presented time dependences of the gas-dynamic parameters of the flow at various points on the module surface. The carried out parametric calculations made it possible to determine the dependence of the aerodynamic characteristics of the descent module on the angle of attack. Mathematical modeling is carried out on the basis of the conservative numerical method of fluxes, which is a finitevolume method based on a finite-difference writing of the conservation laws of additive characteristics of the medium using «upwind» approximations of stream variables. To simulate the complex vortex structure of the flow over descent module, the nonuniform computational grids are used, including up to 30 million finite volumes with exponential thickening to the surface, which made it possible to reveal small-scale vortex formations. Numerical investigations were carried out on the basis of the developed software package based on parallel algorithms of the used numerical method and implemented on modern multiprocessor computer systems. The results of numerical simulation presented in the article were obtained using up to two thousand computing cores of a multiprocessor complex.
-
Четырехфакторный вычислительный эксперимент для задачи случайного блуждания на двумерной решетке
Компьютерные исследования и моделирование, 2017, т. 9, № 6, с. 905-918Случайный поиск в настоящее время стал распространенным и эффективным средством решения сложных задач оптимизации и адаптации. В работе рассматривается задача о средней длительности случайного поиска одним объектом другого в зависимости от различных факторов на квадратной решетке. Решение поставленной задачи было реализовано при помощи проведения полного эксперимента с 4 факторами и ортогональным планом в 54 строки. В рамках каждой строки моделировались случайные блуждания двух точек с заданными начальными условиями и правила перехода, затем замерялась продолжительность поиска одного объекта другим. В результате построена регрессионная модель, отражающая среднюю длительность случайного поиска объекта в зависимости от четырех рассматриваемых факторов, задающих начальные положения двух объектов, условия их передвижения и обнаружения. Среди рассмотренных факторов, влияющих на среднее время поиска, определены наиболее значимые. По построенной модели проведена интерпретация в задаче случайного поиска объекта. Важным результатом работы стало то, что с помощью модели выявлено качественное и количественное влияние первоначальных позиций объектов, размера решетки и правил перемещения на среднее время продолжительности поиска. Показано, что начальное соседство объектов на решетке не гарантирует быстрый поиск, если каждый из них передвигается. Помимо этого, количественно оценено, во сколько раз может затянуться или сократиться среднее время поиска объекта при увеличении скорости ищущего объекта на 1 ед., а также при увеличении размера поля на 1 ед., при различных начальных положениях двух объектов. Выявлен экспоненциальный характер роста числа шагов поиска объекта при увеличении размера решетки при остальных фиксированных факторах. Найдены условия наиболее большого увеличения средней продолжительности поиска: максимальная удаленность объектов в сочетании с неподвижностью одного из них при изменении размеров поля на 1 ед. (т. е., к примеру, с $4 \times 4$ на $5 \times 5$) может увеличить в среднем продолжительность поиска в $e^{1.69} \approx 5.42$. Поставленная в работе задача может быть актуальна с точки зрения применения как в погранометрике для обеспечения безопасности государства, так и, к примеру, в теории массового обслуживания.
Ключевые слова: математическое моделирование, случайное блуждание, планирование эксперимента, случайный поиск.
Four-factor computing experiment for the random walk on a two-dimensional square field
Computer Research and Modeling, 2017, v. 9, no. 6, pp. 905-918Просмотров за год: 21.Nowadays the random search became a widespread and effective tool for solving different complex optimization and adaptation problems. In this work, the problem of an average duration of a random search for one object by another is regarded, depending on various factors on a square field. The problem solution was carried out by holding total experiment with 4 factors and orthogonal plan with 54 lines. Within each line, the initial conditions and the cellular automaton transition rules were simulated and the duration of the search for one object by another was measured. As a result, the regression model of average duration of a random search for an object depending on the four factors considered, specifying the initial positions of two objects, the conditions of their movement and detection is constructed. The most significant factors among the factors considered in the work that determine the average search time are determined. An interpretation is carried out in the problem of random search for an object from the constructed model. The important result of the work is that the qualitative and quantitative influence of initial positions of objects, the size of the lattice and the transition rules on the average duration of search is revealed by means of model obtained. It is shown that the initial neighborhood of objects on the lattice does not guarantee a quick search, if each of them moves. In addition, it is quantitatively estimated how many times the average time of searching for an object can increase or decrease with increasing the speed of the searching object by 1 unit, and also with increasing the field size by 1 unit, with different initial positions of the two objects. The exponential nature of the growth in the number of steps for searching for an object with an increase in the lattice size for other fixed factors is revealed. The conditions for the greatest increase in the average search duration are found: the maximum distance of objects in combination with the immobility of one of them when the field size is changed by 1 unit. (that is, for example, with $4 \times 4$ at $5 \times 5$) can increase the average search duration in $e^{1.69} \approx 5.42$. The task presented in the work may be relevant from the point of view of application both in the landmark for ensuring the security of the state, and, for example, in the theory of mass service.
-
Моделирование конвективно-радиационного теплопереноса в дифференциально обогреваемой вращающейся полости
Компьютерные исследования и моделирование, 2018, т. 10, № 2, с. 195-207Проведено математическое моделирование нестационарных режимов естественной конвекции и поверхностного излучения в замкнутой вращающейся квадратной полости. Рассматриваемая область решения имела две противоположные изотермические стенки, поддерживаемые при постоянных низкой и высокой температурах, остальные стенки являлись адиабатическими. Стенки считались диффузно-серыми. Анализируемая полость вращалась с постоянной угловой скоростью относительно оси, проходящей через центр полости и ориентированной ортогонально области решения. Математическая модель, сформулированная в безразмерных преобразованных переменных «функция тока – завихренность скорости» на основе приближений Буссинеска и диатермичности рабочей среды, была реализована численно методом конечных разностей. Уравнения дисперсии завихренности и энергии решались на основе локально-одномерной схемы А. А. Самарского. Диффузионные слагаемые аппроксимировались центральными разностями, конвективные — с использованием монотонной аппроксимации А. А. Самарского. Разностные уравнения решались методом прогонки. Разностное уравнение Пуассона для функции тока решалось отдельно с применением метода последовательной верхней релаксации. Оптимальное значение параметра релаксации подбиралось на основе вычислительных экспериментов. Анализ радиационного теплообмена проведен с использованием метода сальдо в варианте Поляка. Разработанный вычислительный код был протестирован на множестве сеток, а также верифицирован путем сопоставления полученных результатов при решении модельной задачи с экспериментальными и численными данными других авторов.
Численные исследования нестационарных режимов естественной конвекции и поверхностного теплового излучения в замкнутой вращающейся полости проведены при следующих значениях безразмерных параметров: Ra = 103–106, Ta = 0–105, Pr = 0.7, ε = 0–0.9. Все распределения были получены для двадцатого полного оборота полости, когда наблюдается установление периодической картины течения и теплопереноса. В результате анализа установлено, что при малой угловой скорости вращения полости возможна интенсификация течения, а дальнейший рост скорости вращения приводит к ослаблению конвективного течения. Радиационное число Нуссельта незначительно изменяется при варьировании числа Тейлора.
Ключевые слова: естественная конвекция, тепловое поверхностное излучение, диатермичная среда, вращающаяся полость, метод конечных разностей.
Simulation of convective-radiative heat transfer in a differentially heated rotating cavity
Computer Research and Modeling, 2018, v. 10, no. 2, pp. 195-207Просмотров за год: 20.Mathematical simulation of unsteady natural convection and thermal surface radiation within a rotating square enclosure was performed. The considered domain of interest had two isothermal opposite walls subjected to constant low and high temperatures, while other walls are adiabatic. The walls were diffuse and gray. The considered cavity rotated with constant angular velocity relative to the axis that was perpendicular to the cavity and crossed the cavity in the center. Mathematical model, formulated in dimensionless transformed variables “stream function – vorticity” using the Boussinesq approximation and diathermic approach for the medium, was performed numerically using the finite difference method. The vorticity dispersion equation and energy equation were solved using locally one-dimensional Samarskii scheme. The diffusive terms were approximated by central differences, while the convective terms were approximated using monotonic Samarskii scheme. The difference equations were solved by the Thomas algorithm. The approximated Poisson equation for the stream function was solved by successive over-relaxation method. Optimal value of the relaxation parameter was found on the basis of computational experiments. Radiative heat transfer was analyzed using the net-radiation method in Poljak approach. The developed computational code was tested using the grid independence analysis and experimental and numerical results for the model problem.
Numerical analysis of unsteady natural convection and thermal surface radiation within the rotating enclosure was performed for the following parameters: Ra = 103–106, Ta = 0–105, Pr = 0.7, ε = 0–0.9. All distributions were obtained for the twentieth complete revolution when one can find the periodic behavior of flow and heat transfer. As a result we revealed that at low angular velocity the convective flow can intensify but the following growth of angular velocity leads to suppression of the convective flow. The radiative Nusselt number changes weakly with the Taylor number.
-
Весовой векторный метод конечных элементов и его приложения
Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 71-86Математические модели многих естественных процессов описываются дифференциальными уравнениями с особенностями решения. Классические численные методы для нахождения приближенного решения таких задач оказываются неэффективными. В настоящей работе рассмотрена краевая задача для векторного волнового уравнения в двумерной L-образной области. Наличие входящего угла величиной $3\pi/2$ на границе расчетной области обусловливает сильную сингулярность задачи, то есть ее решение не принадлежит пространству Соболева $H^1$, в результате чего классические и специализированные численные методы имеют скорость сходимости ниже чем $O(h)$. Поэтому в работе введено специальное весовое множество вектор-функций. В этом множестве решение рассматриваемой краевой задачи определено как $R_ν$-обобщенное.
Для численного нахождения $R_ν$-обобщенного решения построен весовой векторный метод конечных элементов. Основным отличием этого метода является введение в базисные функции в качестве сомножителя специальной весовой функции в степени, определяемой свойствами решения исходной краевой задачи. Это позволило существенно повысить скорость сходимости приближенного решения к точному при измельчении конечноэлементной сетки. Кроме того, введенные базисные функции соленоидальны, что обеспечило точный учет условия соленоидальности искомого решения и предотвратило появление ложных численных решений.
Представлены результаты численного эксперимента для серии модельных задач различных типов: для задач, решение которых содержит только сингулярную составляющую, и для задач, решение которых содержит как сингулярную, так и регулярную составляющие. Результаты численного анализа показали, что при измельчении конечноэлементной сетки скорость сходимости построенного весового векторного метода конечных элементов составляет $O(h)$, что по порядку степени в полтора раза выше, чем в разработанных к настоящему времени специализированных методах решения рассматриваемой задачи: методе сингулярных дополнений и методе регуляризации. Другие особенности построенного метода — его алгоритмическая простота и естественность определения решения, что является преимуществом при проведении численных расчетов.
Ключевые слова: весовой векторный метод конечных элементов, весовые пространства, $R_ν$-обобщенное решение, краевые задачи с сингулярностью.
Weighthed vector finite element method and its applications
Computer Research and Modeling, 2019, v. 11, no. 1, pp. 71-86Просмотров за год: 37.Mathematical models of many natural processes are described by partial differential equations with singular solutions. Classical numerical methods for determination of approximate solution to such problems are inefficient. In the present paper a boundary value problem for vector wave equation in L-shaped domain is considered. The presence of reentrant corner of size $3\pi/2$ on the boundary of computational domain leads to the strong singularity of the solution, i.e. it does not belong to the Sobolev space $H^1$ so classical and special numerical methods have a convergence rate less than $O(h)$. Therefore in the present paper a special weighted set of vector-functions is introduced. In this set the solution of considered boundary value problem is defined as $R_ν$-generalized one.
For numerical determination of the $R_ν$-generalized solution a weighted vector finite element method is constructed. The basic difference of this method is that the basis functions contain as a factor a special weight function in a degree depending on the properties of the solution of initial problem. This allows to significantly raise a convergence speed of approximate solution to the exact one when the mesh is refined. Moreover, introduced basis functions are solenoidal, therefore the solenoidal condition for the solution is taken into account precisely, so the spurious numerical solutions are prevented.
Results of numerical experiments are presented for series of different type model problems: some of them have a solution containing only singular component and some of them have a solution containing a singular and regular components. Results of numerical experiment showed that when a finite element mesh is refined a convergence rate of the constructed weighted vector finite element method is $O(h)$, that is more than one and a half times better in comparison with special methods developed for described problem, namely singular complement method and regularization method. Another features of constructed method are algorithmic simplicity and naturalness of the solution determination that is beneficial for numerical computations.
-
Исследование формирования структур Тьюринга под влиянием волновой неустойчивости
Компьютерные исследования и моделирование, 2019, т. 11, № 3, с. 397-412Рассматривается классическая для нелинейной динамики модель «брюсселятор», дополненная третьей переменной, играющей роль быстро диффундирующего ингибитора. Модель исследуется в одномерном случае в области параметров, где проявляются два типа диффузионной неустойчивости однородного стационарного состояния системы: волновая неустойчивость, приводящая к самопроизвольному формированию автоволн, и неустойчивость Тьюринга, приводящая к самопроизвольному формированию стационарных диссипативных структур, или структур Тьюринга. Показано, что благодаря субкритическому характеру бифуркации Тьюринга взаимодействие двух неустойчивостей в данной системе приводит к самопроизвольному формированию стационарных диссипативных структур еще до прохождения бифуркации Тьюринга. В ответ на различные случайные шумовые возмущения пространственно-однородного стационарного состояния в исследуемой параметрической области в окрестности точки двойной бифуркации в системе могут устанавливаться различные режимы: как чистые, состоящие только из стационарных или только автоволновых диссипативных структур, так и смешанные, при которых разные режимы проявляются в разных участках расчетного пространства. В рассматриваемой параметрической области система является мультистабильной и проявляет высокую чувствительность к начальным шумовым условиям, что приводит к размытию границ между качественно разными режимами. При этом даже в зоне доминирования смешанных режимов с преобладанием структур Тьюринга значительную вероятность имеет установление чистого автоволнового режима. В случае установившихся смешанных режимов достаточно сильное локальное возмущение в участке расчетного пространства, где проявляется автоволновой режим, может инициировать локальное формирование новых стационарных диссипативных структур. Локальное возмущение стационарного однородного состояния в исследуемой области параметрического пространства приводит к качественно схожей карте устоявшихся режимов, при этом зона доминирования чистых автоволновых режимов расширяется с увеличением амплитуды локального возмущения. В двумерном случае в системе не устанавливаются смешанные режимы. При эволюции системы в случае появления локальных структур Тьюринга под воздействием автоволнового режима со временем они заполняют все расчетное пространство.
Investigation of Turing structures formation under the influence of wave instability
Computer Research and Modeling, 2019, v. 11, no. 3, pp. 397-412Просмотров за год: 21.A classical for nonlinear dynamics model, Brusselator, is considered, being augmented by addition of a third variable, which plays the role of a fast-diffusing inhibitor. The model is investigated in one-dimensional case in the parametric domain, where two types of diffusive instabilities of system’s homogeneous stationary state are manifested: wave instability, which leads to spontaneous formation of autowaves, and Turing instability, which leads to spontaneous formation of stationary dissipative structures, or Turing structures. It is shown that, due to the subcritical nature of Turing bifurcation, the interaction of two instabilities in this system results in spontaneous formation of stationary dissipative structures already before the passage of Turing bifurcation. In response to different perturbations of spatially uniform stationary state, different stable regimes are manifested in the vicinity of the double bifurcation point in the parametric region under study: both pure regimes, which consist of either stationary or autowave dissipative structures; and mixed regimes, in which different modes dominate in different areas of the computational space. In the considered region of the parametric space, the system is multistable and exhibits high sensitivity to initial noise conditions, which leads to blurring of the boundaries between qualitatively different regimes in the parametric region. At that, even in the area of dominance of mixed modes with prevalence of Turing structures, the establishment of a pure autowave regime has significant probability. In the case of stable mixed regimes, a sufficiently strong local perturbation in the area of the computational space, where autowave mode is manifested, can initiate local formation of new stationary dissipative structures. Local perturbation of the stationary homogeneous state in the parametric region under investidation leads to a qualitatively similar map of established modes, the zone of dominance of pure autowave regimes being expanded with the increase of local perturbation amplitude. In two-dimensional case, mixed regimes turn out to be only transient — upon the appearance of localized Turing structures under the influence of wave regime, they eventually occupy all available space.
-
Иерархический метод математического моделирования стохастических тепловых процессов в сложных электронных системах
Компьютерные исследования и моделирование, 2019, т. 11, № 4, с. 613-630В работе развивается иерархический метод математического и компьютерного моделирования интервально-стохастических тепловых процессов в сложных электронных системах различного назначения. Разработанная концепция иерархического структурирования отражает как конструктивную иерархию сложной электронной системы, так и иерархию математических моделей процессов теплообмена. Тепловые процессы, учитывающие разнообразные физические явления в сложных электронных системах, описываются системами стохастических, нестационарных и нелинейных дифференциальных уравнений в частных производных, и в силу этого их компьютерное моделирование наталкивается на значительные вычислительные трудности даже с применением суперкомпьютеров. Иерархический метод позволяет избежать указанных трудностей. Иерархическая структура конструкции электронной системы в общем случае характеризуется пятью уровнями: 1 уровень — активные элементы ЭС (микросхемы, электро-, радиоэлементы); 2 уровень — электронный модуль; 3 уровень — панель, объединяющая множество электронных модулей; 4 уровень — блок панелей; 5 уровень — стойка, установленная в стационарном или подвижном помещении. Иерархия моделей и моделирования стохастических тепловых процессов строится в порядке, обратном иерархической структуре конструкции электронной системы, при этом моделирование интервально-стохастических тепловых процессов осуществляется посредством получения уравнений для статистических мер. Разработанный в статье иерархический метод позволяет учитывать принципиальные особенности тепловых процессов, такие как стохастический характер тепловых, электрических и конструктивных факторов при производстве, сборке и монтаже электронных систем, стохастический разброс условий функционирования и окружающей среды, нелинейные зависимости от температуры факторов теплообмена, нестационарный характер тепловых процессов. Полученные в статье уравнения для статистических мер стохастических тепловых процессов представляют собой систему 14-ти нестационарных нелинейных дифференциальных уравнений первого порядка в обыкновенных производных, решение которых легко реализуется на современных компьютерах существующими численными методами. Рассмотрены результаты применения метода при компьютерном моделировании стохастических тепловых процессов в электронной системе. Иерархический метод применяется на практике при тепловом проектировании реальных электронных систем и создании современных конкурентоспособных устройств.
Ключевые слова: стохастический, тепловой процесс, статистические меры, математическое моделирование, электронные системы.
Hierarchical method for mathematical modeling of stochastic thermal processes in complex electronic systems
Computer Research and Modeling, 2019, v. 11, no. 4, pp. 613-630Просмотров за год: 3.A hierarchical method of mathematical and computer modeling of interval-stochastic thermal processes in complex electronic systems for various purposes is developed. The developed concept of hierarchical structuring reflects both the constructive hierarchy of a complex electronic system and the hierarchy of mathematical models of heat exchange processes. Thermal processes that take into account various physical phenomena in complex electronic systems are described by systems of stochastic, unsteady, and nonlinear partial differential equations and, therefore, their computer simulation encounters considerable computational difficulties even with the use of supercomputers. The hierarchical method avoids these difficulties. The hierarchical structure of the electronic system design, in general, is characterized by five levels: Level 1 — the active elements of the ES (microcircuits, electro-radio-elements); Level 2 — electronic module; Level 3 — a panel that combines a variety of electronic modules; Level 4 — a block of panels; Level 5 — stand installed in a stationary or mobile room. The hierarchy of models and modeling of stochastic thermal processes is constructed in the reverse order of the hierarchical structure of the electronic system design, while the modeling of interval-stochastic thermal processes is carried out by obtaining equations for statistical measures. The hierarchical method developed in the article allows to take into account the principal features of thermal processes, such as the stochastic nature of thermal, electrical and design factors in the production, assembly and installation of electronic systems, stochastic scatter of operating conditions and the environment, non-linear temperature dependencies of heat exchange factors, unsteady nature of thermal processes. The equations obtained in the article for statistical measures of stochastic thermal processes are a system of 14 non-stationary nonlinear differential equations of the first order in ordinary derivatives, whose solution is easily implemented on modern computers by existing numerical methods. The results of applying the method for computer simulation of stochastic thermal processes in electron systems are considered. The hierarchical method is applied in practice for the thermal design of real electronic systems and the creation of modern competitive devices.
-
Влияние конечности мантиссы на точность безградиентных методов оптимизации
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 259-280Безградиентные методы оптимизации, или методы нулевого порядка, широко применяются в обучении нейронных сетей, обучении с подкреплением, а также в промышленных задачах, где доступны лишь значения функции в точке (работа с неаналитическими функциями). В частности, метод обратного распространения ошибки в PyTorch работает именно по этому принципу. Существует общеизвестный факт, что при компьютерных вычислениях используется эвристика чисел с плавающей точкой, и из-за этого возникает проблема конечности мантиссы.
В этой работе мы, во-первых, сделали обзор наиболее популярных методов аппроксимации градиента: конечная прямая/центральная разность (FFD/FCD), покомпонентная прямая/центральная разность (FWC/CWC), прямая/центральная рандомизация на $l_2$ сфере (FSSG2/CFFG2); во-вторых, мы описали текущие теоретические представления шума, вносимого неточностью вычисления функции в точке: враждебный шум, случайный шум; в-третьих, мы провели серию экспериментов на часто встречающихся классах задач, таких как квадратичная задача, логистическая регрессия, SVM, чтобы попытаться определить, соответствует ли реальная природа машинного шума существующей теории. Оказалось, что в реальности (по крайней мере на тех классах задач, которые были рассмотрены в данной работе) машинный шум оказался чем-то средним между враждебным шумом и случайным, в связи с чем текущая теория о влиянии конечности мантиссы на поиск оптимума в задачах безградиентной оптимизации требует некоторой корректировки.
Ключевые слова: конечность мантиссы, безградиентные методы оптимизации, аппроксима- ция градиента, градиентный спуск, квадратичная задача, логистическая регрессия.
Influence of the mantissa finiteness on the accuracy of gradient-free optimization methods
Computer Research and Modeling, 2023, v. 15, no. 2, pp. 259-280Gradient-free optimization methods or zeroth-order methods are widely used in training neural networks, reinforcement learning, as well as in industrial tasks where only the values of a function at a point are available (working with non-analytical functions). In particular, the method of error back propagation in PyTorch works exactly on this principle. There is a well-known fact that computer calculations use heuristics of floating-point numbers, and because of this, the problem of finiteness of the mantissa arises.
In this paper, firstly, we reviewed the most popular methods of gradient approximation: Finite forward/central difference (FFD/FCD), Forward/Central wise component (FWC/CWC), Forward/Central randomization on $l_2$ sphere (FSSG2/CFFG2); secondly, we described current theoretical representations of the noise introduced by the inaccuracy of calculating the function at a point: adversarial noise, random noise; thirdly, we conducted a series of experiments on frequently encountered classes of problems, such as quadratic problem, logistic regression, SVM, to try to determine whether the real nature of machine noise corresponds to the existing theory. It turned out that in reality (at least for those classes of problems that were considered in this paper), machine noise turned out to be something between adversarial noise and random, and therefore the current theory about the influence of the mantissa limb on the search for the optimum in gradient-free optimization problems requires some adjustment.
-
Модифицированный метод Гаусса–Ньютона для решения гладкой системы нелинейных уравнений
Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 697-723В работе предлагается новая версия метода Гаусса–Ньютона для решения системы нелинейных уравнений, основанная на идеях использования верхней оценки нормы невязки системы уравнений и квадратичной регуляризации. Предложенная версия метода Гаусса–Ньютона на практике фактически задает целое параметризованное семейство методов решения систем нелинейных уравнений и задач восстановления регрессионной зависимости. Разработанное семейство методов Гаусса–Ньютона состоит целиком из итеративных методов, включающих в себя также специальные формы алгоритмов Левенберга–Марквардта, с обобщением на случаи применения в неевклидовых нормированных пространствах. В разработанных методах используется локальная модель, осуществляющая параметризованное проксимальное отображение и допускающая на практике применение неточного оракула в формате «черного ящика» с ограничением на точность вычисления и на сложность вычисления. Для разработанного семейства методов приведен анализ эффективности в терминах количества итераций алгоритма, точности и сложности представления локальной модели и вычисления оракула, параметров размерности решаемой задачи с выводом локальной и глобальной сходимости при использовании произвольного оракула. В работе представлены условия глобальной сублинейной сходимости для предложенного семейства методов решения системы нелинейных уравнений, состоящих из гладких по Липшицу функций. В рамках дополнительных естественных предположений о невырожденности системы нелинейных функций установлена локальная суперлинейная сходимость для рассмотренного семейства методов. При выполнении условия Поляка–Лоясиевича для системы нелинейных уравнений доказана локальная и глобальная линейная сходимость рассмотренных методов Гаусса–Ньютона. Помимо теоретического обоснования методов, в работе рассматриваются вопросы их практической реализации. В частности, в проведенных экспериментах для точного оракула приводятся схемы эффективного вычисления в зависимости от параметров размерности решаемой задачи. Предложенное семейство методов объединяет в себе несколько существующих и часто используемых на практике модификаций метода Гаусса–Ньютона, позволяя получить гибкий и удобный в использовании метод, реализуемый на практике с помощью стандартных техник выпуклой оптимизации и вычислительной линейной алгебры.
Ключевые слова: системы нелинейных уравнений, нелинейная регрессия, метод Гаусса–Ньютона, алгоритм Левенберга–Марквардта, методы доверительной области, невыпуклая оптимизация, неточное проксимальное отображение, неточный оракул, условие Поляка–Лоясиевича, оценка сложности.
Modified Gauss–Newton method for solving a smooth system of nonlinear equations
Computer Research and Modeling, 2021, v. 13, no. 4, pp. 697-723In this paper, we introduce a new version of Gauss–Newton method for solving a system of nonlinear equations based on ideas of the residual upper bound for a system of nonlinear equations and a quadratic regularization term. The introduced Gauss–Newton method in practice virtually forms the whole parameterized family of the methods solving systems of nonlinear equations and regression problems. The developed family of Gauss–Newton methods completely consists of iterative methods with generalization for cases of non-euclidean normed spaces, including special forms of Levenberg–Marquardt algorithms. The developed methods use the local model based on a parameterized proximal mapping allowing us to use an inexact oracle of «black–box» form with restrictions for the computational precision and computational complexity. We perform an efficiency analysis including global and local convergence for the developed family of methods with an arbitrary oracle in terms of iteration complexity, precision and complexity of both local model and oracle, problem dimensionality. We present global sublinear convergence rates for methods of the proposed family for solving a system of nonlinear equations, consisting of Lipschitz smooth functions. We prove local superlinear convergence under extra natural non-degeneracy assumptions for system of nonlinear functions. We prove both local and global linear convergence for a system of nonlinear equations under Polyak–Lojasiewicz condition for proposed Gauss– Newton methods. Besides theoretical justifications of methods we also consider practical implementation issues. In particular, for conducted experiments we present effective computational schemes for the exact oracle regarding to the dimensionality of a problem. The proposed family of methods unites several existing and frequent in practice Gauss–Newton method modifications, allowing us to construct a flexible and convenient method implementable using standard convex optimization and computational linear algebra techniques.
-
Численное проектирование механизмов замкнутой кинематики: синтез эргономичного модуля экзоскелета для поддержки спины
Компьютерные исследования и моделирование, 2022, т. 14, № 6, с. 1269-1280Статья посвящена задаче со-дизайна исполнительных механизмов робототехнических систем, назначение которых заключается в контактном адаптивном взаимодействии с неструктурированным окружением, в том числе человеком. Со-дизайн заключается в одновременной оптимизации механики и системы управления механизмом, обеспечивающих оптимальное поведение и производительность системы. Под оптимизацией механики понимается поиск оптимальных структуры, геометрических параметров, распределения массы среди звеньев и их податливости; под управлением понимается поиск траекторий движения сочленений механизмов. В работе представлен обобщенный метод структурно-параметрического синтеза неполноприводных механизмов замкнутой кинематики, применимый для создания механизмов для робототехнических систем разного назначения; например, ранее он был апробирован для со-дизайна механизмов пальцев антропоморфных захватов и механизмов ног галопирующих роботов. Метод реализует концепцию морфологического расчета законов управления за счет особенностей механической конструкции, минимизируя управляющее воздействие со стороны алгоритмической составляющей системы управления, что позволяет снизить требования к уровню технического оснащения и понизить энергопотребление. В данной работе предложен- ный метод апробирован для оптимизации структуры и геометрических параметров пассивного механизма модуля поддержки спины промышленного экзокостюма. Движения человека разнообразны и недетерминированы, если сравнивать с движениями автономных роботов, что усложняет проектирование носимых робототехнических устройств. Для снижения травматизма, усталости и повышения производительности рабочих синтезируемый промышленный экзокостюм должен не только компенсировать нагрузки, но и не мешать естественным движениям человека. Для проверки разработанного экзокостюма были использованы кинематические данные захвата движения всего тела человека при выполнении промышленных операций. Предложенный метод структурно-параметрического синтеза был использован для повышения эргономичности носимого робототехнического устройства. Верификация синтезированного механизма произведена с помощью имитационного моделирования: пассивный модуль спины прикреплен к двум геометрическим примитивам, осуществляющим движение грудной клетки и таза оператора экзокостюма в соответствии с данными захвата движения. Эргономичность модуля спины количественно измерена расстоянием между сочленениями, соединяющими верхнюю и нижнюю части экзокостюма; минимизация отклонения от среднего значения соответствует меньшей степени ограниченности движения оператора, т. е. большей эргономичности. В статье приведены подробное изложение метода структурно-параметрического синтеза, пример апробации метода для создания модуля экзокостюма и результаты имитационного моделирования.
Computational design of closed-chain linkages: synthesis of ergonomic spine support module of exosuit
Computer Research and Modeling, 2022, v. 14, no. 6, pp. 1269-1280The article focuses on the problem of mechanisms’ co-design for robotic systems to perform adaptive physical interaction with an unstructured environment, including physical human robot interaction. The co-design means simultaneous optimization of mechanics and control system, ensuring optimal behavior and performance of the system. Mechanics optimization refers to the search for optimal structure, geometric parameters, mass distribution among the links and their compliance; control refers to the search for motion trajectories for mechanism’s joints. The paper presents a generalized method of structural-parametric synthesis of underactuated mechanisms with closed kinematics for robotic systems for various purposes, e. g., it was previously used for the co-design of fingers’ mechanisms for anthropomorphic gripper and legs’ mechanisms for galloping robots. The method implements the concept of morphological computation of control laws due to the features of mechanical design, minimizing the control effort from the algorithmic component of the control system, which reduces the requirements for the level of technical equipment and reduces energy consumption. In this paper, the proposed method is used to optimize the structure and geometric parameters of the passive mechanism of the back support module of an industrial exosuit. Human movements are diverse and non-deterministic when compared with the movements of autonomous robots, which complicates the design of wearable robotic devices. To reduce injuries, fatigue and increase the productivity of workers, the synthesized industrial exosuit should not only compensate for loads, but also not interfere with the natural human motions. To test the developed exosuit, kinematic datasets from motion capture of an entire human body during industrial operations were used. The proposed method of structural-parametric synthesis was used to improve the ergonomics of a wearable robotic device. Verification of the synthesized mechanism was carried out using simulation: the passive module of the back is attached to two geometric primitives that move the chest and pelvis of the exosuit operator in accordance with the motion capture data. The ergonomics of the back module is quantified by the distance between the joints connecting the upper and bottom parts of the exosuit; minimizing deviation from the average value corresponds to a lesser limitation of the operator’s movement, i. e. greater ergonomics. The article provides a detailed description of the method of structural-parametric synthesis, an example of synthesis of an exosuit module and the results of simulation.
-
Компенсация собственных нелинейных помех на основе смешанного метода Ньютона
Компьютерные исследования и моделирование, 2024, т. 16, № 7, с. 1579-1592В статье исследуется одно из возможных решений задачи компенсации собственных помех (SIC, Self-Interference Cancellation), возникающей при проектировании полнодуплексных (IBFD, In-band Full-Duplex) систем связи. Подавление собственных помех осуществляется в цифровой области с помощью многослойных нелинейных моделей, которые адаптируются на основе метода градиентного спуска. Наличие локальных оптимумов и седловых точек при адаптации многослойных моделей делает невозможным использование методов второго порядка ввиду знаконеопределенности матрицы Гессе.
В данной работе предложено использовать смешанный метод Ньютона (MNM, mixed Newton method), который учитывает информацию о смешанных производных второго порядка функции потерь и, как следствие, обеспечивает высокую скорость сходимости по сравнению с традиционными методами первого порядка. Использование лишь только смешанных частных производных второго порядка при построении матрицы Гессе позволяет избежать проблемы «застревания» в седловых точках при использовании смешанного метода Ньютона для адаптации многослойных нелинейных компенсаторов собственных помех при проектировании полнодуплексных систем связи.
В качестве модели собственных нелинейных помех выбрана модель Гаммерштейна с комплексными параметрами. Данный выбор обусловлен тем, что модель эффективно описывает физические свойства, лежащие в основе формирования собственных помех. Благодаря свойству голоморфности выхода модели смешанный метод Ньютона обеспечивает свойство «отталкивания» от седловых точек в ландшафте функции потерь.
В работе приводятся кривые сходимости при адаптации модели Гаммерштейна смешанным методом Ньютона, а также при помощи классических подходов на основе метода градиентного спуска. Кроме того, приводится вывод предложенного метода, а также оценка вычислительной сложности.
Ключевые слова: метод второго порядка, комплекснозначный гессиан, полнодуплексные системы связи, компенсация собственных помех.
Non-linear self-interference cancellation on base of mixed Newton method
Computer Research and Modeling, 2024, v. 16, no. 7, pp. 1579-1592The paper investigates a potential solution to the problem of Self-Interference Cancellation (SIC) encountered in the design of In-Band Full-Duplex (IBFD) communication systems. The suppression of selfinterference is implemented in the digital domain using multilayer nonlinear models adapted via the gradient descent method. The presence of local optima and saddle points in the adaptation of multilayer models prevents the use of second-order methods due to the indefinite nature of the Hessian matrix.
This work proposes the use of the Mixed Newton Method (MNM), which incorporates information about the second-order mixed partial derivatives of the loss function, thereby enabling a faster convergence rate compared to traditional first-order methods. By constructing the Hessian matrix solely with mixed second-order partial derivatives, this approach mitigates the issue of “getting stuck” at saddle points when applying the Mixed Newton Method for adapting multilayer nonlinear self-interference compensators in full-duplex system design.
The Hammerstein model with complex parameters has been selected to represent nonlinear selfinterference. This choice is motivated by the model’s ability to accurately describe the underlying physical properties of self-interference formation. Due to the holomorphic property of the model output, the Mixed Newton Method provides a “repulsion” effect from saddle points in the loss landscape.
The paper presents convergence curves for the adaptation of the Hammerstein model using both the Mixed Newton Method and conventional gradient descent-based approaches. Additionally, it provides a derivation of the proposed method along with an assessment of its computational complexity.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"