Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Взаимосвязь и реализация квазиньютоновских и ньютоновских методов безусловной оптимизации
Компьютерные исследования и моделирование, 2016, т. 8, № 1, с. 55-78Рассмотрены ньютоновские и квазиньютоновские методы безусловной оптимизации, основанные на факторизации Холесского, с регулировкой шага и с конечно-разностной аппроксимацией первых и вторых производных. Для увеличения эффективности квазиньютоновских методов предложено модифицированное разложение Холесского квазиньютоновской матрицы, определяющее и решение проблемы масштабирования шагов при спуске, и аппроксимацию неквадратичными функциями, и интеграцию с методом доверительной окрестности. Предложен подход к увеличению эффективности ньютоновских методов с конечно-разностной аппроксимацией первых и вторых производных. Приведены результаты численного исследования эффективности алгоритмов.
Ключевые слова: ньютоновские методы, квазиньютоновские методы, факторизация Холесского, масштабирование шагов, метод доверительной окрестности, конечно-разностная аппроксимация, алгоритм, численные исследования, безусловная оптимизация.
Correlation and realization of quasi-Newton methods of absolute optimization
Computer Research and Modeling, 2016, v. 8, no. 1, pp. 55-78Просмотров за год: 7. Цитирований: 5 (РИНЦ).Newton and quasi-Newton methods of absolute optimization based on Cholesky factorization with adaptive step and finite difference approximation of the first and the second derivatives. In order to raise effectiveness of the quasi-Newton methods a modified version of Cholesky decomposition of quasi-Newton matrix is suggested. It solves the problem of step scaling while descending, allows approximation by non-quadratic functions, and integration with confidential neighborhood method. An approach to raise Newton methods effectiveness with finite difference approximation of the first and second derivatives is offered. The results of numerical research of algorithm effectiveness are shown.
-
Количественные оценки сейсмического риска и энергетические концепции сейсмостойкого строительства
Компьютерные исследования и моделирование, 2018, т. 10, № 1, с. 61-76В настоящее время сейсмостойкое проектирование зданий основано на силовом расчете и представлении эффекта землетрясения статическими эквивалентными силами, которые рассчитываются с использованием упругих спектров реакций (линейно-спектральный метод), связывающих закон движения грунта с абсолютным ускорением модели в виде нелинейного осциллятора.
Такой подход непосредственно не учитывает ни влияния длительности сильных движений, ни пластического поведения конструкции. Частотный состав и продолжительность колебаний грунта напрямую влияют на энергию, поступившую в сооружение и вызывающую повреждение его элементов. В отличие от силового или кинематического расчета сейсмическое воздействие на конструкцию можно интерпретировать, не рассматривая отдельно силы или перемещения, а представить как произведение обеих величин, т. е. работу или входную энергию (максимальную энергию, которую может приобрести сооружение в результате землетрясения).
При энергетическом подходе сейсмического проектирования необходимо оценить входную сейсмическую энергию в сооружение и ее распределение среди различных структурных компонентов.
В статье приводится обоснование энергетического подхода при проектировании сейсмостойких зданий и сооружений взамен применяемого в настоящее время метода, основанного на силовом расчете и представлении эффекта землетрясения статическими эквивалентными силами, которые рассчитываются с использованием спектров реакции.
Отмечено, что интерес к использованию энергетических концепций в сейсмостойком проектировании начался с работ Хаузнера, который представил сейсмические силы в виде входной сейсмической энергии, используя спектр скоростей, и предложил считать, что повреждения в упругопластической системе, как и в упругой системе, вызывает одна и та же входная сейсмическая энергия.
В работе приведены индексы определения входной энергии землетрясения, предложенные различными авторами. Показано, что современные подходы обеспечения сейсмостойкости сооружений, основанные на представлении эффекта землетрясения как статической эквивалентной силы, недостаточно адекватно описывают поведение системы во время землетрясения.
В статье предлагается новый подход количественных оценок сейсмического риска, позволяющий формализовать процесс принятия решений относительно антисейсмических мероприятий. На основе количественных оценок сейсмического риска анализируется разработанный в НИУ МГСУ Стандарт организации (СТО) «Сейсмостойкость сооружений. Основные расчетные положения». В разработанном документе сделан шаг вперед в отношении оптимального проектирования сейсмостойких конструкций.
В предлагаемой концепции используются достижения современных методов расчета зданий и сооружений на сейсмические воздействия, которые гармонизированы с Еврокодом и не противоречат системе отечественных нормативных документов.
Ключевые слова: сейсмостойкость сооружений, энергетический метод, сейсмостойкое строительство, спектры реакции, входная энергия землетрясения, период повторяемости землетрясений, сейсмический риск, антисейсмические мероприятия, концептуальное проектирование, двухуровневый расчет, критерии сейсмостойкости, нелинейный статический и нелинейный динамический метод расчета.
Quantitative assessment of seismic risk and energy concepts of earthquake engineering
Computer Research and Modeling, 2018, v. 10, no. 1, pp. 61-76Currently, earthquake-resistant design of buildings based on the power calculation and presentation of effect of the earthquake static equivalent forces, which are calculated using elastic response spectra (linear-spectral method) that connects the law of motion of the soil with the absolute acceleration of the model in a nonlinear oscillator.
This approach does not directly take into account either the influence of the duration of strong motion or the plastic behavior of the structure. Frequency content and duration of ground vibrations directly affect the energy received by the building and causing damage to its elements. Unlike power or kinematic calculation of the seismic effect on the structure can be interpreted without considering separately the forces and displacements and to provide, as the product of both variables, i.e., the work or input energy (maximum energy that can be purchased building to the earthquake).
With the energy approach of seismic design, it is necessary to evaluate the input seismic energy in the structure and its distribution among various structural components.
The article provides substantiation of the energy approach in the design of earthquake-resistant buildings and structures instead of the currently used method based on the power calculation and presentation of effect of the earthquake static equivalent forces, which are calculated using spectra of the reaction.
Noted that interest in the use of energy concepts in earthquake-resistant design began with the works of Housner, which provided the seismic force in the form of the input seismic energy, using the range of speeds, and suggested that the damage in elastic-plastic system and elastic system causes one and the same input seismic energy.
The indices of the determination of the input energy of the earthquake, proposed by various authors, are given in this paper. It is shown that modern approaches to ensuring seismic stability of structures, based on the representation of the earthquake effect as a static equivalent force, do not adequately describe the behavior of the system during an earthquake.
In this paper, based on quantitative estimates of seismic risk analyzes developed in the NRU MSUCE Standard Organization (STO) “Seismic resistance structures. The main design provisions”. In the developed document a step forward with respect to the optimal design of earthquake-resistant structures.
The proposed concept of using the achievements of modern methods of calculation of buildings and structures on seismic effects, which are harmonized with the Eurocodes and are not contrary to the system of national regulations.
Keywords: the earthquake resistance of buildings, the energy method, earthquake-resistant construction, spectra response, the input earthquake energy, earthquake recurrence period, seismic risk, anti-seismic measures, conceptual design, two-tiered calculation, seismic resistance criteria, nonlinear static and nonlinear dynamic calculation method.Просмотров за год: 21. -
Исследование влияния искрового разряда на смешение струи газообразного топлива со сверхзвуковым воздушным потоком
Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 849-860В работе представлены результаты численного моделирования влияния протяженного искрового разряда на динамику перемешивания инжектируемой газовой струи со сверхзвуковым воздушным потоком. Расчеты проводились в программном комплексе FlowVision. Подача топлива осуществляется при помощи инжектора, расположенного на стенке канала, а разряд организован вблизи стенки ниже по потоку относительно инжектора. Моделирование электрического искрового разряда выполнено при помощи объемного источника тепла. С целью описания принципиального вида плазменного актуатора для ускорения перемешивания в сверхзвуковом потоке (число Маха М = 2) в ходе исследования выполнено варьирование энерговклада в разряд в диапазоне 100–500 мДж на один импульс, а также определено влияние формы и местоположения разряда относительно топливного инжектора. Проведено исследование режимов инжекции топлива в сверхзвуковой воздушный поток и найден оптимальный режим истечения струи газа для исследования влияния искрового разряда на смешение. Разработан метод анализа картины возмущений границы раздела «топливо–окислитель», вызванных работой импульсного искрового разряда. Подготовлена программа в среде LabView для получения количественной характеристики для дальнейшего сравнения полученных результатов с экспериментальными данными.
Результаты моделирования позволяют сделать вывод, что протяженный искровой разряд, расположенный ниже по потоку относительно инжектора и расположенный вдоль потока, обеспечивает максимальное увеличение границы раздела между струей топлива и основным потоком. Типичная частота повторения импульсов разряда в импульсно-периодическом режиме должна составлять более 6 кГц при длине разряда ~10 мм, чтобы обеспечить постоянное влияние на смешение в потоке со скоростью 500 м/с.
Ключевые слова: искровой разряд, смешение, сверхзвуковой поток, плазменный актуатор, компьютерное моделирование.
The study of the discharge influence on mixing of gaseous fuel jet with the supersonic air flow
Computer Research and Modeling, 2019, v. 11, no. 5, pp. 849-860The paper presents the results of numerical simulation of the effect of a long spark discharge on the mixing dynamics of an injected gas jet with supersonic air flow. The calculations were performed using the CFD software package FlowVision. The fuel was supplied using an injector located on the channel wall, and the discharge was organized near the wall downstream of the injector. Simulation of electrical spark discharge was performed using a volumetric heat source. In order to describe the principal specifications of a plasma actuator to accelerate mixing in a supersonic flow (Mach number M = 2), the research involved varying the energy impact to the discharge in the range of 100–500 mJ per pulse, determining the influence of the shape and location of the discharge. A study of the fuel injection modes in a supersonic air flow has been carried out and an optimal gas jet outflow regime has been found to study the effect of a spark discharge. A method has been developed for analyzing the disturbance pattern of the fuel-oxidant interface caused by the operation of a pulsed spark discharge. A program was prepared in the LabView software environment for obtaining quantitative characteristics for further comparison with the results obtained in the experiment.
The simulation results allow us to conclude that the long spark discharge located along the flow downstream of the injector provides the maximum increase in the interface between the jet of fuel and the main flow. A typical repetition frequency of discharge pulses in a pulse-periodic mode should be more than 6 kHz with a discharge length of ~10 mm to ensure a continuous effect on the mixing at a flow velocity of 500 m/s.
-
Моделирование физических процессов воздействия мощного ядерного взрыва на астероид
Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 861-877В рамках проблемы предотвращения астероидно-кометной угрозы выполнен физический и теоретический анализ процессов воздействия различных факторов надповерхностного ядерного взрыва достаточно высокой энергии на астероид во внеатмосферных условиях космического пространства. Показано, что в соответствии с энергией и проницаемой способностью плазмы продуктов взрыва, рентгеновского и гамма-нейтронного излучения на поверхности астероида, обращенной к взрыву, образуется слоистая структура с разной плотностью энергии, зависящей от угловых координат. Для каждого слоя выяснен временной характер трансформации энергии внутри него и определены роли различных фото- и столкновительных процессов. Воздействие высокоскоростного потока плазмы носит эрозионный характер, при этом импульс плазмы передается астероиду. Показано, что в тонком слое поглощения рентгеновского излучения вещество астероида разогревается до высоких температур, и в результате его расширения формируется импульс отдачи, который не является определяющим из-за малой массы расширяющейся высокотемпературной плазмы. Расчеты показали, что основной импульс, полученный астероидом, связан с уносом разогретого слоя вещества, образованного нейтронным потоком (7.5 · 1014 г · см/с). Показано, что астероид с радиусом ~100 м приобретает при этом скорость ≈ 100 см/с. Расчеты выполнены с учетом затрат энергии взрыва на разрушение аморфной структуры вещества астероида (~1 эВ/атом = 3.8 · 1010 эрг/г) и на ионизацию в области высокотемпературного слоя. На основе аналогичного анализа получено приближенное выражение для оценки среднего размера осколков при возможном разрушении астероида ударными волнами, образующимися внутри него под действием импульсов давления. Выполнен физический эксперимент в лабораторных условиях, имитирующий фрагментацию каменного астероида и подтвердивший справедливость полученной зависимости от выбранных значений определенных параметров. В результате численных исследований воздействия взрыва, произведенных на различном расстоянии от поверхности астероида, показано, что учет реальной геометрии отколочного слоя дает оптимальную высоту для формирования максимального импульса астероида примерно в 1.5 раза большую, чем аналогичные оценки по упрощенной модели. Предложена двухэтапная концепция воздействия ядерных взрывов на астероид с использованием радиолокационных средств наведения. Проанализировано возможное влияние возникающих ионизационных помех на радиолокационное слежение за разлетом крупных осколков астероида в условиях пространственно-временной эволюции всех элементов исследуемой динамической системы.
Modeling the physical processes of a powerful nuclear explosion on an asteroid
Computer Research and Modeling, 2019, v. 11, no. 5, pp. 861-877As part of the paper, a physical and theoretical analysis of the impact processes of various factors of a highaltitude and high-energy nuclear explosion on the asteroid in extra-atmospheric conditions of open space is done. It is shown that, in accordance with the energy and permeability of the plasma of explosion products, X-ray and gamma-neutron radiation, a layered structure with a different energy density depending on angular coordinates is formed on the surface of the asteroid. The temporal patterns of the energy transformation for each layer is clarified and the roles of various photo- and collision processes are determined. The effect of a high-speed plasma flow is erosive in nature, and the plasma pulse is transmitted to the asteroid. The paper presents that in a thin layer of x-ray absorption, the asteroid substance is heated to high temperatures and as a result of its expansion, a recoil impulse is formed, which is not decisive due to the small mass of the expanding high-temperature plasma. Calculations shows that the main impulse received by an asteroid is associated with the entrainment of a heated layer of a substance formed by a neutron flux (7.5 E 1014 g E cm/s). It is shown that an asteroid with a radius of ~100 m acquires a velocity of . 100 cm/s. The calculations were performed taking into account the explosion energy spent on the destruction of the amorphous structure of the asteroid material (~1 eV/atom = 3.8 E 1010 erg/g) and ionization in the region of the high-temperature layer. Based on a similar analysis, an approximation is obtained for estimating the average size of fragments in the event of the possible destruction of the asteroid by shock waves generated inside it under the influence of pressure impulses. A physical experiment was conducted in laboratory conditions, simulating the fragmentation of a stone asteroid and confirming the validity of the obtained dependence on the selected values of certain parameters. As a result of numerical studies of the effects of the explosion, carried out at different distances from the surface of the asteroid, it is shown that taking into account the real geometry of the spallation layer gives the optimal height for the formation of the maximum asteroid momentum by a factor of 1.5 greater than similar estimates according to the simplified model. A two-stage concept of the impact of nuclear explosions on an asteroid using radar guidance tools is proposed. The paper analyzes the possible impact of the emerging ionization interference on the radar tracking of the movement of large fragments of the asteroid in the space-time evolution of all elements of the studied dynamic system.
-
Численное моделирование естественной конвекции неньютоновской жидкости в замкнутой полости
Компьютерные исследования и моделирование, 2020, т. 12, № 1, с. 59-72В настоящей работе рассматривался нестационарный процесс естественно-конвективного теплопереноса в замкнутой квадратной полости, заполненной неньютоновской жидкостью, при наличии локального изотермического источника энергии, который располагался на нижней стенке рассматриваемой области. Вертикальные границы считались изотермически охлаждающими, горизонтальные — полностью теплоизолированными. Характер поведения неньютоновской жидкости соответствовал степенному закону Оствальда–де-Вилла. Исследуемый процесс описывался нестационарными дифференциальными уравнениями в безразмерных преобразованных переменных «функция тока – завихренность – температура». Данная методика позволяет исключить поле давления из числа неизвестных параметров, а обезразмеривание позволяет обобщить полученные результаты на множество физических постановок. Сформулированная математическая модель с соответствующими граничными условиями решалась на основе метода конечных разностей. Алгебраическое уравнение для функции тока решалось методом последовательной нижней релаксации. Дискретные аналоги уравнений дисперсии завихренности и энергии решались методом прогонки. Разработанный численный алгоритм был детально протестирован на классе модельных задач и получил хорошее согласование с другими авторами. Также в ходе исследования был проведен анализ влияния сеточных параметров на структуру течения в полости, на основе которого была выбрана оптимальная размерность сетки.
В результате численного моделирования нестационарных режимов естественной конвекции неньютоновской степенной жидкости в замкнутой квадратной полости с локальным изотермическим источником энергии был проведен анализ влияния характеризующих параметров: числа Рэлея в диапазоне 104–106, индекса степенного закона $n = 0.6–1.4$, а также положения нагревающего элемента на структуру течения и теплоперенос внутри полости. Анализ проводился на основе полученных распределений линий тока и изотерм в полости, а также на основе зависимостей среднего числа Нуссельта. В ходе работы установлено, что псевдопластические жидкости $(n < 1)$ интенсифицируют теплосъем с поверхности нагревателя. Увеличение числа Рэлея и центральное расположение нагревающего элемента также соответствуют охлаждению источника тепла.
Numerical modeling of the natural convection of a non-Newtonian fluid in a closed cavity
Computer Research and Modeling, 2020, v. 12, no. 1, pp. 59-72In this paper, a time-dependent natural convective heat transfer in a closed square cavity filled with non- Newtonian fluid was considered in the presence of an isothermal energy source located on the lower wall of the region under consideration. The vertical boundaries were kept at constant low temperature, while the horizontal walls were completely insulated. The behavior of a non-Newtonian fluid was described by the Ostwald de Ville power law. The process under study was described by transient partial differential equations using dimensionless non-primitive variables “stream function – vorticity – temperature”. This method allows excluding the pressure field from the number of unknown parameters, while the non-dimensionalization allows generalizing the obtained results to a variety of physical formulations. The considered mathematical model with the corresponding boundary conditions was solved on the basis of the finite difference method. The algebraic equation for the stream function was solved by the method of successive lower relaxation. Discrete analogs of the vorticity equation and energy equation were solved by the Thomas algorithm. The developed numerical algorithm was tested in detail on a class of model problems and good agreement with other authors was achieved. Also during the study, the mesh sensitivity analysis was performed that allows choosing the optimal mesh.
As a result of numerical simulation of unsteady natural convection of a non-Newtonian power-law fluid in a closed square cavity with a local isothermal energy source, the influence of governing parameters was analyzed including the impact of the Rayleigh number in the range 104–106, power-law index $n = 0.6–1.4$, and also the position of the heating element on the flow structure and heat transfer performance inside the cavity. The analysis was carried out on the basis of the obtained distributions of streamlines and isotherms in the cavity, as well as on the basis of the dependences of the average Nusselt number. As a result, it was established that pseudoplastic fluids $(n < 1)$ intensify heat removal from the heater surface. The increase in the Rayleigh number and the central location of the heating element also correspond to the effective cooling of the heat source.
-
Метод построения прогнозной нейросетевой модели временного ряда
Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 737-756В данной статье рассматривается метод построения прогнозной нейросетевой модели временного ряда, основанный на определении состава входных переменных, построения обучающей выборки и самого обучения с использованием метода обратного распространения ошибки. Традиционные методы построения прогнозных моделей временного ряда (авторегрессионной модели, модели скользящего среднего или модели авторегрессии – скользящего среднего) позволяют аппроксимировать временной ряд линейной зависимостью текущего значения выходной переменной от некоторого количества ее предыдущих значений. Такое ограничение, как линейность зависимости, приводит к значительным ошибкам при прогнозировании.
Технологии интеллектуального анализа с применением нейросетевого моделирования позволяют аппроксимировать временной ряд нелинейной зависимостью. Причем процесс построения нейросетевой модели (определение состава входных переменных, числа слоев и количества нейронов в слоях, выбор функций активации нейронов, определение оптимальных значений весов связей нейронов) позволяет получить прогнозную модель в виде аналитической нелинейной зависимости.
Одним из ключевых моментов при построении нейросетевых моделей в различных прикладных областях, влияющих на ее адекватность, является определение состава ее входных переменных. Состав входных переменных традиционно выбирается из некоторых физических соображений или методом подбора. Для задачи определения состава входных переменных прогнозной нейросетевой модели временного ряда предлагается использовать особенности поведения автокорреляционной и частной автокорреляционной функций.
В работе предлагается метод определения состава входных переменных нейросетевых моделей для стационарных и нестационарных временных рядов, базирующийся на построении и анализе автокорреляционных функций. На основе предложенного метода разработаны алгоритм и программа в среде программирования Python, определяющая состав входных переменных прогнозной нейросетевой модели — персептрона, а также строящая саму модель. Осуществлена экспериментальная апробация предложенного метода на примере построения прогнозной нейросетевой модели временного ряда, отражающего потребление электроэнергии в разных регионах США, открыто опубликованной компанией PJM Interconnection LLC (PJM) — региональной сетевой организацией в Соединенных Штатах. Данный временной ряд является нестационарным и характеризуется наличием как тренда, так и сезонности. Прогнозирование очередных значений временного ряда на ос- нове предыдущих значений и построенной нейросетевой модели показало высокую точность аппроксимации, что доказывает эффективность предлагаемого метода.
Ключевые слова: временной ряд, прогнозирование, нейросетевая модель, персептрон, тренд, сезонность, стационарный ряд, нестационарный ряд, автокорреляционная функция, частная автокорреляционная функция, точность аппроксимации.
A method of constructing a predictive neural network model of a time series
Computer Research and Modeling, 2020, v. 12, no. 4, pp. 737-756This article studies a method of constructing a predictive neural network model of a time series based on determining the composition of input variables, constructing a training sample and training itself using the back propagation method. Traditional methods of constructing predictive models of the time series are: the autoregressive model, the moving average model or the autoregressive model — the moving average allows us to approximate the time series by a linear dependence of the current value of the output variable on a number of its previous values. Such a limitation as linearity of dependence leads to significant errors in forecasting.
Mining Technologies using neural network modeling make it possible to approximate the time series by a nonlinear dependence. Moreover, the process of constructing of a neural network model (determining the composition of input variables, the number of layers and the number of neurons in the layers, choosing the activation functions of neurons, determining the optimal values of the neuron link weights) allows us to obtain a predictive model in the form of an analytical nonlinear dependence.
The determination of the composition of input variables of neural network models is one of the key points in the construction of neural network models in various application areas that affect its adequacy. The composition of the input variables is traditionally selected from some physical considerations or by the selection method. In this work it is proposed to use the behavior of the autocorrelation and private autocorrelation functions for the task of determining the composition of the input variables of the predictive neural network model of the time series.
In this work is proposed a method for determining the composition of input variables of neural network models for stationary and non-stationary time series, based on the construction and analysis of autocorrelation functions. Based on the proposed method in the Python programming environment are developed an algorithm and a program, determining the composition of the input variables of the predictive neural network model — the perceptron, as well as building the model itself. The proposed method was experimentally tested using the example of constructing a predictive neural network model of a time series that reflects energy consumption in different regions of the United States, openly published by PJM Interconnection LLC (PJM) — a regional network organization in the United States. This time series is non-stationary and is characterized by the presence of both a trend and seasonality. Prediction of the next values of the time series based on previous values and the constructed neural network model showed high approximation accuracy, which proves the effectiveness of the proposed method.
-
Модифицированный метод Гаусса–Ньютона для решения гладкой системы нелинейных уравнений
Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 697-723В работе предлагается новая версия метода Гаусса–Ньютона для решения системы нелинейных уравнений, основанная на идеях использования верхней оценки нормы невязки системы уравнений и квадратичной регуляризации. Предложенная версия метода Гаусса–Ньютона на практике фактически задает целое параметризованное семейство методов решения систем нелинейных уравнений и задач восстановления регрессионной зависимости. Разработанное семейство методов Гаусса–Ньютона состоит целиком из итеративных методов, включающих в себя также специальные формы алгоритмов Левенберга–Марквардта, с обобщением на случаи применения в неевклидовых нормированных пространствах. В разработанных методах используется локальная модель, осуществляющая параметризованное проксимальное отображение и допускающая на практике применение неточного оракула в формате «черного ящика» с ограничением на точность вычисления и на сложность вычисления. Для разработанного семейства методов приведен анализ эффективности в терминах количества итераций алгоритма, точности и сложности представления локальной модели и вычисления оракула, параметров размерности решаемой задачи с выводом локальной и глобальной сходимости при использовании произвольного оракула. В работе представлены условия глобальной сублинейной сходимости для предложенного семейства методов решения системы нелинейных уравнений, состоящих из гладких по Липшицу функций. В рамках дополнительных естественных предположений о невырожденности системы нелинейных функций установлена локальная суперлинейная сходимость для рассмотренного семейства методов. При выполнении условия Поляка–Лоясиевича для системы нелинейных уравнений доказана локальная и глобальная линейная сходимость рассмотренных методов Гаусса–Ньютона. Помимо теоретического обоснования методов, в работе рассматриваются вопросы их практической реализации. В частности, в проведенных экспериментах для точного оракула приводятся схемы эффективного вычисления в зависимости от параметров размерности решаемой задачи. Предложенное семейство методов объединяет в себе несколько существующих и часто используемых на практике модификаций метода Гаусса–Ньютона, позволяя получить гибкий и удобный в использовании метод, реализуемый на практике с помощью стандартных техник выпуклой оптимизации и вычислительной линейной алгебры.
Ключевые слова: системы нелинейных уравнений, нелинейная регрессия, метод Гаусса–Ньютона, алгоритм Левенберга–Марквардта, методы доверительной области, невыпуклая оптимизация, неточное проксимальное отображение, неточный оракул, условие Поляка–Лоясиевича, оценка сложности.
Modified Gauss–Newton method for solving a smooth system of nonlinear equations
Computer Research and Modeling, 2021, v. 13, no. 4, pp. 697-723In this paper, we introduce a new version of Gauss–Newton method for solving a system of nonlinear equations based on ideas of the residual upper bound for a system of nonlinear equations and a quadratic regularization term. The introduced Gauss–Newton method in practice virtually forms the whole parameterized family of the methods solving systems of nonlinear equations and regression problems. The developed family of Gauss–Newton methods completely consists of iterative methods with generalization for cases of non-euclidean normed spaces, including special forms of Levenberg–Marquardt algorithms. The developed methods use the local model based on a parameterized proximal mapping allowing us to use an inexact oracle of «black–box» form with restrictions for the computational precision and computational complexity. We perform an efficiency analysis including global and local convergence for the developed family of methods with an arbitrary oracle in terms of iteration complexity, precision and complexity of both local model and oracle, problem dimensionality. We present global sublinear convergence rates for methods of the proposed family for solving a system of nonlinear equations, consisting of Lipschitz smooth functions. We prove local superlinear convergence under extra natural non-degeneracy assumptions for system of nonlinear functions. We prove both local and global linear convergence for a system of nonlinear equations under Polyak–Lojasiewicz condition for proposed Gauss– Newton methods. Besides theoretical justifications of methods we also consider practical implementation issues. In particular, for conducted experiments we present effective computational schemes for the exact oracle regarding to the dimensionality of a problem. The proposed family of methods unites several existing and frequent in practice Gauss–Newton method modifications, allowing us to construct a flexible and convenient method implementable using standard convex optimization and computational linear algebra techniques.
-
Оптимизация планирования выполнения пакетов заданий в многостадийных системах при ограничениях и формировании комплектов
Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 917-946Современные методы комплексного планирования выполнения пакетов заданий в многостадийных системах характеризуются наличием ограничений на размерность решаемой задачи, невозможностью гарантированного получения эффективных решений при различных значениях ее входных параметров, а также невозможностью учета условия формирования комплектов из результатов и ограничения на длительности интервалов времени функционирования системы. Для решения задачи планирования выполнения пакетов заданий при формировании комплектов результатов и ограничении на длительности интервалов времени функционирования системы реализована декомпозиция обобщенной функции системы на совокупность иерархически взаимосвязанных подфункций. Применение декомпозиции позволило использовать иерархический подход для планирования выполнения пакетов заданий в многостадийных системах, предусматривающий определение решений по составам пакетов заданий на первом уровне иерархии, решений по составам групп пакетов заданий, выполняемых в течение временных интервалов ограниченной длительности, на втором уровне и расписаний выполнения пакетов на третьем уровне иерархии. С целью оценки оптимальности решений по составам пакетов результаты их выполнения, полученные в течение заданных временных интервалов, распределяются по комплектам. Для определения комплексных решений применен аппарат теории иерархических игр. Построена модель иерархической игры для принятия решений по составам пакетов, групп пакетов и расписаниям выполнения пакетов, представляющая собой систему иерархически взаимосвязанных критериев оптимизации решений. В модели учтены условие формирования комплектов из результатов выполнения пакетов заданий и ограничение на длительность интервалов времени ее функционирования. Задача определения составов пакетов заданий и групп пакетов заданий является NP-трудной, поэтому для ее решения требуется применение приближенных методов оптимизации. С целью оптимизации групп пакетов заданий реализовано построение метода формирования начальных решений по их составам, которые в дальнейшем оптимизируются. Также сформулирован алгоритм распределения по комплектам результатов выполнения пакетов заданий, полученных в течение временных интервалов ограниченной длительности. Предложен метод локальной оптимизации решений по составам групп пакетов, в соответствии с которым из групп исключаются пакеты, результаты выполнения которых не входят в комплекты, и добавляются пакеты, не включенные ни в одну из групп. Выполнена программная реализация рассмотренного метода комплексной оптимизации составов пакетов заданий, групп пакетов заданий и расписаний выполнения пакетов заданий из групп (в том числе реализация метода оптимизации составов групп пакетов заданий). С ее использованием проведены исследования особенностей рассматриваемой задачи планирования. Сформулированы выводы, касающиеся зависимости эффективности планирования выполнения пакетов заданий в многостадийных системах при введенных условиях от входных параметров задачи. Использование метода локальной оптимизации составов групп пакетов заданий позволяет в среднем на 60% увеличить количество формируемых комплектов из результатов выполнения заданий в пакетах из групп по сравнению с фиксированными группами (не предполагающими оптимизацию).
Ключевые слова: пакеты заданий, многостадийная система, комплекты результатов, расписание, ограничение длительности временных интервалов работы системы.
Optimization of task package execution planning in multi-stage systems under restrictions and the formation of sets
Computer Research and Modeling, 2021, v. 13, no. 5, pp. 917-946Modern methods of complex planning the execution of task packages in multistage systems are characterized by the presence of restrictions on the dimension of the problem being solved, the impossibility of guaranteed obtaining effective solutions for various values of its input parameters, as well as the impossibility of registration the conditions for the formation of sets from the result and the restriction on the interval duration of time of the system operating. The decomposition of the generalized function of the system into a set of hierarchically interconnected subfunctions is implemented to solve the problem of scheduling the execution of task packages with generating sets of results and the restriction on the interval duration of time for the functioning of the system. The use of decomposition made it possible to employ the hierarchical approach for planning the execution of task packages in multistage systems, which provides the determination of decisions by the composition of task groups at the first level of the hierarchy decisions by the composition of task packages groups executed during time intervals of limited duration at the second level and schedules for executing packages at the third level the hierarchy. In order to evaluate decisions on the composition of packages, the results of their execution, obtained during the specified time intervals, are distributed among the packages. The apparatus of the theory of hierarchical games is used to determine complex solutions. A model of a hierarchical game for making decisions by the compositions of packages, groups of packages and schedules of executing packages is built, which is a system of hierarchically interconnected criteria for optimizing decisions. The model registers the condition for the formation of sets from the results of the execution of task packages and restriction on duration of time intervals of its operating. The problem of determining the compositions of task packages and groups of task packages is NP-hard; therefore, its solution requires the use of approximate optimization methods. In order to optimize groups of task packages, the construction of a method for formulating initial solutions by their compositions has been implemented, which are further optimized. Moreover, a algorithm for distributing the results of executing task packages obtained during time intervals of limited duration by sets is formulated. The method of local solutions optimization by composition of packages groups, in accordance with which packages are excluded from groups, the results of which are not included in sets, and packages, that aren’t included in any group, is proposed. The software implementation of the considered method of complex optimization of the compositions of task packages, groups of task packages, and schedules for executing task packages from groups (including the implementation of the method for optimizing the compositions of groups of task packages) has been performed. With its use, studies of the features of the considered planning task are carried out. Conclusion are formulated concerning the dependence of the efficiency of scheduling the execution of task packages in multistage system under the introduced conditions from the input parameters of the problem. The use of the method of local optimization of the compositions of groups of task packages allows to increase the number of formed sets from the results of task execution in packages from groups by 60% in comparison with fixed groups (which do not imply optimization).
-
Деформирование жесткопластических тел с памятью формы при переменных нагрузках и температуре
Компьютерные исследования и моделирование, 2022, т. 14, № 1, с. 63-77Деформирование сплошных сред из материалов с памятью формы под влиянием возрастающей нагрузки и при постоянной температуре протекает обычным для металлов идеальным упругопластическим образом. При этом величина максимальных упругих деформаций много меньше предельных пластических. Восстановление формы происходит при повышенной температуре и невысоком уровне напряжений. Феноменологически «обратное» деформирование аналогично с точностью до знака изменению формыпри активном загружении силами. Так как в неупругом процессе решающую роль играет пластическая деформация, то анализ механического поведения целесообразно провести в рамках идеальной жесткопластической модели с двумя поверхностями нагружения. В этой модели поверхностям нагружения отвечают два физических состояния материала: пластическое течение при высоких напряжениях и плавление при сравнительно невысокой температуре. Во втором параграфе формулируется задача деформирования жесткопластических сред при постоянной температуре в двух формах: в виде принципа виртуальных скоростей с условием текучести Мизеса и как требование минимальности диссипативного функционала. Доказываются равносильность принятых формулировок и существование обобщенных решений в обоих принципах. В третьем параграфе изучается жесткопластическая модель сплошной среды при изменяющейся температуре с двумя поверхностями нагружения. Для принятой модели формулируются два оптимальных принципа, связывающих внешние нагрузки и скорости перемещений точек среды как при активном нагружении, так и в процессе восстановления формыпр и нагревании. Доказано существование обобщенных скоростей для широкого класса трехмерных областей. Связь вариационных принципов и изменяющейся температуры обеспечивается включением в расчетную схему первого и второго начал термодинамики. Существенно, что в процессе доказательств используется только феноменологическое описание явления. Аустенитно-мартенситные превращения сплавов, которые часто являются основными при объяснении механического поведения материалов с памятью формы, не используются. В четвертом параграфе дано определение материалов с памятью формы как сплошных сред с двумя поверхностями нагружения, доказано существование решений в принятых ограничениях. Показана адекватность модели и опытов по деформированию материалов с памятью формы. В заключении формулируются математические задачи, которые представляются интересными в будущих исследованиях.
Ключевые слова: жесткопластические среды, внешние нагрузки, материалы с памятью формы, вариационные принципы, пластичность при различных температурах, законытер модинамики, обобщенные решения.
Deformation of shape memory rigid-plastic bodies under variable external loads and temperatures
Computer Research and Modeling, 2022, v. 14, no. 1, pp. 63-77Under increasing loading and at a constant temperature shape memory solids become deformed in an ideal elastic plastic way as other metals, and the maximum elastic strains are much less than the ultimate plastic ones. The shape is restored at the elevated temperature and low stress level. Phenomenologically, the «reverse» deformation is equivalent to the change in shape under active loading up to sign. Plastic deformation plays a leading role in a non-elastic process; thus, the mechanical behavior should be analyzed within the ideal rigid-plastic model with two loading surfaces. In this model two physical states of the material correspond to the loading surfaces: plastic flow under high stresses and melting at a relatively low temperature. The second section poses a problem of deformation of rigid-plastic bodies at the constant temperature in two forms: as a principle of virtual velocities with the von Mises yield condition and as a requirement of the minimum dissipative functionаl. The equivalence of the accepted definitions and the existence of the generalized solutions is proved for both principles. The third section studies the rigid-plastic model of the solid at the variable temperature with two loading surfaces. For the assumed model two optimal principles are defined that link the external loads and the displacement velocities of the solid points both under active loading and in the process of shape restoration under heating. The existence of generalized velocities is proved for the wide variety of 3D domains. The connection between the variational principles and the variable temperature is ensured by inclusion of the first and second principles of thermodynamics in the calculation model. It is essential that only the phenomenological description of the phenomenon is used in the proving process. The austenite-tomartensite transformations of alloys, which are often the key elements in explanations of the mechanical behavior of shape memory materials, are not used here. The fourth section includes the definition of the shape memory materials as solids with two loading surfaces and proves the existence of solutions within the accepted restrictions. The adequacy of the model and the experiments on deformation of shape memory materials is demonstrated. In the conclusion mathematical problems that could be interesting for future research are defined.
-
Редукция дисперсии для минимаксных задач с небольшой размерностью одной из переменных
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 257-275Статья посвящена выпукло-вогнутым седловым задачам, в которых целевая функция является суммой большого числа слагаемых. Такие задачи привлекают значительное внимание математического сообщества в связи с множеством приложений в машинном обучении, включая adversarial learning, adversarial attacks и robust reinforcement learning, и это лишь некоторые из них. Отдельные функции в сумме обычно представляют собой ошибку, связанную с объектом из выборки. Кроме того, формулировка допускает (возможно, негладкий) композитный член. Такие слагаемые часто отражают регуляризацию в задачах машинного обучения. Предполагается, что размерность одной из групп переменных относительно мала (около сотни или меньше), а другой — велика. Такой случай возникает, например, при рассмотрении двойственной формулировки задачи минимизации с умеренным числом ограничений. Предлагаемый подход основан на использовании метода секущей плоскости Вайды для минимизации относительно внешнего блока переменных. Этот алгоритм оптимизации особенно эффективен, когда размерность задачи не очень велика. Неточный оракул для метода Вайды вычисляется через приближенное решение внутренней задачи максимизации, которая решается ускоренным алгоритмом с редукцией дисперсии Katyusha. Таким образом, мы используем структуру задачи для достижения быстрой сходимости. В исследовании получены отдельные оценки сложности для градиентов различных компонент относительно различных переменных. Предложенный подход накладывает слабые предположения о целевой функции. В частности, не требуется ни сильной выпуклости, ни гладкости относительно низкоразмерной группы переменных. Количество шагов предложенного алгоритма, а также арифметическая сложность каждого шага явно зависят от размерности внешней переменной, отсюда предположение, что она относительно мала.
Ключевые слова: седловые задачи, методы первого порядка, методы секущей плоскости, редукция дисперсии.
Variance reduction for minimax problems with a small dimension of one of the variables
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 257-275The paper is devoted to convex-concave saddle point problems where the objective is a sum of a large number of functions. Such problems attract considerable attention of the mathematical community due to the variety of applications in machine learning, including adversarial learning, adversarial attacks and robust reinforcement learning, to name a few. The individual functions in the sum usually represent losses related to examples from a data set. Additionally, the formulation admits a possibly nonsmooth composite term. Such terms often reflect regularization in machine learning problems. We assume that the dimension of one of the variable groups is relatively small (about a hundred or less), and the other one is large. This case arises, for example, when one considers the dual formulation for a minimization problem with a moderate number of constraints. The proposed approach is based on using Vaidya’s cutting plane method to minimize with respect to the outer block of variables. This optimization algorithm is especially effective when the dimension of the problem is not very large. An inexact oracle for Vaidya’s method is calculated via an approximate solution of the inner maximization problem, which is solved by the accelerated variance reduced algorithm Katyusha. Thus, we leverage the structure of the problem to achieve fast convergence. Separate complexity bounds for gradients of different components with respect to different variables are obtained in the study. The proposed approach is imposing very mild assumptions about the objective. In particular, neither strong convexity nor smoothness is required with respect to the low-dimensional variable group. The number of steps of the proposed algorithm as well as the arithmetic complexity of each step explicitly depend on the dimensionality of the outer variable, hence the assumption that it is relatively small.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"