Все выпуски
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Анализ основного уравнения физико-статистического подхода теории надежности технических систем
Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 721-735Проведена верификация физико-статистического подхода теории надежности для простейших случаев, показавшая его правомочность. Представлено аналитическое решение одномерного основного уравнения физико-статистического подхода в предположении стационарной скорости деградации. С математической точки зрения это уравнение является известным уравнением непрерывности, где роль плотности вещества играет плотность функции распределения изделий в фазовом пространстве его характеристик, а роль скорости жидкости играет интенсивность (скорость) деградационных процессов. Последняя связывает общий формализм с конкретикой механизмов деградации. С помощью метода характеристик аналитически рассмотрены случаи постоянной по координате, линейной и квадратичной скоростей деградации. В первых двух случаях результаты соответствуют физической интуиции. При постоянной скорости деградации форма начального распределения сохраняется, а само оно равномерно сдвигается от центра. При линейной скорости деградации распределение либо сужается вплоть до узкого пика (в пределе сингулярного), либо расширяется, при этом максимум сдвигается на периферию с экспоненциально растущей скоростью. Форма распределения также сохраняется с точностью до параметров. Для начального нормального распределения аналитически получены координаты наибольшего значения максимума распределения при его возвратном движении.
В квадратичном случае формальное решение демонстрирует контринтуитивное поведение. Оно заключается в том, что решение однозначно определено лишь на части бесконечной полуплоскости, обращается в нуль вместе со всеми производными на границе и неоднозначно при переходе за границу. Если продолжить его на другую область в соответствии с аналитическим решением, то оно имеет двухгорбый вид, сохраняет количество вещества и, что лишено физического смысла, периодично во времени. Если продолжить его нулем, то нарушается свойство консервативности. Аномальности квадратичного случая дается объяснение, хотя и нестрогое, через аналогию движения материальной точки с ускорением, пропорциональным квадрату скорости. Здесь мы имеем дело с математическим курьезом. Для всех случаев приведены численные расчеты. Дополнительно рассчитываются энтропия вероятностного распределения и функция надежности, а также прослеживается их корреляционная связь.
Ключевые слова: деградация, надежность, наносистема, физико-статистический подход, энтропия, уравнение непрерывности.
Analysis of the basic equation of the physical and statistical approach within reliability theory of technical systems
Computer Research and Modeling, 2020, v. 12, no. 4, pp. 721-735Verification of the physical-statistical approach within reliability theory for the simplest cases was carried out, which showed its validity. An analytical solution of the one-dimensional basic equation of the physicalstatistical approach is presented under the assumption of a stationary degradation rate. From a mathematical point of view this equation is the well-known continuity equation, where the role of density is played by the density distribution function of goods in its characteristics phase space, and the role of fluid velocity is played by intensity (rate) degradation processes. The latter connects the general formalism with the specifics of degradation mechanisms. The cases of coordinate constant, linear and quadratic degradation rates are analyzed using the characteristics method. In the first two cases, the results correspond to physical intuition. At a constant rate of degradation, the shape of the initial distribution is preserved, and the distribution itself moves equably from the zero. At a linear rate of degradation, the distribution either narrows down to a narrow peak (in the singular limit), or expands, with the maximum shifting to the periphery at an exponentially increasing rate. The distribution form is also saved up to the parameters. For the initial normal distribution, the coordinates of the largest value of the distribution maximum for its return motion are obtained analytically.
In the quadratic case, the formal solution demonstrates counterintuitive behavior. It consists in the fact that the solution is uniquely defined only on a part of an infinite half-plane, vanishes along with all derivatives on the boundary, and is ambiguous when crossing the boundary. If you continue it to another area in accordance with the analytical solution, it has a two-humped appearance, retains the amount of substance and, which is devoid of physical meaning, periodically over time. If you continue it with zero, then the conservativeness property is violated. The anomaly of the quadratic case is explained, though not strictly, by the analogy of the motion of a material point with an acceleration proportional to the square of velocity. Here we are dealing with a mathematical curiosity. Numerical calculations are given for all cases. Additionally, the entropy of the probability distribution and the reliability function are calculated, and their correlation is traced.
-
Разностный метод решения уравнения конвекции–диффузии с неклассическим граничным условием в многомерной области
Компьютерные исследования и моделирование, 2022, т. 14, № 3, с. 559-579В работе изучается многомерное уравнение конвекции-диффузии с переменными коэффициентами и неклассическим граничным условием. Рассмотрены два случая: в первом случае первое граничное условие содержит интеграл от неизвестной функции по переменной интегрирования $x_\alpha^{}$, а во втором случае — интеграл от неизвестной функции по переменной интегрирования $\tau$, обозначающий эффект памяти. Подобные задачи возникают при изучении переноса примеси вдоль русла рек. Для приближенного решения поставленной задачи предложена эффективная в плане экономичности, устойчивости и сходимости разностная схема — локально-одномерная разностная схема А.А. Самарского с порядком аппроксимации~$O(h^2+\tau)$. Ввиду того что уравнение содержит первую производную от неизвестной функции по пространственной переменной $x_\alpha^{}$, для повышения порядка точности локально-одномерной схемы используется известный метод, предложенный А.А. Самарским при построении монотонной схемы второго порядка точности по $h_\alpha^{}$ для уравнения параболического типа общего вида, содержащего односторонние производные, учитывающие знак $r_\alpha^{}(x,\,t)$. Для повышения до второго порядка точности по $h_\alpha^{}$ краевых условий третьего рода воспользовались уравнением в предположении, что оно справедливо и на границах. Исследование единственности и устойчивости решения проводилось с помощью метода энергетических неравенств. Получены априорные оценки решения разностной задачи в $L_2^{}$-норме, откуда следуют единственность решения, непрерывная и равномерная зависимость решения разностной задачи от входных данных, а также сходимость решения локально-одномерной разностной схемы к решению исходной дифференциальной задачи в $L_2^{}$-норме со скоростью, равной порядку аппроксимации разностной схемы. Для двумерной задачи построен алгоритм численного решения, проведены численные расчеты тестовых примеров, иллюстрирующие полученные в работе теоретические результаты.
Ключевые слова: параболическое уравнение, многомерное уравнение, разностные схемы, локально-одномерная схема, априорная оценка, устойчивость, сходимость.
A difference method for solving the convection–diffusion equation with a nonclassical boundary condition in a multidimensional domain
Computer Research and Modeling, 2022, v. 14, no. 3, pp. 559-579The paper studies a multidimensional convection-diffusion equation with variable coefficients and a nonclassical boundary condition. Two cases are considered: in the first case, the first boundary condition contains the integral of the unknown function with respect to the integration variable $x_\alpha^{}$, and in the second case, the integral of the unknown function with respect to the integration variable $\tau$, denoting the memory effect. Similar problems arise when studying the transport of impurities along the riverbed. For an approximate solution of the problem posed, a locally one-dimensional difference scheme by A.A. Samarskii with order of approximation $O(h^2+\tau)$. In view of the fact that the equation contains the first derivative of the unknown function with respect to the spatial variable $x_\alpha^{}$, the wellknown method proposed by A.A. Samarskii in constructing a monotonic scheme of the second order of accuracy in $h_\alpha^{}$ for a general parabolic type equation containing one-sided derivatives taking into account the sign of $r_\alpha^{}(x,t)$. To increase the boundary conditions of the third kind to the second order of accuracy in $h_\alpha^{}$, we used the equation, on the assumption that it is also valid at the boundaries. The study of the uniqueness and stability of the solution was carried out using the method of energy inequalities. A priori estimates are obtained for the solution of the difference problem in the $L_2^{}$-norm, which implies the uniqueness of the solution, the continuous and uniform dependence of the solution of the difference problem on the input data, and the convergence of the solution of the locally onedimensional difference scheme to the solution of the original differential problem in the $L_2^{}$-norm with speed equal to the order of approximation of the difference scheme. For a two-dimensional problem, a numerical solution algorithm is constructed.
-
Сетчатые развертывающиеся оболочки из полос, образованных трапециевидными пластинами
Компьютерные исследования и моделирование, 2012, т. 4, № 1, с. 63-73Изучаются развертывающиеся системы, составленные из набора трапециевидных пластин. Средние линии пластин в первоначальном положении пакета представляют собой плоскую кривую. Доказывается, что при разворачивании пакета из тонких пластинок, образуется поверхность, аппроксимирующая оболочку практически любой кривизны. Строится кинематика континуальной модели методом подвижного репера Картана, обобщающая ранее опубликованные результаты авторов. Показаны приложения к оболочкам вращения. Представлены экспериментальные модели развертывающихся систем.
Ключевые слова: континуальные развертывающиеся системы, репер Картана, оболочки вращения, экспериментальные модели.
Latticed deployable shells made of strips assembled from trapezoid plates
Computer Research and Modeling, 2012, v. 4, no. 1, pp. 63-73Просмотров за год: 1. Цитирований: 3 (РИНЦ).This paper covers deployable systems assembled from a set of trapezium plates. The middles lines of the plates represent a plane curve in the original position of the package. It is proved that when the package of thin plates is unwrapped, a surface approximating a shell of nearly any curvature is formed. Kinematics of the continual model is analyzed by the method of Cartan moving hedron, extending the results the authors published earlier. Various applications of rotating shells are shown. Experimental models of deployable latticed systems are demonstrated.
-
Аппроксимация решения нестационарного уравнения теплопроводности методом вероятностных непрерывных асинхронных клеточных автоматов для одномерного случая
Компьютерные исследования и моделирование, 2012, т. 4, № 2, с. 293-301В статье рассматривается решение задач теплопроводности с помощью метода непрерывных асинхронных клеточных автоматов. Продемонстрировано согласование распределения температуры в образце между клеточно-автоматной моделью и точным аналитическим решением уравнения теплопереноса в определенный момент времени, что говорит о целесообразном использовании данного метода моделирования. Получена зависимость между временем одного клеточно-автоматного взаимодействия и размерностью клеточно-автоматного поля.
Approximation of the solution of the non-stationary equation of heat conductivity by the method of probabilistic continuous asynchronous cellular automats for a one-dimensional case
Computer Research and Modeling, 2012, v. 4, no. 2, pp. 293-301Просмотров за год: 10. Цитирований: 4 (РИНЦ).The solution of problems of heat conductivity by means of a method of continuous asynchronous cellular automats is considered in the article. Coordination of distribution of temperature in a sample at a given time between cellular automat model and the exact analytical solution of the equation of heattransfer is shown that speaks about expedient use of this method of modelling. Dependence between time of one cellular automatic interaction and dimension of a cellular automatic field is received.
-
Улучшение качества изображений в компьютерной томографии с помощью интегрального преобразования специального вида
Компьютерные исследования и моделирование, 2015, т. 7, № 5, с. 1033-1046В работе рассматривается вопрос об улучшении качества изображений, получаемых в задаче томографии. Задача заключается в нахождении границ неоднородностей (включений) в сплошной среде по результатам просвечивания этой среды потоком излучения. Предложено нелинейное интегральное преобразование специального вида, которое позволяет улучшить качество изображений по сравнению с тем, которое получали авторы ряда работ ранее. Метод реализован численно с помощью компьютерного моделирования. Проведено несколько расчетов с использованием данных для конкретных материалов. Полученные при этом результаты представлены рисунками и графическими изображениями.
Improvement of image quality in a computer tomography by means of integral transformation of a special kind
Computer Research and Modeling, 2015, v. 7, no. 5, pp. 1033-1046Просмотров за год: 6.The question on improvement of quality of images obtained in a tomography problem is considered. The problem consists in finding of boundaries of inhomogeneities (inclusions) in a continuous medium by results of X-ray radiography of this medium. A nonlinear integral transformation of a special kind is proposed which allows to improve quality of images obtained earlier at a set of papers. The method is realized numerically by the use of computer modelling. Some calculations are carried out with use of data for concrete materials. The results obtained are presented by drawings and graphic images.
-
Новые алгоритмы составления дифференциальных уравнений движения экзоскелета с переменной длиной звеньев и управлением в шарнирах-суставах
Компьютерные исследования и моделирование, 2017, т. 9, № 2, с. 201-210В статье рассматривается модель антропоморфного механизма типа экзоскелета со звеньями переменной длины. Комплексно рассмотрены четыре модели звеньев переменной длины: модель звена экзоскелета переменной длины с упругим элементом и абсолютно твердым весомым стержнем, модель телескопического звена; модель звена с массами в шарнирах-суставах и между ними, модель звена с произвольным количеством масс. Составлены дифференциальные уравнения движения в форме уравнений Лагранжа второго рода. На основе проведенного анализа дифференциальных уравнений движения для многозвенных стержневых механических систем типа экзосклета выявлена их структура, позволившая представить их в векторно-матричном виде. Впервые установлены общие закономерности построения матриц и получены обобщения выражений для элементов матриц в двухмерном случае. Приводятся новые рекуррентный и матричный методы составления дифференциальных уравнений движения. Предлагается единый подход к построению дифференциальных уравнений движения экзоскелета на основе разработанных рекуррентного и матричного методов записи дифференциальных уравнений движения экзоскелета. Проведено сопоставление времени составления дифференциальных уравнений движения предложенными методами, в сравнении с уравнениями Лагранжа второго рода, в системе компьютерной математики Mathematica. Осуществлено аналитическое исследование модели экзоскелета. Установлено, что для механизмов с $n$ подвижными звеньями решение задачи Коши для систем дифференциальных уравнений движения при любых начальных условиях существует, единственно и неограниченно продолжаемо. Управление экзоскелетом осуществляется с помощью крутящих моментов, расположенных в шарнирах-суставах в местах соединения звеньев и моделирующих управляющие воздействия. Выполнено численное исследование модели экзоскелета, проведено сопоставление результатов расчетов для экзоскелетов с различными моделями звеньев. Для численного исследования использованы эмпирические данные о человеке и его движениях. Установлено, что при выборе конструкции экзоскелета модель с сосредоточенными массами является предпочтительной, нежели модель с абсолютно твердым весомым стержнем, так как экзоскелет, обеспечивающий комфортабельные передвижения человека в нем, должен повторять свойства опорно-двигательного аппарата.
Ключевые слова: экзоскелет, звено переменной длины, шарнир-сустав, управление, дифференциальные уравнения движения, рекурсия, матрица, метод, интеграл энергии, численное решение.
New algorithms for composing differential equations of the motion of the exoskeleton with variable length of the links and the control of hinge-joint
Computer Research and Modeling, 2017, v. 9, no. 2, pp. 201-210Просмотров за год: 15. Цитирований: 2 (РИНЦ).The article discusses the model of the anthropomorphic type of mechanism of the exoskeleton with links of variable length. Four models of parts of variable length are considered comprehensively: the model link of the exoskeleton of variable length with a resilient member and a rigid strong core; the model of the telescopic link; the model link with the masses in the hinge-joint between them; the link model with an arbitrary number of masses. The differential equations of motion in the form of Lagrange equations of the second kind are made. On the basis of analysis of differential equations of motion for multi-link rod of a mechanical system type, exoskeleton revealed their structure, which allowed us to represent them in vector-matrix form. The General pattern of building matrices are established for the first time and the generalization of the expressions for elements of matrices in two-dimensional case are obtained. New recursive and matrix methods of composing of differential equations of motion are given. A unified approach to constructing differential equations of motion of the exoskeleton based on the developed recursive and matrix methods write differential equations of motion of the proposed exoskeleton. Comparison of the time of writing the differential equations of motion proposed methods, in comparison with the Lagrange equations of the second kind, in the system of computer mathematics Mathematica conducted. An analytical study of the model of the exoskeleton carried out. It was found that for mechanisms with n movable links of the Cauchy problem for systems of differential equations of motion for any initial conditions there is no single and unlimited continue. Control of the exoskeleton is accomplished using the torques which are located in the hinge-joints in the joints of the links and simulating control actions. Numerical investigation of a model of the exoskeleton is made, a comparison of results of calculations for exoskeletons with various models of units is held. A numerical study of the empirical evidence about the man and his movements is used. It is established that the choice structure of the exoskeleton model with lumped masses is more preferable to a model with perfectly rigid strong core. As an exoskeleton, providing comfortable movement of people, and you should repeat the properties of the musculoskeletal system.
-
Исследование влияния искрового разряда на смешение струи газообразного топлива со сверхзвуковым воздушным потоком
Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 849-860В работе представлены результаты численного моделирования влияния протяженного искрового разряда на динамику перемешивания инжектируемой газовой струи со сверхзвуковым воздушным потоком. Расчеты проводились в программном комплексе FlowVision. Подача топлива осуществляется при помощи инжектора, расположенного на стенке канала, а разряд организован вблизи стенки ниже по потоку относительно инжектора. Моделирование электрического искрового разряда выполнено при помощи объемного источника тепла. С целью описания принципиального вида плазменного актуатора для ускорения перемешивания в сверхзвуковом потоке (число Маха М = 2) в ходе исследования выполнено варьирование энерговклада в разряд в диапазоне 100–500 мДж на один импульс, а также определено влияние формы и местоположения разряда относительно топливного инжектора. Проведено исследование режимов инжекции топлива в сверхзвуковой воздушный поток и найден оптимальный режим истечения струи газа для исследования влияния искрового разряда на смешение. Разработан метод анализа картины возмущений границы раздела «топливо–окислитель», вызванных работой импульсного искрового разряда. Подготовлена программа в среде LabView для получения количественной характеристики для дальнейшего сравнения полученных результатов с экспериментальными данными.
Результаты моделирования позволяют сделать вывод, что протяженный искровой разряд, расположенный ниже по потоку относительно инжектора и расположенный вдоль потока, обеспечивает максимальное увеличение границы раздела между струей топлива и основным потоком. Типичная частота повторения импульсов разряда в импульсно-периодическом режиме должна составлять более 6 кГц при длине разряда ~10 мм, чтобы обеспечить постоянное влияние на смешение в потоке со скоростью 500 м/с.
Ключевые слова: искровой разряд, смешение, сверхзвуковой поток, плазменный актуатор, компьютерное моделирование.
The study of the discharge influence on mixing of gaseous fuel jet with the supersonic air flow
Computer Research and Modeling, 2019, v. 11, no. 5, pp. 849-860The paper presents the results of numerical simulation of the effect of a long spark discharge on the mixing dynamics of an injected gas jet with supersonic air flow. The calculations were performed using the CFD software package FlowVision. The fuel was supplied using an injector located on the channel wall, and the discharge was organized near the wall downstream of the injector. Simulation of electrical spark discharge was performed using a volumetric heat source. In order to describe the principal specifications of a plasma actuator to accelerate mixing in a supersonic flow (Mach number M = 2), the research involved varying the energy impact to the discharge in the range of 100–500 mJ per pulse, determining the influence of the shape and location of the discharge. A study of the fuel injection modes in a supersonic air flow has been carried out and an optimal gas jet outflow regime has been found to study the effect of a spark discharge. A method has been developed for analyzing the disturbance pattern of the fuel-oxidant interface caused by the operation of a pulsed spark discharge. A program was prepared in the LabView software environment for obtaining quantitative characteristics for further comparison with the results obtained in the experiment.
The simulation results allow us to conclude that the long spark discharge located along the flow downstream of the injector provides the maximum increase in the interface between the jet of fuel and the main flow. A typical repetition frequency of discharge pulses in a pulse-periodic mode should be more than 6 kHz with a discharge length of ~10 mm to ensure a continuous effect on the mixing at a flow velocity of 500 m/s.
-
Численное моделирование когерентных и турбулентных структур излучения методом нелинейных интегральных отображений
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 979-992Распространение устойчивых когерентных образований электромагнитного поля в нелинейных средах с меняющимися в пространстве параметрами может быть описано в рамках итераций нелинейных интегральных преобразований. Показано что для ряда актуальных геометрий задач нелинейной оптики численное моделирование путем сведения к динамическим системам с дискретным временем и непрерывными пространственными переменными, основанное на итерациях локальных нелинейных отображений Фейгенбаума и Икеды, а также нелокальных диффузионно-дисперсионных линейных интегральных преобразований, эквивалентно в довольно широком диапазоне параметров дифференциальным уравнениям в частных производных типа Гинзбурга–Ландау. Такие нелокальные отображения, представляющие собой при численной реализации произведения матричных операторов, оказываются устойчивыми численно-разностными схемами, обеспечивают быструю сходимость и адекватную аппроксимацию решений. Реалистичность данного подхода позволяет учитывать влияние шумов на нелинейную динамику путем наложения на расчетный массив чисел при каждой итерации пространственного шума, задаваемого в виде многомодового случайного процесса, и производить отбор устойчивых волновых конфигураций. Нелинейные волновые образования, описываемые данным методом, включают оптические фазовые сингулярности, пространственные солитоны и турбулентные состояния с быстрым затуханием корреляций. Определенный интерес представляют полученные данным численным методом периодические конфигурации электромагнитного поля, возникающие в результате фазовой синхронизации, такие как оптические решетки и самоорганизованные вихревые кластеры.
Ключевые слова: дискретные отображения, интегральные преобразования, солитоны, вихри, фронты переключения, вихревые решетки, хаос, турбулентность.
Numerical investigation of coherent and turbulent structures of light via nonlinear integral mappings
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 979-992The propagation of stable coherent entities of an electromagnetic field in nonlinear media with parameters varying in space can be described in the framework of iterations of nonlinear integral transformations. It is shown that for a set of geometries relevant to typical problems of nonlinear optics, numerical modeling by reducing to dynamical systems with discrete time and continuous spatial variables to iterates of local nonlinear Feigenbaum and Ikeda mappings and nonlocal diffusion-dispersion linear integral transforms is equivalent to partial differential equations of the Ginzburg–Landau type in a fairly wide range of parameters. Such nonlocal mappings, which are the products of matrix operators in the numerical implementation, turn out to be stable numerical- difference schemes, provide fast convergence and an adequate approximation of solutions. The realism of this approach allows one to take into account the effect of noise on nonlinear dynamics by superimposing a spatial noise specified in the form of a multimode random process at each iteration and selecting the stable wave configurations. The nonlinear wave formations described by this method include optical phase singularities, spatial solitons, and turbulent states with fast decay of correlations. The particular interest is in the periodic configurations of the electromagnetic field obtained by this numerical method that arise as a result of phase synchronization, such as optical lattices and self-organized vortex clusters.
Keywords: discrete maps, integral transforms, solitons, vortices, switching waves, vortex lattices, chaos, turbulence. -
Современные методы преодоления катастрофической забывчивости нейронных сетей и экспериментальная проверка вопросов их структуры
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 45-56В данной работе представлены результаты экспериментальной проверки некоторых вопросов, касающихся практического использования методов преодоления катастрофической забывчивости нейронных сетей. Проведено сравнение двух таких современных методов: метода эластичного закрепления весов (EWC, Elastic Weight Consolidation) и метода ослабления скоростей весов (WVA, Weight Velocity Attenuation). Разобраныих преимущества и недостатки в сравнении друг с другом. Показано, что метод эластичного закрепления весов (EWC) лучше применять в задачах, где требуется полностью сохранять выученные навыки на всех задачах в очереди обучения, а метод ослабления скоростей весов (WVA) больше подходит для задач последовательного обучения с сильно ограниченными вычислительными ресурсами или же когда требуется не точное сохранение всех навыков, а переиспользование репрезентаций и ускорение обучения от задачи к задаче. Проверено и подтверждено интуитивное предположение, что ослабление метода WVA необходимо применять к оптимизационному шагу, то есть к приращениям весов нейронной сети, а не к самому градиенту функции потерь, и это справедливо для любого градиентного оптимизационного метода, кроме простейшего стохастического градиентного спуска (SGD), для которого оптимизационный шаг и градиент функции потерь пропорциональны. Рассмотрен выбор оптимальной функции ослабления скоростей весов между гиперболической функцией и экспонентой. Показано, что гиперболическое убывание более предпочтительно, так как, несмотря на сравнимое качество при оптимальных значениях гиперпараметра метода WVA, оно более устойчиво к отклонениям гиперпараметра от оптимального значения (данный гиперпараметр в методе WVA обеспечивает баланс между сохранением старых навыков и обучением новой задаче). Приведены эмпирические наблюдения, которые подтверждают гипотезу о том, что оптимальное значение гиперпараметра не зависит от числа задач в очереди последовательного обучения. Следовательно, данный гиперпараметр может подбираться на небольшом числе задач, а использоваться — на более длинных последовательностях.
Ключевые слова: катастрофическая забывчивость, эластичное закрепление весов, EWC, ослабление скоростей весов, WVA, нейронные сети, последовательное обучение, машинное обучение, искусственный интеллект.
Modern ways to overcome neural networks catastrophic forgetting and empirical investigations on their structural issues
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 45-56This paper presents the results of experimental validation of some structural issues concerning the practical use of methods to overcome catastrophic forgetting of neural networks. A comparison of current effective methods like EWC (Elastic Weight Consolidation) and WVA (Weight Velocity Attenuation) is made and their advantages and disadvantages are considered. It is shown that EWC is better for tasks where full retention of learned skills is required on all the tasks in the training queue, while WVA is more suitable for sequential tasks with very limited computational resources, or when reuse of representations and acceleration of learning from task to task is required rather than exact retention of the skills. The attenuation of the WVA method must be applied to the optimization step, i. e. to the increments of neural network weights, rather than to the loss function gradient itself, and this is true for any gradient optimization method except the simplest stochastic gradient descent (SGD). The choice of the optimal weights attenuation function between the hyperbolic function and the exponent is considered. It is shown that hyperbolic attenuation is preferable because, despite comparable quality at optimal values of the hyperparameter of the WVA method, it is more robust to hyperparameter deviations from the optimal value (this hyperparameter in the WVA method provides a balance between preservation of old skills and learning a new skill). Empirical observations are presented that support the hypothesis that the optimal value of this hyperparameter does not depend on the number of tasks in the sequential learning queue. And, consequently, this hyperparameter can be picked up on a small number of tasks and used on longer sequences.
-
Идентификация модели объекта при наличии неизвестных возмущений с широким частотным диапазоном на основе перехода к приращениям сигналов и отбора данных
Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 315-337Работа посвящена проблеме создания модели со стационарными параметрами по ретроспективным данным в условиях неизвестных возмущений. Рассматривается случай, когда представительная выборка состояний объекта может быть сформирована с использованием ретроспективных данных, накопленных только в течение значительного интервала времени. При этом допускается, что неизвестные возмущения могут действовать в широком частотном диапазоне и могут иметь низкочастотные и трендовые составляющие. В такой ситуации включение в выборку данных разных временных периодов может привести к противоречиям и чрезвычайно снизить точность модели. В работе дан обзор подходов и способов согласования данных. При этом основное внимание уделено отбору данных. Дана оценка применимости различных вариантов отбора данных как инструмента снижения уровня неопределенности. Предложен метод идентификации модели объекта с самовыравниванием по данным, накопленным за значительный период времени в условиях неизвестных возмущений с широким частотным диапазоном. Метод ориентирован на создание модели со стационарными параметрами, не требующей периодической перенастройки под новые условия. Метод основан на совместном применении отбора данных и представлении данных отдельных периодов времени в виде приращений относительно начального для периода момента времени. Это позволяет уменьшить число параметров, которые характеризуют неизвестные возмущения при минимуме допущений, ограничивающих применение метода. В результате снижается размерность поисковой задачи и минимизируются вычислительные затраты, связанные с настройкой модели. Рассмотрены особенности применения метода при нелинейной модели. Метод использован при разработке модели закрытого охлаждения стали на агрегате непрерывного горячего оцинковании стальной полосы. Модель может использоваться при упреждающем управлении тепловыми процессами и при выборе скорости движения полосы. Показано, что метод делает возможным разработку модели тепловых процессов с секции закрытого охлаждения в условиях неизвестных возмущений, имеющих в том числе низкочастотные составляющие.
Ключевые слова: идентификация, большие данные, глобальная модель, приращения, неизвестные воздействия, отбор данных.
Identification of an object model in the presence of unknown disturbances with a wide frequency range based on the transition to signal increments and data sampling
Computer Research and Modeling, 2024, v. 16, no. 2, pp. 315-337The work is devoted to the problem of creating a model with stationary parameters using historical data under conditions of unknown disturbances. The case is considered when a representative sample of object states can be formed using historical data accumulated only over a significant period of time. It is assumed that unknown disturbances can act in a wide frequency range and may have low-frequency and trend components. In such a situation, including data from different time periods in the sample can lead to inconsistencies and greatly reduce the accuracy of the model. The paper provides an overview of approaches and methods for data harmonization. In this case, the main attention is paid to data sampling. An assessment is made of the applicability of various data sampling options as a tool for reducing the level of uncertainty. We propose a method for identifying a self-leveling object model using data accumulated over a significant period of time under conditions of unknown disturbances with a wide frequency range. The method is focused on creating a model with stationary parameters that does not require periodic reconfiguration to new conditions. The method is based on the combined use of sampling and presentation of data from individual periods of time in the form of increments relative to the initial point in time for the period. This makes it possible to reduce the number of parameters that characterize unknown disturbances with a minimum of assumptions that limit the application of the method. As a result, the dimensionality of the search problem is reduced and the computational costs associated with setting up the model are minimized. It is possible to configure both linear and, in some cases, nonlinear models. The method was used to develop a model of closed cooling of steel on a unit for continuous hot-dip galvanizing of steel strip. The model can be used for predictive control of thermal processes and for selecting strip speed. It is shown that the method makes it possible to develop a model of thermal processes from a closed cooling section under conditions of unknown disturbances, including low-frequency components.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"