Все выпуски
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Градиентный метод с неточным оракулом для задач композитной невыпуклой оптимизации
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 321-334В этой статье мы предлагаем новый метод первого порядка для композитных невыпуклых задач минимизации с простыми ограничениями и неточным оракулом. Целевая функция задается как сумма «сложной», возможно, невыпуклой части с неточным оракулом и «простой» выпуклой части. Мы обобщаем понятие неточного оракула для выпуклых функций на случай невыпуклых функций. Неформально говоря, неточность оракула означает, что для «сложной» части в любой точке можно приближенно вычислить значение функции и построить квадратичную функцию, которая приближенно ограничивает эту функцию сверху. Рассматривается два возможных типа ошибки: контролируемая, которая может быть сде- лана сколь угодно маленькой, например, за счет решения вспомогательной задачи, и неконтролируемая. Примерами такой неточности являются: гладкие невыпуклые функции с неточным и непрерывным по Гёльдеру градиентом, функции, заданные вспомогательной равномерно вогнутой задачей максимизации, которая может быть решена лишь приближенно. Для введенного класса задачм ы предлагаем метод типа проекции градиента / зеркального спуска, который позволяет использовать различные прокс-функции для задания неевклидовой проекции на допустимое множество и более гибкой адаптации к геометрии допустимого множества; адаптивно выбирает контролируемую ошибку оракула и ошибку неевклидового проектирования; допускает неточное проксимальное отображение с двумя типами ошибки: контролируемой и неконтролируемой. Мы доказываем скорость сходимости нашего метода в терминах нормы обобщенного градиентного отображения и показываем, что в случае неточного непрерывного по Гёльдеру градиента наш метод является универсальным по отношению к параметру и константе Гёльдера. Это означает, что методу не нужно знание этих параметров для работы. При этом полученная оценка сложности является равномерно наилучшей при всех параметрах Гёльдера. Наконец, в частном случае показано, что малое значение нормы обобщенного градиентного отображения в точке означает, что в этой точке приближенно выполняется необходимое условие локального минимума.
Ключевые слова: невыпуклая оптимизация, композитная оптимизация, неточный оракул, непрерывный по Гёльдеру градиент, универсальный градиентный метод.
A gradient method with inexact oracle for composite nonconvex optimization
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 321-334In this paper, we develop a new first-order method for composite nonconvex minimization problems with simple constraints and inexact oracle. The objective function is given as a sum of «hard», possibly nonconvex part, and «simple» convex part. Informally speaking, oracle inexactness means that, for the «hard» part, at any point we can approximately calculate the value of the function and construct a quadratic function, which approximately bounds this function from above. We give several examples of such inexactness: smooth nonconvex functions with inexact H¨older-continuous gradient, functions given by the auxiliary uniformly concave maximization problem, which can be solved only approximately. For the introduced class of problems, we propose a gradient-type method, which allows one to use a different proximal setup to adapt to the geometry of the feasible set, adaptively chooses controlled oracle error, allows for inexact proximal mapping. We provide a convergence rate for our method in terms of the norm of generalized gradient mapping and show that, in the case of an inexact Hölder-continuous gradient, our method is universal with respect to Hölder parameters of the problem. Finally, in a particular case, we show that the small value of the norm of generalized gradient mapping at a point means that a necessary condition of local minimum approximately holds at that point.
-
Приближенная модель осесимметричного течения несжимаемой жидкости в бесконечно длинном круглом цилиндре, стенки которого составлены из упругих колец, основанная на решениях уравнения Кортевега – де Фриза
Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 375-394Изучается приближенная математическая модель кровотока в осесимметричном кровеносном сосуде. Под таким сосудом понимается бесконечно длинный круговой цилиндр, стенки которого состоят из упругих колец. Кровь рассматривается как несжимаемая жидкость, текущая в этом цилиндре. Повышенное давление вызывает радиально-симметричное растяжение упругих колец. Следуя Дж. Лэму, кольца расположены близко друг к другу так, что жидкость между ними не протекает. Для мысленной реализации этого достаточно предположить, что кольца обтянуты непроницаемой пленкой, не обладающей упругими свойствами. Упругостью обладают лишь кольца. Рассматриваемая модель кровотока в кровеносном сосуде состоит из трех уравнений: уравнения неразрывности, закона сохранения количества движения и уравнения состояния. Рассматривается приближенная процедура сведения рассматриваемых уравнений к уравнению Кортевега – де Фриза (КдФ), которая рассмотрена Дж. Лэмом не в полной мере, лишь для установления зависимости коэффициентов уравнения КдФ от физических параметров рассматриваемой модели течения несжимаемого флюида в осесимметричном сосуде. Из уравнения КдФ стандартным переходом к бегущим волнам получаются ОДУ третьего, второго и первого порядка соответственно. В зависимости от различных случаев расположения трех стационарных решений ОДУ первого порядка стандартно получаются кноидальная волна и солитон. Основное внимание уделено неограниченному периодическому решению, которое названо нами вырожденной кноидальной волной. Математически кноидальные волны описываются эллиптическими интегралами с параметрами, определяющими амплитуды и периоды. Солитон и вырожденная кноидальная волна описываются элементарными функциями. Указан гемодинамический смысл этих видов решений. Благодаря тому, что множества решений ОДУ первого, второго и третьего порядков не совпадают, установлено, что задачу Коши для ОДУ второго и третьего порядков можно задавать во всех точках, а для ОДУ первого порядка — лишь в точках роста или убывания. Задачу Коши для ОДУ первого порядка нельзя задавать в точках экстремума благодаря нарушению условия Липшица. Численно проиллюстрировано перерождение кноидальной волны в вырожденную кноидальную волну, которая может привести к разрыву стенок сосуда. Приведенная таблица описывает два режима приближения кноидальной волны к вырожденной кноидальной волне.
Ключевые слова: приближенная модель кровотока, сосуд из упругих колец, уравнение Кортевега – де Фриза, кноидальная волна, солитон, вырожденная кноидальная волна, задача Коши.
Approximate model of an axisymmetric flow of a non-compressible fluid in an infinitely long circular cylinder, the walls of which are composed of elastic rings, based on solutions of the Korteweg – de Vries equation
Computer Research and Modeling, 2024, v. 16, no. 2, pp. 375-394An approximate mathematical model of blood flow in an axisymmetric blood vessel is studied. Such a vessel is understood as an infinitely long circular cylinder, the walls of which consist of elastic rings. Blood is considered as an incompressible fluid flowing in this cylinder. Increased pressure causes radially symmetrical stretching of the elastic rings. Following J. Lamb, the rings are located close to each other so that liquid does not flow between them. To mentally realize this, it is enough to assume that the rings are covered with an impenetrable film that does not have elastic properties. Only rings have elasticity. The considered model of blood flow in a blood vessel consists of three equations: the continuity equation, the law of conservation of momentum and the equation of state. An approximate procedure for reducing the equations under consideration to the Korteweg – de Vries (KdV) equation is considered, which was not fully considered by J. Lamb, only to establish the dependence of the coefficients of the KdV equation on the physical parameters of the considered model of incompressible fluid flow in an axisymmetric vessel. From the KdV equation, by a standard transition to traveling waves, ODEs of the third, second and first orders are obtained, respectively. Depending on the different cases of arrangement of the three stationary solutions of the first-order ODE, a cnoidal wave and a soliton are standardly obtained. The main attention is paid to an unbounded periodic solution, which we call a degenerate cnoidal wave. Mathematically, cnoidal waves are described by elliptic integrals with parameters defining amplitudes and periods. Soliton and degenerate cnoidal wave are described by elementary functions. The hemodynamic meaning of these types of decisions is indicated. Due to the fact that the sets of solutions to first-, second- and third-order ODEs do not coincide, it has been established that the Cauchy problem for second- and third-order ODEs can be specified at all points, and for first-order ODEs only at points of growth or decrease. The Cauchy problem for a first-order ODE cannot be specified at extremum points due to the violation of the Lipschitz condition. The degeneration of the cnoidal wave into a degenerate cnoidal wave, which can lead to rupture of the vessel walls, is numerically illustrated. The table below describes two modes of approach of a cnoidal wave to a degenerate cnoidal wave.
-
Особенности применения физически информированных нейронных сетей для решения обыкновенных дифференциальных уравнений
Компьютерные исследования и моделирование, 2024, т. 16, № 7, с. 1621-1636Рассматривается применение физически информированных нейронных сетей с использованием многослойных персептронов для решения задач Коши, в которых правые части уравнения являются непрерывными монотонно возрастающими, убывающими или осциллирующими функциями. С помощью вычислительных экспериментов изучено влияние метода построения приближенного нейросетевого решения, структуры нейронной сети, алгоритмов оптимизации и средств программной реализации на процесс обучения и точность полученного решения. Выполнен анализ эффективности работы наиболее часто используемых библиотек машинного обучения при разработке программ на языках программирования Python и C#. Показано, что применение языка C# позволяет сократить время обучения нейросетей на 20–40%. Выбор различных функций активации влияет на процесс обучения и точность приближенного решения. Наиболее эффективными в рассматриваемых задачах являются сигмоида и гиперболический тангенс. Минимум функции потерь достигается при определенном количестве нейронов скрытого слоя однослойной нейронной сети за фиксированное время обучения нейросетевой модели, причем усложнение структуры сети за счет увеличения числа нейронов не приводит к улучшению результатов обучения. При этом величина шага сетки между точками обучающей выборки, обеспечивающей минимум функции потерь, в рассмотренных задачах Коши практически одинакова. Кроме того, при обучении однослойных нейронных сетей наиболее эффективными для решения задач оптимизации являются метод Adam и его модификации. Дополнительно рассмотрено применение двух- и трех-слойных нейронных сетей. Показано, что в этих случаях целесообразно использовать алгоритм LBFGS, который по сравнению с методом Adam в ряде случаев требует на порядок меньшего времени обучения при достижении одинакового порядка точности. Исследованы также особенности обучения нейронной сети в задачах Коши, в которых решение является осциллирующей функцией с монотонно убывающей амплитудой. Для них необходимо строить нейросетевое решение не с постоянными, а с переменными весовыми коэффициентами, что обеспечивает преимущество такого подхода при обучении в тех узлах, которые расположены вблизи конечной точки интервала решения задачи.
Ключевые слова: обыкновенные дифференциальные уравнения, машинное обучение, физически информированные нейронные сети, численные методы.
Analysis of the physics-informed neural network approach to solving ordinary differential equations
Computer Research and Modeling, 2024, v. 16, no. 7, pp. 1621-1636Considered the application of physics-informed neural networks using multi layer perceptrons to solve Cauchy initial value problems in which the right-hand sides of the equation are continuous monotonically increasing, decreasing or oscillating functions. With the use of the computational experiments the influence of the construction of the approximate neural network solution, neural network structure, optimization algorithm and software implementation means on the learning process and the accuracy of the obtained solution is studied. The analysis of the efficiency of the most frequently used machine learning frameworks in software development with the programming languages Python and C# is carried out. It is shown that the use of C# language allows to reduce the time of neural networks training by 20–40%. The choice of different activation functions affects the learning process and the accuracy of the approximate solution. The most effective functions in the considered problems are sigmoid and hyperbolic tangent. The minimum of the loss function is achieved at the certain number of neurons of the hidden layer of a single-layer neural network for a fixed training time of the neural network model. It’s also mentioned that the complication of the network structure increasing the number of neurons does not improve the training results. At the same time, the size of the grid step between the points of the training sample, providing a minimum of the loss function, is almost the same for the considered Cauchy problems. Training single-layer neural networks, the Adam method and its modifications are the most effective to solve the optimization problems. Additionally, the application of twoand three-layer neural networks is considered. It is shown that in these cases it is reasonable to use the LBFGS algorithm, which, in comparison with the Adam method, in some cases requires much shorter training time achieving the same solution accuracy. The specificity of neural network training for Cauchy problems in which the solution is an oscillating function with monotonically decreasing amplitude is also investigated. For these problems, it is necessary to construct a neural network solution with variable weight coefficient rather than with constant one, which improves the solution in the grid cells located near by the end point of the solution interval.
-
Сверхмасштабируемое моделирование магнитных состояний и реконструкция типов упорядочения массивов наночастиц
Компьютерные исследования и моделирование, 2011, т. 3, № 3, с. 309-318Рассматриваются два возможных вычислительных метода интерпретации экспериментальных данных, полученных методами магнитно-силовой зондовой микроскопии. Развитие методов моделирования и реконструирования распределения макроспинов проводится с целью изучения процессов перемагничивания наночастиц в упорядоченных двумерных массивах. Предлагаются подходы к разработке сверхмасштабируемых высокопроизводительных алгоритмов, предназначенных для параллельного исполнения на суперкомпьютерных кластерах для решения прямой и обратной задачи моделирования магнитных состояний, типов упорядочения и процессов перемагничивания наносистем с коллективным поведением. Результаты моделирования согласуются с результатами эксперимента.
Ключевые слова: магнито-силовая микроскопия, магнитные состояния, высокопроизводительные параллельные вычисления, сверхмасштабируемость.
Superscale simulation of the magnetic states and reconstruction of the ordering types for nanodots arrays
Computer Research and Modeling, 2011, v. 3, no. 3, pp. 309-318Просмотров за год: 2.We consider two possible computational methods of the interpretation of experimental data obtained by means of the magnetic force microscopy. These methods of macrospin distribution simulation and reconstruction can be used for research of magnetization reversal processes of nanodots in ordered 2D arrays of nanodots. New approaches to the development of high-performance superscale algorithms for parallel executing on a supercomputer clusters for solving direct and inverse task of the modeling of magnetic states, types of ordering, reversal processes of nanosystems with a collective behavior are proposed. The simulation results are consistent with experimental results.
-
Об одной модели смеси распределений вероятностей в радиотехнических измерениях
Компьютерные исследования и моделирование, 2012, т. 4, № 3, с. 563-568В данной работе представлена модель смеси распределений вероятностей сигнала и шума. Как правило, при анализе данных в условиях неопределенности приходится использовать непараметрические критерии. Однако при анализе нестационарных данных при наличии неопределенности по виду закона распределения и его параметрам они могут оказаться малоэффективными. Рассматриваемая модель подразумевает реализацию случая априорной непараметрической неопределенности при обработке сигнала в условиях, когда возможно разделение сигнала и шума как компонентов, относящихся к разным генеральным совокупностям.
On one particular model of a mixture of the probability distributions in the radio measurements
Computer Research and Modeling, 2012, v. 4, no. 3, pp. 563-568Просмотров за год: 3. Цитирований: 7 (РИНЦ).This paper presents a model mixture of probability distributions of signal and noise. Typically, when analyzing the data under conditions of uncertainty it is necessary to use nonparametric tests. However, such an analysis of nonstationary data in the presence of uncertainty on the mean of the distribution and its parameters may be ineffective. The model involves the implementation of a case of a priori non-parametric uncertainty in the processing of the signal at a time when the separation of signal and noise are related to different general population, is feasible.
-
Разработка методики расчетного анализа теплогидравлических процессов в реакторе на быстрых нейтронах с применением кода FlowVision
Компьютерные исследования и моделирование, 2017, т. 9, № 1, с. 87-94В статье описан подход к расчетному анализу теплогидравлических процессов в реакторе на быстрых нейтронах (БН), включающий применяемые физические модели, численные схемы и упрощения реальной конструкции, принятые в расчетной модели. Рассмотрены стационарные и динамические режимы испытаний. Стационарные режимы имитировали работу реактора на номинальной мощности. Динамические режимы имитировали расхолаживание реактора через систему отвода тепла. Моделирование теплогидравлических процессов проведено в программном комплексе (ПК) FlowVision. На основе геометрической модели была построена математическая модель, описывающая течение теплоносителя в первом контуре имитатора реактора типа БН.
Моделирование течения и теплообмена рабочего вещества в имитаторе реактора выполнено в предположении независимости плотности вещества от давления, с использованием k–\varepsilon модели турбулентности, с применением модели дисперсной среды и с учетом сопряженного теплообмена. Реализованная в ПК FlowVision модель дисперсной среды позволила учесть процесс теплообмена между контурами в теплообменниках. Из-за большого количества расчетных ячеек по модели активной зоны области двух теплообменных аппаратов были заменены гидравлическими сопротивлениями и стоками тепла.
Моделирование течения теплоносителя в ПК FlowVision позволило получить распределения температуры, скорости и давления во всей расчетной области. В результате использования модели дисперсной среды были получены распределения температуры теплоносителей по обоим контурам теплообменников. Определено изменение температуры теплоносителя вдоль двух термозондов, которые располагались в холодной и горячей камерах имитатора реактора БН. На основе сравнительного анализа численных и экспериментальных данных сделаны выводы о корректности построенной математической модели и возможности ее использования для моделирования теплогидравлических процессов, протекающих в реакторах с натриевым теплоносителем типа БН.
Ключевые слова: реактор на быстрых нейтронах (БН), гидродинамика, FlowVision, численное моделирование, температурная стратификация.
Development of methodology for computational analysis of thermo-hydraulic processes proceeding in fast-neutron reactor with FlowVision CFD software
Computer Research and Modeling, 2017, v. 9, no. 1, pp. 87-94Просмотров за год: 6. Цитирований: 1 (РИНЦ).An approach to numerical analysis of thermo-hydraulic processes proceeding in a fast-neutron reactor is described in the given article. The description covers physical models, numerical schemes and geometry simplifications accepted in the computational model. Steady-state and dynamic regimes of reactor operation are considered. The steady-state regimes simulate the reactor operation at nominal power. The dynamic regimes simulate the shutdown reactor cooling by means of the heat-removal system.
Simulation of thermo-hydraulic processes is carried out in the FlowVision CFD software. A mathematical model describing the coolant flow in the first loop of the fast-neutron reactor was developed on the basis of the available geometrical model. The flow of the working fluid in the reactor simulator is calculated under the assumption that the fluid density does not depend on pressure, with use a k–\varepsilon turbulence model, with use of a model of dispersed medium, and with account of conjugate heat exchange. The model of dispersed medium implemented in the FlowVision software allowed taking into account heat exchange between the heat-exchanger lops. Due to geometric complexity of the core region, the zones occupied by the two heat exchangers were modeled by hydraulic resistances and heat sources.
Numerical simulation of the coolant flow in the FlowVision software enabled obtaining the distributions of temperature, velocity and pressure in the entire computational domain. Using the model of dispersed medium allowed calculation of the temperature distributions in the second loops of the heat exchangers. Besides that, the variation of the coolant temperature along the two thermal probes is determined. The probes were located in the cool and hot chambers of the fast-neutron reactor simulator. Comparative analysis of the numerical and experimental data has shown that the developed mathematical model is correct and, therefore, it can be used for simulation of thermo-hydraulic processes proceeding in fast-neutron reactors with sodium coolant.
-
Некоторые особенности взаимосвязи термодинамических характеристик земной поверхности с потоками водяного пара и диоксида углерода на сплошной свежей вырубке
Компьютерные исследования и моделирование, 2017, т. 9, № 6, с. 965-980В статье рассматриваются некоторые особенности временной изменчивости и взаимосвязь эксергии коротковолнового и длинноволнового излучения с потоками тепла, водяного пара (Н2О) и диоксида углерода (СО2) на сплошной свежей вырубке в смешанном хвойно-мелколиственном лесу в Тверской области. На основе проведенного сравнения коэффициентов радиационной эффективности и эффективности эксергии, введенных Ю. М. Свирежевым, было показано, что в течение первых восьми месяцев после проведения сплошной рубки лесная экосистема функционирует как «тепловая машина», то есть на вырубке доминируют процессы диссипации энергии над продукционными процессами. Для проверки справедливости полученного вывода был выполнен статистический анализ временной изменчивости метеорологических рядов наблюдений и данных по среднесуточным значениям потоков явного тепла, затрат тепла на испарение и потоков СО2 с применением тригонометрических многочленов, который подтвердил полученный ранее вывод. Для среднесуточных значений потоков СО2, валовой первичной продуктивности растительного покрова на вырубке, а также потоков явного тепла удалось построить статистические модели, линейно зависящие от эксергии коротковолнового и длинноволнового излучения. Анализ этих зависимостей также подтвердил вывод, полученный на основе рассмотрения временной изменчивости коэффициентов радиационной эффективности и эффективности эксергии. Используя разбиение временных рядов на отдельные временные интервалы «весна–лето» и «лето–осень», удалось выявить, что в процессе зарастания вырубки травянистой растительностью в летние месяцы связь между этими параметрами и величиной эксергии усиливается. Анализ линейной связи временных рядов затрат тепла на испарение и эксергии показал ее статистическую незначимость. В свою очередь, линейная связь между затратами тепла на испарение и температурой оказалась статистически значимой. Температура выступала в роли ключевого фактора, повышающего точность модели, а эксергия оказывалась несущественным фактором. Это указывает на то, что межсуточная временная изменчивость испарения активно зарастающей вырубки определялась главным образом температурой.
Ключевые слова: сплошная вырубка, термодинамические характеристики, эксергия, коротковолновая радиация, длинноволновое излучение, временные ряды, потоки тепла, водяного пара и диоксида углерода.
Some relationships between thermodynamic characteristics and water vapor and carbon dioxide fluxes in a recently clear-cut area
Computer Research and Modeling, 2017, v. 9, no. 6, pp. 965-980Просмотров за год: 15. Цитирований: 1 (РИНЦ).The temporal variability of exergy of short-wave and long-wave radiation and its relationships with sensible heat, water vapor (H2O) and carbon dioxide (CO2) fluxes on a recently clear-cut area in a mixed coniferous and small-leaved forest in the Tver region is discussed. On the basis of the analysis of radiation and exergy efficiency coefficients suggested by Yu.M. Svirezhev it was shown that during the first eight months after clearcutting the forest ecosystem functions as a "heat engine" i.e. the processes of energy dissipation dominated over processes of biomass production. To validate the findings the statistical analysis of temporary variability of meteorological parameters, as well as, daily fluxes of sensible heat, H2O and CO2 was provided using the trigonometrical polynomials. The statistical models that are linearly depended on an exergy of short-wave and long-wave radiation were obtained for mean daily values of CO2 fluxes, gross primary production of regenerated vegetation and sensible heat fluxes. The analysis of these dependences is also confirmed the results obtained from processing the radiation and exergy efficiency coefficients. The splitting the time series into separate time intervals, e.g. “spring–summer” and “summer–autumn”, allowed revealing that the statistically significant relationships between atmospheric fluxes and exergy were amplified in summer months as the clear-cut area was overgrown by grassy and young woody vegetation. The analysis of linear relationships between time-series of latent heat fluxes and exergy showed their statistical insignificance. The linear relationships between latent heat fluxes and temperature were in turn statistically significant. The air temperature was a key factor improving the accuracy of the models, whereas effect of exergy was insignificant. The results indicated that at the time of active vegetation regeneration within the clear-cut area the seasonal variability of surface evaporation is mainly governed by temperature variation.
-
Использование сверточных нейронных сетей для прогнозирования скоростей транспортного потока на дорожном графе
Компьютерные исследования и моделирование, 2018, т. 10, № 3, с. 359-367Краткосрочное прогнозирование потока трафика является однойиз основных задач моделирования транспортных систем, основное назначение которой — контроль дорожного движения, сообщение об авариях, избежание дорожных пробок за счет знания потока трафика и последующего планирования транспортировки. Существует два типа подходов для решения этой задачи: математическое моделирование трафика и модель с использованием количественных данных трафика. Тем не менее большинство пространственно-временных моделейст радают от высокой математической сложности и низкой эффективности. Искусственные нейронные сети, один из видных подходов второго типа, показывают обещающие результаты в моделировании динамики транспортнойс ети. В данной работе представлена архитектура нейронной сети, используемойдля прогнозирования скоростейт ранспортного потока на графе дорожной сети. Модель основана на объединении рекуррентнойней ронной сети и сверточнойней ронной сети на графе, где рекуррентная нейронная сеть используется для моделирования временных зависимостей, а сверточная нейронная сеть — для извлечения пространственных свойств из трафика. Для получения предсказанийна несколько шагов вперед используется архитектура encoder-decoder, позволяющая уменьшить накопление шума из-за неточных предсказаний. Для моделирования сложных зависимостей мы используем модель, состоящую из нескольких слоев. Нейронные сети с глубокойархитек туройсло жны для тренировки; для ускорения процесса тренировки мы используем skip-соединения между каждым слоем, так что каждыйслой учит только остаточную функцию по отношению к предыдущему слою. Полученная объединенная нейронная сеть тренировалась на необработанных данных с сенсоров транспортного потока из сети шоссе в США с разрешением в 5 минут. 3 метрики — средняя абсолютная ошибка, средняя относительная ошибка, среднеквадратическая ошибка — использовались для оценки качества предсказания. Было установлено, что по всем метрикам предложенная модель имеет более низкую погрешность предсказания по сравнению с ранее опубликованными моделями, такими как Vector Auto Regression, Long Short-Term Memory и Graph Convolution GRU.
Traffic flow speed prediction on transportation graph with convolutional neural networks
Computer Research and Modeling, 2018, v. 10, no. 3, pp. 359-367Просмотров за год: 36.The short-term prediction of road traffic condition is one of the main tasks of transportation modelling. The main purpose of which are traffic control, reporting of accidents, avoiding traffic jams due to knowledge of traffic flow and subsequent transportation planning. A number of solutions exist — both model-driven and data driven had proven to be successful in capturing the dynamics of traffic flow. Nevertheless, most space-time models suffer from high mathematical complexity and low efficiency. Artificial Neural Networks, one of the prominent datadriven approaches, show promising performance in modelling the complexity of traffic flow. We present a neural network architecture for traffic flow prediction on a real-world road network graph. The model is based on the combination of a recurrent neural network and graph convolutional neural network. Where a recurrent neural network is used to model temporal dependencies, and a convolutional neural network is responsible for extracting spatial features from traffic. To make multiple few steps ahead predictions, the encoder-decoder architecture is used, which allows to reduce noise propagation due to inexact predictions. To model the complexity of traffic flow, we employ multilayered architecture. Deeper neural networks are more difficult to train. To speed up the training process, we use skip-connections between each layer, so that each layer teaches only the residual function with respect to the previous layer outputs. The resulting neural network was trained on raw data from traffic flow detectors from the US highway system with a resolution of 5 minutes. 3 metrics: mean absolute error, mean relative error, mean-square error were used to estimate the quality of the prediction. It was found that for all metrics the proposed model achieved lower prediction error than previously published models, such as Vector Auto Regression, LSTM and Graph Convolution GRU.
-
Применение метода сбалансированной идентификации для заполнения пропусков в рядах наблюдений за потоками СО2 на сфагновом верховом болоте
Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 153-171В работе рассматривается применение метода сбалансированной идентификации для построения многофакторной функциональной зависимости нетто СО2-обмена (NEE) от факторов внешней среды и ее дальнейшего использования для заполнения пропусков в рядах наблюдений за потоками СО2 на верховом сфагновом болоте в Тверской области. Измерения потоков на болоте проводились с помощью метода турбулентных пульсаций в период с августа по ноябрь 2017 года. Из-за дождливых погодных условий и высокой повторяемости периодов с низкой турбулентностью на протяжении всего периода наблюдений доля пропусков в измерениях NEE на исследуемом болоте превысила 40%. Разработанная для заполнения пропусков модель описывает NEE верхового болота как разность экосистемного дыхания (RE) и валовой первичной продукции (GPP) и учитывает зависимость этих параметров от приходящей суммарной солнечной радиации (Q), температуры почвы (T), дефицита упругости водяного пара (VPD) и уровня болотных вод (WL). Используемый для этой цели метод сбалансированной идентификации основан на поиске оптимального соотношения между простотой модели и точностью повторения измерений — соотношения, доставляющего минимум оценке погрешности моделирования, полученной методом перекрестного оценивания. Полученные численные решения обладают минимально необходимой нелинейностью (кривизной), что обеспечивает хорошие интерполяционные и экстраполяционные свойства построенных моделей, необходимые для восполнения недостающих данных по потокам. На основе проведенного анализа временной изменчивости NEE и факторов внешней среды была выявлена статистически значимая зависимость GPP болота от Q, T и VPD, а RE — от T и WL. При этом погрешность применения предложенного метода для моделирования среднесуточных данных NEE составила менее 10%, а точность выполненных оценок NEE была выше, чем у модели REddyProc, учитывающей влияние на NEE меньшего числа внешних факторов. На основе восстановленных непрерывных рядов данных по NEE была проведена оценка масштабов внутрисуточной и межсуточной изменчивости NEE и получены интегральные оценки потоков СО2 исследуемого верхового болота для выбранного летне-осеннего периода. Было показано, что если в августе 2017 года на исследуемом болоте скорость фиксации СО2 растительным покровом существенно превышала величину экосистемного дыхания, то, начиная с сентября, на фоне снижения GPP исследуемое болото превратилось в устойчивый источник СО2 для атмосферы.
Ключевые слова: метод сбалансированной идентификации, метод турбулентных пульсаций, верховое болото, нетто-экосистемный обмен СО2, экосистемное дыхание, валовая первичная продукция.
Application of a balanced identification method for gap-filling in CO2 flux data in a sphagnum peat bog
Computer Research and Modeling, 2019, v. 11, no. 1, pp. 153-171Просмотров за год: 19.The method of balanced identification was used to describe the response of Net Ecosystem Exchange of CO2 (NEE) to change of environmental factors, and to fill the gaps in continuous CO2 flux measurements in a sphagnum peat bog in the Tver region. The measurements were provided in the peat bog by the eddy covariance method from August to November of 2017. Due to rainy weather conditions and recurrent periods with low atmospheric turbulence the gap proportion in measured CO2 fluxes at our experimental site during the entire period of measurements exceeded 40%. The model developed for the gap filling in long-term experimental data considers the NEE as a difference between Ecosystem Respiration (RE) and Gross Primary Production (GPP), i.e. key processes of ecosystem functioning, and their dependence on incoming solar radiation (Q), soil temperature (T), water vapor pressure deficit (VPD) and ground water level (WL). Applied for this purpose the balanced identification method is based on the search for the optimal ratio between the model simplicity and the data fitting accuracy — the ratio providing the minimum of the modeling error estimated by the cross validation method. The obtained numerical solutions are characterized by minimum necessary nonlinearity (curvature) that provides sufficient interpolation and extrapolation characteristics of the developed models. It is particularly important to fill the missing values in NEE measurements. Reviewing the temporary variability of NEE and key environmental factors allowed to reveal a statistically significant dependence of GPP on Q, T, and VPD, and RE — on T and WL, respectively. At the same time, the inaccuracy of applied method for simulation of the mean daily NEE, was less than 10%, and the error in NEE estimates by the method was higher than by the REddyProc model considering the influence on NEE of fewer number of environmental parameters. Analyzing the gap-filled time series of NEE allowed to derive the diurnal and inter-daily variability of NEE and to obtain cumulative CO2 fluxs in the peat bog for selected summer-autumn period. It was shown, that the rate of CO2 fixation by peat bog vegetation in August was significantly higher than the rate of ecosystem respiration, while since September due to strong decrease of GPP the peat bog was turned into a consistent source of CO2 for the atmosphere.
-
Обоснование связи модели Бэкмана с вырождающимися функциями затрат с моделью стабильной динамики
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 335-342С 50-х годов XX века транспортное моделирование крупных мегаполисов стало усиленно развиваться. Появились первые модели равновесного распределения потоков по путям. Наиболее популярной (и использующейся до сих пор) моделью была модель Бэкмана и др. 1955 г. В основу этой модели положены два принципа Вардропа. На современном теоретико-игровом языке можно кратко описать суть модели как поиск равновесия Нэша в популяционной игре загрузки, в которой потери игроков (водителей) рассчитываются исходя из выбранного пути и загрузках на этом пути, при фиксированных корреспонденциях. Загрузки (затраты) на пути рассчитываются как сумма затрат на различных участках дороги (ребрах графа транспортной сети). Затраты на ребре (время проезда по ребру) определяется величиной потока автомобилей на этом ребре. Поток на ребре, в свою очередь, определяется суммой потоков по всем путям, проходящим через заданное ребро. Таким образом, затраты на проезд по пути определяются не только выбором пути, но и тем, какие пути выбрали остальные водители. Таким образом, мы находимся в стандартной теоретико-игровой постановке. Специфика формирования функций затрат позволяет сводить поиск равновесия к решению задачи оптимизации (игра потенциальная). Эта задача оптимизации будет выпуклой, если функции затрат монотонно неубывающие. Собственно, различные предположения о функциях затрат формируют различные модели. Наиболее популярной моделью является модель с функцией затрат BPR. Такие функции используются при расчетах реальных городов повсеместно. Однако в начале XXI века Ю. Е. Нестеровым и А. де Пальмой было показано, что модели типа Бэкмана имеют серьезные недостатки. Эти недостатки можно исправить, используя модель, которую авторы назвали моделью стабильной динамики. Поиск равновесия в такой модели также сводится к задаче оптимизации. Точнее, даже задаче линейного программирования. В 2013 г. А. В. Гасниковым было обнаружено, что модель стабильной ди- намики может быть получена предельным переходом, связанным с поведением функции затрат, из модели Бэкмана. Однако обоснование упомянутого предельного перехода было сделано в нескольких важных (для практики), но все- таки частных случаях. В общем случае вопрос о возможности такого предельного перехода, насколько нам известно, остается открытым. Данная работа закрывает данный зазор. В статье в общем случае приводится обоснование возможности отмеченного предельного перехода (когда функция затрат на проезд по ребру как функция потока по ребру вырождается в функцию, равную постоянным затратам до достижения пропускной способности, и равна плюс бесконечности, при превышении пропускной способности).
Ключевые слова: модель равновесного распределения потоков по путям, модель Бэкмана, модель стабильной динамики.
Proof of the connection between the Backman model with degenerate cost functions and the model of stable dynamics
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 335-342Since 1950s the field of city transport modelling has progressed rapidly. The first equilibrium distribution models of traffic flow appeared. The most popular model (which is still being widely used) was the Beckmann model, based on the two Wardrop principles. The core of the model could be briefly described as the search for the Nash equilibrium in a population demand game, in which losses of agents (drivers) are calculated based on the chosen path and demands of this path with correspondences being fixed. The demands (costs) of a path are calculated as the sum of the demands of different path segments (graph edges), that are included in the path. The costs of an edge (edge travel time) are determined by the amount of traffic on this edge (more traffic means larger travel time). The flow on a graph edge is determined by the sum of flows over all paths passing through the given edge. Thus, the cost of traveling along a path is determined not only by the choice of the path, but also by the paths other drivers have chosen. Thus, it is a standard game theory task. The way cost functions are constructed allows us to narrow the search for equilibrium to solving an optimization problem (game is potential in this case). If the cost functions are monotone and non-decreasing, the optimization problem is convex. Actually, different assumptions about the cost functions form different models. The most popular model is based on the BPR cost function. Such functions are massively used in calculations of real cities. However, in the beginning of the XXI century, Yu. E. Nesterov and A. de Palma showed that Beckmann-type models have serious weak points. Those could be fixed using the stable dynamics model, as it was called by the authors. The search for equilibrium here could be also reduced to an optimization problem, moreover, the problem of linear programming. In 2013, A.V.Gasnikov discovered that the stable dynamics model can be obtained by a passage to the limit in the Beckmann model. However, it was made only for several practically important, but still special cases. Generally, the question if this passage to the limit is possible remains open. In this paper, we provide the justification of the possibility of the above-mentioned passage to the limit in the general case, when the cost function for traveling along the edge as a function of the flow along the edge degenerates into a function equal to fixed costs until the capacity is reached and it is equal to plus infinity when the capacity is exceeded.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"