Текущий выпуск Номер 3, 2025 Том 17

Все выпуски

Результаты поиска по 'reinforcement':
Найдено статей: 22
  1. Янковская У.И., Старостенков М.Д., Захаров П.В.
    Молекулярно-динамическое исследование механических свойств кристалла платины, армированного углеродной нанотрубкой при одноосном растяжении
    Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1069-1080

    В этой статье рассматриваются механические свойства платины, армированной углеродной нанотрубкой (УНТ), в условиях одноосной растягивающей нагрузки посредством метода молекулярной динамики. Обзор текущих расчетных и экспериментальных исследований подчеркивает преимущества композитов, армированных углеродными нанотрубками с структурной точки зрения. Однако количественные и качественные исследования влияния углеродной нанотрубки на улучшения свойств композитов все еще редки. Выбор композита обусловлен перспективой применения платиновых сплавов во многих сферах, где они могут подвергаться механическим воздействиям, в том числе и в биосовместимых системах. Армирование платины (Pt) с помощью УНТ может обеспечить дополнительные возможности для вживления имплантатов и при этом достичь требуемых механических характеристик.

    Структура композита состояла из кристалла Pt с гранецентрированной кубической решеткой с постоянной 3,92 Å и углеродной нанотрубки. Матрица кристалла платины имеет форму куба с размерами $43,1541 Å \times 43,1541 Å \times 43,1541 Å$. Размер отверстия в середине платиновой матрицы определяется радиусом углеродной нанотрубки типа «зигзаг» (8,0), который составляет 2,6 Å. Углеродная нанотрубка помещается в отверстие радиусом 4,2 Å. При таких параметрах взаимной конфигурации наблюдался минимум энергии взаимодействия. Рассматриваемая модель содержит 320 атомов углерода и 5181 атом платины. Объемная доля углерода в композите Pt-C составляет 5,8%. На первом этапе исследования производились анализ влияния скорости деформации на соотношение «напряжение–деформация» и изменение энергии в процессе одноосного растяжения композита Pt-C.

    Анализ влияния скорости деформации показал, что предел текучести при растяжении увеличивается с увеличением скоростей деформации, а модуль упругости имеет, скорее, тенденцию к уменьшению при увеличении скорости деформации. Данная работа также демонстрирует, что по сравнению с чистой платиной модуль Юнга увеличился на 40% для Pt-C, а эластичность композита меньше на 42,3%. В целом подробно рассмотрены механизмы разрушения, включая пластическую деформацию в атомистическом масштабе.

    Yankovskaya U.I., Starostenkov M.D., Zakharov P.V.
    Molecular dynamics study of the mechanical properties of a platinum crystal reinforced with carbon nanotube under uniaxial tension
    Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1069-1080

    This article discusses the mechanical properties of carbon nanotube (CNT)-reinforced platinum under uniaxial tensile loading using the molecular dynamics method. A review of current computational and experimental studies on the use of carbon nanotube-reinforced composites from a structural point of view. However, quantitative and qualitative studies of CNTs to improve the properties of composites are still rare. Composite selection is a promising application for platinum alloys in many cases where they may be subjected to mechanical stress, including in biocompatibility sources. Pt-reinforced with CNTs may have additional possibilities for implantation of the implant and at the same time obtain the required mechanical characteristics.

    The structure of the composite is composed of a Pt crystal with a face-centered cubic lattice with a constant of 3.92 Å and a carbon nanotube. The Pt matrix has the shape of a cube with dimensions of $43.1541 Å \times 43.1541 Å \times 43.1541 Å$. The hole size in the average platinum dimension is the radius of the carbon nanotube of the «zigzag» type (8,0), which is 2.6 Å. A carbon nanotube is placed in a hole with a radius of 4.2 Å. At such parameters, the maximum energy level was mutually observed. The model under consideration is contained in 320 atomic bombs and 5181 atomic platinum. The volume fraction of deaths in the Pt-C composite is 5.8%. At the first stage of the study, the strain rate was analyzed for stress-strain and energy change during uniaxial action on the Pt-C composite.

    Analysis of the strain rate study showed that the consumption yield strength increases with high strain rate, and the elasticity has increased density with decreasing strain rate. This work also increased by 40% for Pt-C, the elasticity of the composite decreased by 42.3%. In general, fracture processes are considered in detail, including plastic deformation on an atomistic scale.

  2. Янковская У.И., Старостенков М.Д., Медведев Н.Н., Захаров П.В.
    Методы моделирования композитов, армированных углеродными нанотрубками: обзор и перспективы
    Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1143-1162

    Изучение структурной характеристики композитов и наноструктур имеет фундаментальное значение в материаловедении. Теоретическое и численное моделирование и симуляция механических свойств наноструктур является основным инструментом, позволяющим проводить комплексные исследования, которые сложно проводить только экспериментально. Одним из примеров наноструктур, рассматриваемых в данной работе, являются углеродные нанотрубки (УНТ), которые обладают хорошими тепловыми и электрическими свойствами, а также низкой плотностью и высоким модулем Юнга, что делает их наиболее подходящим армирующим элементом для композитов, для потенциального применения в аэрокосмической, автомобильной, металлургической и биомедицинской промышленности. В данном обзоре мы рассмотрели методы моделирования, механические свойства и применение композитов с металлической матрицей, армированных УНТ. Также рассмотрены некоторые методы моделирования, применимые при исследованиях композитов с полимерными и металлическими матрицами. Рассмотрены такие методы, как метод градиентного спуска, метод Монте-Карло, методы молекулярной статики и молекулярной динамики. Было показано, что молекулярно-динамическое моделирование отлично подходит для создания различных систем композиционных материалов и изучения свойств композитов с металлической матрицей, армированных углеродными наноматериалами, в различных условиях. В данной работе кратко представлены наиболее часто используемые потенциалы, описывающие взаимодействие систем моделирования композитов. Правильный выбор потенциалов взаимодействия частей композитов напрямую влияет на описание изучаемого явления. Детализирована и обсуждена зависимость механических свойств композитов от объемной доли, диаметра, ориентации и количества УНТ. Показано, что объемная доля углеродных нанотрубок имеет существенное влияние на предел прочности и модуль Юнга. Диаметр УНТ оказывает большее значение на предел прочности, нежели на модуль упругости. Также приведен в пример работы, в которых изучается влияние длины УНТ на механические свойства композитов. В заключении нами предложены перспективы направления развития молекулярно-динамического моделирования в отношении композитов с металлической матрицей, армированных углеродными наноматериалами.

    Yankovskaya U.I., Starostenkov M.D., Medvedev N.N., Zakharov P.V.
    Methods for modeling composites reinforced with carbon nanotubes: review and perspectives
    Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1143-1162

    The study of the structural characteristics of composites and nanostructures is of fundamental importance in materials science. Theoretical and numerical modeling and simulation of the mechanical properties of nanostructures is the main tool that allows for complex studies that are difficult to conduct only experimentally. One example of nanostructures considered in this work are carbon nanotubes (CNTs), which have good thermal and electrical properties, as well as low density and high Young’s modulus, making them the most suitable reinforcement element for composites, for potential applications in aerospace, automotive, metallurgical and biomedical industries. In this review, we reviewed the modeling methods, mechanical properties, and applications of CNT-reinforced metal matrix composites. Some modeling methods applicable in the study of composites with polymer and metal matrices are also considered. Methods such as the gradient descent method, the Monte Carlo method, methods of molecular statics and molecular dynamics are considered. Molecular dynamics simulations have been shown to be excellent for creating various composite material systems and studying the properties of metal matrix composites reinforced with carbon nanomaterials under various conditions. This paper briefly presents the most commonly used potentials that describe the interactions of composite modeling systems. The correct choice of interaction potentials between parts of composites directly affects the description of the phenomenon being studied. The dependence of the mechanical properties of composites on the volume fraction of the diameter, orientation, and number of CNTs is detailed and discussed. It has been shown that the volume fraction of carbon nanotubes has a significant effect on the tensile strength and Young’s modulus. The CNT diameter has a greater impact on the tensile strength than on the elastic modulus. An example of works is also given in which the effect of CNT length on the mechanical properties of composites is studied. In conclusion, we offer perspectives on the direction of development of molecular dynamics modeling in relation to metal matrix composites reinforced with carbon nanomaterials.

  3. Кхан С.А., Шулепина С., Шулепин Д., Лукманов Р.А.
    Обзор алгоритмических решений для развертывания нейронных сетей на легких устройствах
    Компьютерные исследования и моделирование, 2024, т. 16, № 7, с. 1601-1619

    В современном мире, ориентированном на технологии, легкие устройства, такие как устройства Интернета вещей (IoT) и микроконтроллеры (MCU), становятся все более распространенными. Эти устройства более энергоэффективны и доступны по цене, но часто обладают урезанными возможностями, по сравнению со стандартными версиями, такими как ограниченная память и вычислительная мощность. Современные модели машинного обучения могут содержать миллионы параметров, что приводит к значительному росту требований по объему памяти. Эта сложность не только затрудняет развертывание больших моделей на устройствах с ограниченными ресурсами, но и увеличивает риск задержек и неэффективности при обработке данных, что критично в случаях, когда требуются ответы в реальном времени, таких как автономное вождение или медицинская диагностика.

    В последние годы нейронные сети достигли значительного прогресса в методах оптимизации моделей, что помогает в развертывании и инференсе на этих небольших устройствах. Данный обзор представляет собой подробное исследование прогресса и последних достижений в оптимизации нейронных сетей, сосредотачиваясь на ключевых областях, таких как квантизация, прореживание, дистилляция знаний и поиск архитектур нейронных сетей. Обзор рассматривает, как эти алгоритмические решения развивались и как новые подходы улучшили существующие методы, делая нейронные сети более эффективными. Статья предназначена для исследователей, практиков и инженеров в области машинного обучения, которые могут быть незнакомы с этими методами, но хотят изучить доступные техники. В работе подчеркиваются текущие исследования в области оптимизации нейронных сетей для достижения лучшей производительности, снижения потребления энергии и ускорения времени обучения, что играет важную роль в дальнейшей масштабируемости нейронных сетей. Кроме того, в обзоре определяются пробелы в текущих исследованиях и закладывается основа для будущих исследований, направленных на повышение применимости и эффективности существующих стратегий оптимизации.

    Khan S.A., Shulepina S., Shulepin D., Lukmanov R.A.
    Review of algorithmic solutions for deployment of neural networks on lite devices
    Computer Research and Modeling, 2024, v. 16, no. 7, pp. 1601-1619

    In today’s technology-driven world, lite devices like Internet of Things (IoT) devices and microcontrollers (MCUs) are becoming increasingly common. These devices are more energyefficient and affordable, often with reduced features compared to the standard versions such as very limited memory and processing power for typical machine learning models. However, modern machine learning models can have millions of parameters, resulting in a large memory footprint. This complexity not only makes it difficult to deploy these large models on resource constrained devices but also increases the risk of latency and inefficiency in processing, which is crucial in some cases where real-time responses are required such as autonomous driving and medical diagnostics. In recent years, neural networks have seen significant advancements in model optimization techniques that help deployment and inference on these small devices. This narrative review offers a thorough examination of the progression and latest developments in neural network optimization, focusing on key areas such as quantization, pruning, knowledge distillation, and neural architecture search. It examines how these algorithmic solutions have progressed and how new approaches have improved upon the existing techniques making neural networks more efficient. This review is designed for machine learning researchers, practitioners, and engineers who may be unfamiliar with these methods but wish to explore the available techniques. It highlights ongoing research in optimizing networks for achieving better performance, lowering energy consumption, and enabling faster training times, all of which play an important role in the continued scalability of neural networks. Additionally, it identifies gaps in current research and provides a foundation for future studies, aiming to enhance the applicability and effectiveness of existing optimization strategies.

  4. В работе предложен адаптивный алгоритм, моделирующий процесс формирования начальных поведенческих навыков на примере системы «глаза–манипулятор» анимата. Ситуация формирования начальных поведенческих навыков возникает, например, когда ребенок осваивает управление своими руками на основе понимания связи между исходно неидентифицированными пятнами на сетчатке своих глаз и положением реального предмета. Поскольку навыки управления телом не «вшиты» исходно в головной и спинной мозг на уровне инстинктов, то человеческому ребенку, как и большинству детенышей других млекопитающих, приходится осваивать эти навыки в режиме поискового поведения. Поисковое поведение начинается с метода проб и ошибок в чистом виде, затем его вклад постепенно уменьшается по мере освоения своего тела и окружающей среды. Поскольку образцов правильного поведения на этом этапе развития организм не имеет, то единственным способом выделения правильных навыков является положительное подкрепление при достижении цели. Ключевой особенностью предлагаемого алгоритма является фиксация в режиме импринтинга только завершающих действий, которые привели к успеху, или, что очень важно, привели к уже знакомой запечатленной ситуации, однозначно приводящей к успеху. Со временем непрерывная цепочка правильных действий удлиняется — максимально используется предыдущий позитивный опыт, а негативный «забывается» и не используется. Тем самым наблюдается постепенная замена случайного поиска целенаправленными действиями, что наблюдается и у реальных детенышей.

    Тем самым алгоритм способен устанавливать соответствие между закономерностями окружающего мира и «внутренними ощущениями», внутренним состоянием самого анимата. В предлагаемой модели анимата использовалось 2 типа нейросетей: 1) нейросеть NET1, на вход которой подавались текущие положения кисти руки и целевой точки, а на выходе — двигательные команды, направляющие «кисть» манипулятора анимата к целевой точке; 2) нейросеть NET2, которая на входе получала координаты цели и текущей координаты «кисти», а на выходе формировала значение вероятности того, что анимату уже «знакома» эта ситуация и он «знает», как на нее реагировать. Благодаря такой архитектуре у анимата есть возможность опираться на «опыт» нейросети в распознанных ситуациях, когда отклик от сети NET2 близок к 1, и, с другой стороны, запускать случайный поиск, когда опыта функционирования в этой области зрительного поля у анимата нет (отклик NET2 близок к 0).

    Tumanyan A.G., Bartsev S.I.
    Model of formation of primary behavioral patterns with adaptive behavior based on the combination of random search and experience
    Computer Research and Modeling, 2016, v. 8, no. 6, pp. 941-950

    In this paper, we propose an adaptive algorithm that simulates the process of forming the initial behavioral skills on the example of the system ‘eye-arm’ animat. The situation is the formation of the initial behavioral skills occurs, for example, when a child masters the management of their hands by understanding the relationship between baseline unidentified spots on the retina of his eye and the position of the real object. Since the body control skills are not ‘hardcoded’ initially in the brain and the spinal cord at the level of instincts, the human child, like most young of other mammals, it is necessary to develop these skills in search behavior mode. Exploratory behavior begins with trial and error and then its contribution is gradually reduced as the development of the body and its environment. Since the correct behavior patterns at this stage of development of the organism does not exist for now, then the only way to select the right skills is a positive reinforcement to achieve the objective. A key feature of the proposed algorithm is to fix in the imprinting mode, only the final action that led to success, and that is very important, led to the familiar imprinted situation clearly leads to success. Over time, the continuous chain is lengthened right action — maximum use of previous positive experiences and negative ‘forgotten’ and not used.

    Thus there is the gradual replacement of the random search purposeful actions that observed in the real young. Thus, the algorithm is able to establish a correspondence between the laws of the world and the ‘inner feelings’, the internal state of the animat. The proposed animat model was used 2 types of neural networks: 1) neural network NET1 to the input current which is fed to the position of the brush arms and the target point, and the output of motor commands, directing ‘brush’ manipulator animat to the target point; 2) neural network NET2 is received at the input of target coordinates and the current coordinates of the ‘brush’ and the output value is formed likelihood that the animat already ‘know’ this situation, and he ‘knows’ how to react to it. With this architecture at the animat has to rely on the ‘experience’ of neural networks to recognize situations where the response from NET2 network of close to 1, and on the other hand, run a random search, when the experience of functioning in this area of the visual field in animat not (response NET2 close to 0).

    Просмотров за год: 6. Цитирований: 2 (РИНЦ).
  5. Руденко В.Д., Юдин Н.Е., Васин А.А.
    Обзор выпуклой оптимизации марковских процессов принятия решений
    Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 329-353

    В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — стратегии, принимающие решение по известному состоянию среды на данный момент. Также рассмотрены основные итеративные алгоритмы оптимизации политики, построенные на решении уравнений Беллмана. Важным разделом данной статьи стало рассмотрение альтернативы к подходу $Q$-обучения — метода прямой максимизации средней награды агента для избранной стратегии от взаимодействия со средой. Таким образом, решение данной задачи выпуклой оптимизации представимо в виде задачи линейного программирования. В работе демонстрируется, как аппарат выпуклой оптимизации применяется для решения задачи обучения с подкреплением (Reinforcement Learning, RL). В частности, показано, как понятие сильной двойственности позволяет естественно модифицировать постановку задачи RL, показывая эквивалентность между максимизацией награды агента и поиском его оптимальной стратегии. В работе также рассматривается вопрос сложности оптимизации MDP относительно количества троек «состояние–действие–награда», получаемых в результате взаимодействия со средой. Представлены оптимальные границы сложности решения MDP в случае эргодического процесса с бесконечным горизонтом, а также в случае нестационарного процесса с конечным горизонтом, который можно перезапускать несколько раз подряд или сразу запускать параллельно в нескольких потоках. Также в обзоре рассмотрены последние результаты по уменьшению зазора нижней и верхней оценки сложности оптимизации MDP с усредненным вознаграждением (Averaged MDP, AMDP). В заключение рассматриваются вещественнозначная параметризация политики агента и класс градиентных методов оптимизации через максимизацию $Q$-функции ценности. В частности, представлен специальный класс MDP с ограничениями на ценность политики (Constrained Markov Decision Process, CMDP), для которых предложен общий прямодвойственный подход к оптимизации, обладающий сильной двойственностью.

    Rudenko V.D., Yudin N.E., Vasin A.A.
    Survey of convex optimization of Markov decision processes
    Computer Research and Modeling, 2023, v. 15, no. 2, pp. 329-353

    This article reviews both historical achievements and modern results in the field of Markov Decision Process (MDP) and convex optimization. This review is the first attempt to cover the field of reinforcement learning in Russian in the context of convex optimization. The fundamental Bellman equation and the criteria of optimality of policy — strategies based on it, which make decisions based on the known state of the environment at the moment, are considered. The main iterative algorithms of policy optimization based on the solution of the Bellman equations are also considered. An important section of this article was the consideration of an alternative to the $Q$-learning approach — the method of direct maximization of the agent’s average reward for the chosen strategy from interaction with the environment. Thus, the solution of this convex optimization problem can be represented as a linear programming problem. The paper demonstrates how the convex optimization apparatus is used to solve the problem of Reinforcement Learning (RL). In particular, it is shown how the concept of strong duality allows us to naturally modify the formulation of the RL problem, showing the equivalence between maximizing the agent’s reward and finding his optimal strategy. The paper also discusses the complexity of MDP optimization with respect to the number of state–action–reward triples obtained as a result of interaction with the environment. The optimal limits of the MDP solution complexity are presented in the case of an ergodic process with an infinite horizon, as well as in the case of a non-stationary process with a finite horizon, which can be restarted several times in a row or immediately run in parallel in several threads. The review also reviews the latest results on reducing the gap between the lower and upper estimates of the complexity of MDP optimization with average remuneration (Averaged MDP, AMDP). In conclusion, the real-valued parametrization of agent policy and a class of gradient optimization methods through maximizing the $Q$-function of value are considered. In particular, a special class of MDPs with restrictions on the value of policy (Constrained Markov Decision Process, CMDP) is presented, for which a general direct-dual approach to optimization with strong duality is proposed.

  6. В статье приведен пример конечно-элементного моделирования структурного элемента гибких тканых композитов. Армирующей тканью является полотняное переплетение нитей из трощеного жгута. Нити представляются упругим материалом. Матрицей рассматриваемого материала является мягкий полимер с возможностью возникновения необратимых деформаций. Учтена возможность возникновения повреждений в структуре материала при высоких нагрузках. Построена полная диаграмма деформирования при одноосном растяжении. Достоверность модели подтверждается проведенными натурными экспериментами.

    Lyubimov A.K., Kozhanov D.A.
    Modeling the structural element of flexible woven composites under static tension using the method of finite element in ANSYS
    Computer Research and Modeling, 2016, v. 8, no. 1, pp. 113-120

    The article gives the example of finite-element modeling of the structural element is a flexible woven composites. The reinforcing cloth is a plain weave of threads of assembled harness. Threads are represented by elastic material. The matrix of the material is a soft polymer with the possibility of irreversible deformations. Taken into account the possibility of the occurrence of damage in the structure of the material under high loads. Built detailed diagram of deformation under uniaxial tension. The accuracy of the model is conrmed by in situ experiments.

    Просмотров за год: 1. Цитирований: 7 (РИНЦ).
  7. Аксёнов А.А., Жлуктов С.В., Каширин В.С., Сазонова М.Л., Черный С.Г., Дроздова Е.А., Роде А.А.
    Численное моделирование в ПК FlowVision распыла и испарения сырья в потоке газа-теплоносителя при печном производстве технического углерода
    Компьютерные исследования и моделирование, 2023, т. 15, № 4, с. 921-939

    Технический углерод (сажа) — продукт, получаемый термическим разложением (пиролизом) углеводородов (как правило, нефти) в потоке газа-теплоносителя. Технический углерод широко применяется в качестве усиливающего компонента в производстве резин и пластических масс. В производстве шин используется 70% всего выпускаемого углерода. При печном производстве углерода жидкое углеводородное сырье впрыскивается форсунками в поток продуктов сгорания природного газа. Происходит распыл и испарение сырья с дальнейшим пиролизом. Важно, чтобы сырье полностью испарилось до начала пиролиза, иначе будет образовываться кокс, загрязняющий продукт. Для совершенствования технологии производства углерода, в частности обеспечения полного испарения сырья до начала пиролиза, невозможно обойтись без математического моделирования самого процесса. Оно является важнейшим способом получения наиболее полной и детальной информации об особенностях работы реактора.

    В программном комплексе (ПК) FlowVision разрабатываются трехмерная математическая модель и метод расчета распыла и испарения сырья в потоке газа-теплоносителя. Для отработки методики моделирования в качестве сырья выбрана вода. Рабочими веществами в камере реактора являются продукты сгорания природного газа. Движение капель сырья и испарение в потоке газа моделируются в рамках эйлерова подхода взаимодействия дисперсной и сплошной сред. Представлены результаты расчета распыла и испарения сырья в реакторе для производства технического углерода. По найденному в каждый момент времени распределению множества капель распыла сырья в реакторе определяется важный параметр, характеризующий мелкость распыла — средний саутеровский диаметр.

    Aksenov A.A., Zhluktov S.V., Kashirin V.S., Sazonova M.L., Cherny S.G., Drozdova E.A., Rode A.A.
    Numerical modeling of raw atomization and vaporization by flow of heat carrier gas in furnace technical carbon production into FlowVision
    Computer Research and Modeling, 2023, v. 15, no. 4, pp. 921-939

    Technical carbon (soot) is a product obtained by thermal decomposition (pyrolysis) of hydrocarbons (usually oil) in a stream of heat carrier gas. Technical carbon is widely used as a reinforcing component in the production of rubber and plastic masses. Tire production uses 70% of all carbon produced. In furnace carbon production, the liquid hydrocarbon feedstock is injected into the natural gas combustion product stream through nozzles. The raw material is atomized and vaporized with further pyrolysis. It is important for the raw material to be completely evaporated before the pyrolysis process starts, otherwise coke, that contaminates the product, will be produced. It is impossible to operate without mathematical modeling of the process itself in order to improve the carbon production technology, in particular, to provide the complete evaporation of the raw material prior to the pyrolysis process. Mathematical modelling is the most important way to obtain the most complete and detailed information about the peculiarities of reactor operation.

    A three-dimensional mathematical model and calculation method for raw material atomization and evaporation in the thermal gas flow are being developed in the FlowVision software package PC. Water is selected as a raw material to work out the modeling technique. The working substances in the reactor chamber are the combustion products of natural gas. The motion of raw material droplets and evaporation in the gas stream are modeled in the framework of the Eulerian approach of interaction between dispersed and continuous media. The simulation results of raw materials atomization and evaporation in a real reactor for technical carbon production are presented. Numerical method allows to determine an important atomization characteristic: average Sauter diameter. That parameter could be defined from distribution of droplets of raw material at each time of spray forming.

  8. Саленек И.А., Селиверстов Я.А., Селиверстов С.А., Софронова Е.А.
    Повышение качества генерации маршрутов в SUMO на основе данных с детекторов с использованием обучения с подкреплением
    Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 137-146

    Данная работа предлагает новый подход к построению высокоточных маршрутов на основе данных от транспортных детекторов в пакете моделирования трафика SUMO. Существующие инструменты, такие как flowrouter и routeSampler, имеют ряд недостатков, таких как отсутствие взаимодействия с сетью в процессе построения маршрутов. Наш rlRouter использует мультиагентное обучение с подкреплением (MARL), где агенты — это входящие полосы движения, а окружающая среда — дорожная сеть. Добавляя в сеть транспортные средства с определенными маршрутами, агенты получают вознаграждение за сопоставление данных с детекторами транспорта. В качестве алгоритма мультиагентного обучения с подкреплением использовался DQN с разделением параметров между агентами и LSTM-слоем для обработки последовательных данных.

    Поскольку rlRouter обучается внутри симуляции SUMO, он может лучше восстанавливать маршруты, принимая во внимание взаимодействие транспортных средств внутри сети друг с другом и с сетевой инфраструктурой. Мы смоделировали различные дорожные ситуации на трех разных перекрестках, чтобы сравнить производительность маршрутизаторов SUMO с rlRouter. Мы использовали среднюю абсолютную ошибку (MAE) в качестве меры отклонения кумулятивных данных детекторов и от данных маршрутов. rlRouter позволил добиться высокого соответствия данным с детекторов. Мы также обнаружили, что, максимизируя вознаграждение за соответствие детекторам, результирующие маршруты также становятся ближе к реальным. Несмотря на то, что маршруты, восстановленные с помощью rlRouter, превосходят маршруты, полученные с помощью инструментов SUMO, они не полностью соответствуют реальным из-за естественных ограничений петлевых детекторов. Чтобы обеспечить более правдоподобные маршруты, необходимо оборудовать перекрестки другими видами транспортных счетчиков, например, детекторами-камерами.

    Salenek I.A., Seliverstov Y.A., Seliverstov S.A., Sofronova E.A.
    Improving the quality of route generation in SUMO based on data from detectors using reinforcement learning
    Computer Research and Modeling, 2024, v. 16, no. 1, pp. 137-146

    This work provides a new approach for constructing high-precision routes based on data from transport detectors inside the SUMO traffic modeling package. Existing tools such as flowrouter and routeSampler have a number of disadvantages, such as the lack of interaction with the network in the process of building routes. Our rlRouter uses multi-agent reinforcement learning (MARL), where the agents are incoming lanes and the environment is the road network. By performing actions to launch vehicles, agents receive a reward for matching data from transport detectors. Parameter Sharing DQN with the LSTM backbone of the Q-function was used as an algorithm for multi-agent reinforcement learning.

    Since the rlRouter is trained inside the SUMO simulation, it can restore routes better by taking into account the interaction of vehicles within the network with each other and with the network infrastructure. We have modeled diverse traffic situations on three different junctions in order to compare the performance of SUMO’s routers with the rlRouter. We used Mean Absoluter Error (MAE) as the measure of the deviation from both cumulative detectors and routes data. The rlRouter achieved the highest compliance with the data from the detectors. We also found that by maximizing the reward for matching detectors, the resulting routes also get closer to the real ones. Despite the fact that the routes recovered using rlRouter are superior to the routes obtained using SUMO tools, they do not fully correspond to the real ones, due to the natural limitations of induction-loop detectors. To achieve more plausible routes, it is necessary to equip junctions with other types of transport counters, for example, camera detectors.

  9. Юмаганов А.С., Агафонов А.А., Мясников В.В.
    Адаптивное управление сигналами светофоров на основе обучения с подкреплением, инвариантное к конфигурации светофорного объекта
    Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1253-1269

    В работе представлен метод адаптивного управления сигналами светофоров, инвариантный к конфигурации светофорного объекта. Предложенный метод использует одну модель нейронной сети для управления светофорами различных конфигураций, отличающихся как по числу контролируемых полос движения, так и по используемому набору фаз. Для описания пространства состояний используется как динамическая информация о состоянии транспортного потока, так и статические данные о конфигурации контролируемого перекрестка. Для повышения скорости обучения модели предлагается использовать эксперта, предоставляющего дополнительные данные для обучения модели. В качестве эксперта используется метод адаптивного управления, основанный на максимизации взвешенного потока транспортных средств через перекресток. Экспериментальные исследования разработанного метода, проведенные в системе микроскопического моделирования движения транспортных средств, подтвердили его работоспособность и эффективность. Была показана возможность применения разработанного метода в сценарии моделирования, не используемом в процессе обучения. Представлено сравнение предложенного метода с другими известными решениями задачи управления светофорным объектом, в том числе с методом, используемым в качестве эксперта. В большинстве сценариев разработанный метод показал лучший результат по критериям среднего времени движения и среднего времени ожидания. Преимущество над методом, используемым в качестве эксперта, в зависимости от исследуемого сценария составило от 2% до 12% по критерию среднего времени ожидания транспортных средств и от 1% до 7% по критерию среднего времени движения.

    Yumaganov A.S., Agafonov A.A., Myasnikov V.V.
    Reinforcement learning-based adaptive traffic signal control invariant to traffic signal configuration
    Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1253-1269

    In this paper, we propose an adaptive traffic signal control method invariant to the configuration of the traffic signal. The proposed method uses one neural network model to control traffic signals of various configurations, differing both in the number of controlled lanes and in the used traffic light control cycle (set of phases). To describe the state space, both dynamic information about the current state of the traffic flow and static data about the configuration of a controlled intersection are used. To increase the speed of model training and reduce the required amount of data required for model convergence, it is proposed to use an “expert” who provides additional data for model training. As an expert, we propose to use an adaptive control method based on maximizing the weighted flow of vehicles through an intersection. Experimental studies of the effectiveness of the developed method were carried out in a microscopic simulation software package. The obtained results confirmed the effectiveness of the proposed method in different simulation scenarios. The possibility of using the developed method in a simulation scenario that is not used in the training process was shown. We provide a comparison of the proposed method with other baseline solutions, including the method used as an “expert”. In most scenarios, the developed method showed the best results by average travel time and average waiting time criteria. The advantage over the method used as an expert, depending on the scenario under study, ranged from 2% to 12% according to the criterion of average vehicle waiting time and from 1% to 7% according to the criterion of average travel time.

  10. Чэнь Ц., Лобанов А.В., Рогозин А.В.
    Решение негладких распределенных минимаксных задач с применением техники сглаживания
    Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 469-480

    Распределенные седловые задачи имеют множество различных приложений в оптимизации, теории игр и машинном обучении. Например, обучение генеративных состязательных сетей может быть представлено как минимаксная задача, а также задача обучения линейных моделей с регуляризатором может быть переписана как задача поиска седловой точки. В данной статье исследуются распределенные негладкие седловые задачи с липшицевыми целевыми функциями (возможно, недифференцируемыми). Целевая функция представляется в виде суммы нескольких слагаемых, распределенных между группой вычислительных узлов. Каждый узел имеет доступ к локально хранимой функции. Узлы, или агенты, обмениваются информацией через некоторую коммуникационную сеть, которая может быть централизованной или децентрализованной. В централизованной сети есть универсальный агрегатор информации (сервер или центральный узел), который напрямую взаимодействует с каждым из агентов и, следовательно, может координировать процесс оптимизации. В децентрализованной сети все узлы равноправны, серверный узел отсутствует, и каждый агент может общаться только со своими непосредственными соседями.

    Мы предполагаем, что каждый из узлов локально хранит свою целевую функцию и может вычислить ее значение в заданных точках, т. е. имеет доступ к оракулу нулевого порядка. Информация нулевого порядка используется, когда градиент функции является трудно вычислимым, а также когда его невозможно вычислить или когда функция не дифференцируема. Например, в задачах обучения с подкреплением необходимо сгенерировать траекторию для оценки текущей стратегии. Этот процесс генерирования траектории и оценки политики можно интерпретировать как вычисление значения функции. Мы предлагаем подход, использующий технику сглаживания, т. е. применяющий метод первого порядка к сглаженной версии исходной функции. Можно показать, что стохастический градиент сглаженной функции можно рассматривать как случайную двухточечную аппроксимацию градиента исходной функции. Подходы, основанные на сглаживании, были изучены для распределенной минимизации нулевого порядка, и наша статья обобщает метод сглаживания целевой функции на седловые задачи.

    Chen J., Lobanov A.V., Rogozin A.V.
    Nonsmooth Distributed Min-Max Optimization Using the Smoothing Technique
    Computer Research and Modeling, 2023, v. 15, no. 2, pp. 469-480

    Distributed saddle point problems (SPPs) have numerous applications in optimization, matrix games and machine learning. For example, the training of generated adversarial networks is represented as a min-max optimization problem, and training regularized linear models can be reformulated as an SPP as well. This paper studies distributed nonsmooth SPPs with Lipschitz-continuous objective functions. The objective function is represented as a sum of several components that are distributed between groups of computational nodes. The nodes, or agents, exchange information through some communication network that may be centralized or decentralized. A centralized network has a universal information aggregator (a server, or master node) that directly communicates to each of the agents and therefore can coordinate the optimization process. In a decentralized network, all the nodes are equal, the server node is not present, and each agent only communicates to its immediate neighbors.

    We assume that each of the nodes locally holds its objective and can compute its value at given points, i. e. has access to zero-order oracle. Zero-order information is used when the gradient of the function is costly, not possible to compute or when the function is not differentiable. For example, in reinforcement learning one needs to generate a trajectory to evaluate the current policy. This policy evaluation process can be interpreted as the computation of the function value. We propose an approach that uses a smoothing technique, i. e., applies a first-order method to the smoothed version of the initial function. It can be shown that the stochastic gradient of the smoothed function can be viewed as a random two-point gradient approximation of the initial function. Smoothing approaches have been studied for distributed zero-order minimization, and our paper generalizes the smoothing technique on SPPs.

Страницы: предыдущая следующая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.