Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Управление высокоманевренным мобильным роботом в задаче следования за объектом
Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1301-1321Данная статья посвящена разработке алгоритма траекторного управления высокоманевренной транспортной четырехколесной роботехнической платформой, оснащенной mecanum-колесами, с целью организации ее движения за некоторым подвижным объектом. Представлен расчет кинематических соотношений данной платформы в фиксированной системе координат, необходимый для определения угловых скоростей колес робота в зависимости от заданного вектора скорости. Разработан алгоритм движения робота за мобильным объектом на плоскости без препятствий на основе использования модифицированного метода погони с использованием разных видов управляющих функций. Метод погони заключается в том, что вектор скорости геометрического центра платформы сонаправлен с вектором, соединяющим геометрический центр платформы и движущийся объект. Реализовано два вида управляющих функций: кусочная и постоянная. Под кусочной функцией имеется в виду управление с режимами переключения в зависимости от расстояния от робота до цели. Главной особенностью кусочной функции является плавное изменение скорости робота. Также управляющие функции разделяются по характеру поведения при приближении робота к цели. При применении одной из кусочных функций движение робота замедляется при достижении определенного расстояние между роботом и целью и полностью останавливается при критичном расстоянии. Другой вид поведения при приближении к цели заключается в изменении направления вектора скорости на противоположный, если расстояние между платформой и объектом будет минимально допустимым, что позволяет избегать столкновения при движении цели в направления робота. Данный вид поведения при приближении к цели реализован для кусочной и постоянной функции. Выполнено численное моделирование алгоритма управления роботом для различных управляющих функций в задаче преследования цели, где цель движется по окружности. Представлен псевдокод алгоритма управления и управляющих функций. Показаны графики траектории робота при движении за целью, изменения скорости, изменения угловых скоростей колес от времени для различных управляющих функций.
Motion control by a highly maneuverable mobile robot in the task of following an object
Computer Research and Modeling, 2023, v. 15, no. 5, pp. 1301-1321This article is devoted to the development of an algorithm for trajectory control of a highly maneuverable four-wheeled robotic transport platform equipped with mecanum wheels, in order to organize its movement behind some moving object. The calculation of the kinematic ratios of this platform in a fixed coordinate system is presented, which is necessary to determine the angular velocities of the robot wheels depending on a given velocity vector. An algorithm has been developed for the robot to follow a mobile object on a plane without obstacles based on the use of a modified chase method using different types of control functions. The chase method consists in the fact that the velocity vector of the geometric center of the platform is co-directed with the vector connecting the geometric center of the platform and the moving object. Two types of control functions are implemented: piecewise and constant. The piecewise function means control with switching modes depending on the distance from the robot to the target. The main feature of the piecewise function is a smooth change in the robot’s speed. Also, the control functions are divided according to the nature of behavior when the robot approaches the target. When using one of the piecewise functions, the robot’s movement slows down when a certain distance between the robot and the target is reached and stops completely at a critical distance. Another type of behavior when approaching the target is to change the direction of the velocity vector to the opposite, if the distance between the platform and the object is the minimum allowable, which avoids collisions when the target moves in the direction of the robot. This type of behavior when approaching the goal is implemented for a piecewise and constant function. Numerical simulation of the robot control algorithm for various control functions in the task of chasing a target, where the target moves in a circle, is performed. The pseudocode of the control algorithm and control functions is presented. Graphs of the robot’s trajectory when moving behind the target, speed changes, changes in the angular velocities of the wheels from time to time for various control functions are shown.
-
Эффект возбуждения подкритических колебаний в стохастических системах с запаздыванием. Часть II. Управление равновесием жидкости
Компьютерные исследования и моделирование, 2012, т. 4, № 2, с. 369-389В работе теоретически и экспериментально рассматривается задача об автоматическом поддержании механического равновесия неоднородно нагретой жидкости в термосифоне с помощью подсистемы, которая подавляет конвекцию посредством малых изменений ориентации системы в пространстве. Обнаружено, что чрезмерное усиление обратной связи возбуждает в системе колебания, причина которых кроется в запаздывании работы контроллера. При наличии шума колебания возникают даже тогда, когда детерминистское описание предсказывает стационарное поведение. Получено хорошее согласие между экспериментом и теорией.
Effect of subcritical excitation of oscillations in stochastic systems with time delay. Part II. Control of fluid equilibrium
Computer Research and Modeling, 2012, v. 4, no. 2, pp. 369-389Просмотров за год: 1. Цитирований: 6 (РИНЦ).The problem of active control of the mechanical equilibrium of an inhomogeneously heated fluid in a thermosyphon is studied theoretically and experimentally. The control is performed by using a feedback subsystem which inhibits convection by changing the orientation of thermosyphon in space. It is shown that excess feedback leads to the excitation of oscillations which are related to a delay in the controller work. In the presense of noise, the oscillations arise even when deterministic description predicts stationary behaviour. The experimental data and theory are in good agreement.
-
Концентрация мощных акустических пучков в вязкоупругом материале с неоднородным распределением воздушных полостей
Компьютерные исследования и моделирование, 2017, т. 9, № 3, с. 517-533Известно, что скорость звука в средах, содержащих сильно сжимаемые включения, например воздушные поры в упругой среде или газовые пузырьки в жидкости, может существенно уменьшиться по сравнению с однородной средой. Эффективный нелинейный параметр такой среды, описывающий проявление нелинейных эффектов, возрастает в сотни и тысячи раз из-за большого различия сжимаемости включений и окружающей среды. Пространственное изменение концентрации таких включений приводит к переменной локальной скорости звука, что, в свою очередь, вызывает пространственно-временное перераспределение акустической энергии в волне и искажению ее временных профилей и поперечной структуры ограниченных пучков. В частности, могут образовываться области фокусировок. При определенных условиях возможно формирование звукового канала, обеспечивающего волноводное распространение акустических сигналов в среде с подобными включениями. Таким образом, возможно управление пространственно-временной структурой акустических волн с помощью введения сильно сжимаемых включений с заданным пространственным распределением и концентрацией. Целью работы является исследование распространения акустических волн в резиноподобном материале с неоднородным пространственным распределением воздушных полостей. Основной задачей является развитие адекватной теории таких структурно-неоднородных сред, теории распространения нелинейных акустических волн и пучков в этих средах, расчет акустических полей и выявление связи параметров среды и включений с характеристиками распространяющихся волн. В работе выведено эволюционное самосогласованное уравнение с интегро-дифференциальным членом, описывающее в низкочастотном приближении распространение интенсивных акустических пучков в среде с сильно сжимаемым полостями. В этом уравнении учтено вторичное акустическое поле, вызванное динамикой колебаний полостей. Развит метод, позволяющий получить точные аналитические решения для поля нелинейного акустического пучка на его оси и правильно рассчитать поле в фокальных областях. Полученные результаты применены для теоретического моделирования материала с неоднородным распределением сильно сжимаемых включений.
The concentration of powerful acoustic beams in a viscoelastic medium with non-uniform distribution of the air cavities
Computer Research and Modeling, 2017, v. 9, no. 3, pp. 517-533Просмотров за год: 6.It is known that the sound speed in medium that contain highly compressible inclusions, e.g. air pores in an elastic medium or gas bubbles in the liquid may be significantly reduced compared to a homogeneous medium. Effective nonlinear parameter of medium, describing the manifestation of nonlinear effects, increases hundreds and thousands of times because of the large differences in the compressibility of the inclusions and the medium. Spatial change in the concentration of such inclusions leads to the variable local sound speed, which in turn calls the spatial-temporal redistribution of acoustic energy in the wave and the distortion of its temporal profiles and cross-section structure of bounded beams. In particular, focal areas can form. Under certain conditions, the sound channel is formed that provides waveguide propagation of acoustic signals in the medium with similar inclusions. Thus, it is possible to control spatial-temporal structure of acoustic waves with the introduction of highly compressible inclusions with a given spatial distribution and concentration. The aim of this work is to study the propagation of acoustic waves in a rubberlike material with non-uniform spatial air cavities. The main objective is the development of an adequate theory of such structurally inhomogeneous media, theory of propagation of nonlinear acoustic waves and beams in these media, the calculation of the acoustic fields and identify the communication parameters of the medium and inclusions with characteristics of propagating waves. In the work the evolutionary self-consistent equation with integro-differential term is obtained describing in the low-frequency approximation propagation of intense acoustic beams in a medium with highly compressible cavities. In this equation the secondary acoustic field is taken into account caused by the dynamics of the cavities oscillations. The method is developed to obtain exact analytical solutions for nonlinear acoustic field of the beam on its axis and to calculate the field in the focal areas. The obtained results are applied to theoretical modeling of a material with non-uniform distribution of strongly compressible inclusions.
-
Пространственно-временная динамика и принцип конкурентного исключения в сообществе
Компьютерные исследования и моделирование, 2017, т. 9, № 5, с. 815-824Проблема видового разнообразия является предметом постоянного внимания со стороны биологов и экологов. Она исследуется и в моделях сообществ. Принцип конкурентного исключения имеет прямое отношение к этой проблеме. Он означает невозможность сосуществования в сообществе видов, когда их количество превосходит число влияющих взаимно независимых факторов. Известный советский микробиолог Г. Ф. Гаузе высказал и экспериментально обосновал схожий принцип о том, что каждый вид имеет свою собственную экологическую нишу и никакие два разных вида не могут занять одну и ту же экологическую нишу. Если под влияющими факторами понимать плотностнозависимые контролирующие рост факторы и экологическую нишу описывать с помощью этих факторов, то принцип Гаузе и принцип конкурентного исключения, по сути, идентичны. К настоящему времени известны многие примеры нарушения этого принципа в природных системах. Одним из таких примеров является сообщество видов планктона, сосуществующих на ограниченном пространстве с небольшим числом влияющих факторов. В современной экологии данный парадокс известен как парадокс планктона или парадокс Хатчинсона. Объяснения этому варьируют от неточного выявления набора факторов до различных видов пространственной и временной неоднородностей. Для двухвидового сообщества с одним фактором влияния с нелинейными функциями роста и смертности доказана возможность устойчивого сосуществования видов. В этой работе рассматриваются ситуации нелинейности и пространственной неоднородности в двухвидовом сообществе с одним фактором влияния. Показано, что при нелинейных зависимостях от плотности популяции устойчивое стационарное сосуществование видов возможно в широком диапазоне изменения параметров. Пространственная неоднородность способствует нарушению принципа конкурентного исключения и в случаях неустойчивости стационарного состояния по Тьюрингу. В соответствии с общей теорией возникают квазистационарные устойчивые структуры сосуществования двух видов при одном влияющем факторе. В работе показано, что неустойчивость по Тьюрингу возможна, если хотя бы один из видов оказывает положительное влияние на фактор. Нелинейность модели по фазовым переменным и ее пространственная распределенность порождают нарушения принципа конкурентного исключения (и принципа Гаузе) как в виде устойчивых пространственно-однородных состояний, так и в виде квазиустойчивых пространственно-неоднородных структур при неустойчивом стационарном состоянии сообщества.
Ключевые слова: сообщество, видовая структура, математическая модель, фактор, неустойчивость по Тьюрингу.
Spatiotemporal dynamics and the principle of competitive exclusion in community
Computer Research and Modeling, 2017, v. 9, no. 5, pp. 815-824Просмотров за год: 11.Execution or violation of the principle of competitive exclusion in communities is the subject of many studies. The principle of competitive exclusion means that coexistence of species in community is impossible if the number of species exceeds the number of controlling mutually independent factors. At that time there are many examples displaying the violations of this principle in the natural systems. The explanations for this paradox vary from inexact identification of the set of factors to various types of spatial and temporal heterogeneities. One of the factors breaking the principle of competitive exclusion is intraspecific competition. This study holds the model of community with two species and one influencing factor with density-dependent mortality and spatial heterogeneity. For such models possibility of the existence of stable equilibrium is proved in case of spatial homogeneity and negative effect of the species on the factor. Our purpose is analysis of possible variants of dynamics of the system with spatial heterogeneity under the various directions of the species effect on the influencing factor. Numerical analysis showed that there is stable coexistence of the species agreed with homogenous spatial distributions of the species if the species effects on the influencing factor are negative. Density-dependent mortality and spatial heterogeneity lead to violation of the principle of competitive exclusion when equilibriums are Turing unstable. In this case stable spatial heterogeneous patterns can arise. It is shown that Turing instability is possible if at least one of the species effects is positive. Model nonlinearity and spatial heterogeneity cause violation of the principle of competitive exclusion in terms of both stable spatial homogenous states and quasistable spatial heterogeneous patterns.
-
Моделирование трендов динамики объема и структуры накопленной кредитной задолженности в банковской системе
Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 965-978Объем и структура накопленной кредитной задолженности перед банковской системой зависят от множества факторов, важнейшим из которых является текущий и ожидаемый уровень процентных ставок. Изменения в поведении заемщиков в ответ на сигналы денежно-кредитной политики позволяют разрабатывать эконометрические модели, представляющие динамику структуры кредитного портфеля банковской системы по срокам размещения средств. Эти модели помогают рассчитать показатели, характеризующие влияние регулирующих действий со стороны центрального банка на уровень процентного риска в целом. В работе проводилась идентификация четырех видов моделей: дискретной линейной модели, основанной на передаточных функциях, модели в пространстве состояний, классической эконометрической модели ARMAX и нелинейной модели типа Гаммерштейна – Винера. Для их описания использовался формальный язык теории автоматического управления, а для идентификации — программный пакет MATLAB. В ходе исследования было выявлено, что для краткосрочного прогнозирования объема и структуры кредитной задолженности больше всего подходит дискретная линейная модель в пространстве состояний, позволяющая прогнозировать тренды по структуре накопленной кредитной задолженности на прогнозном горизонте в 1 год. На примере реальных данных по российской банковской системе модель показывает высокую чувствительность реакции на изменения в денежно-кредитной политике, проводимой центральным банком РФ, структуры кредитной задолженности по срокам ее погашения. Так, при резком повышении процентных ставок в ответ на внешние рыночные шоки заемщики предпочитают сокращать сроки кредитования, при этом общий уровень задолженности повышается прежде всего за счет возрастающей переоценки номинального долга. При формировании устойчивого тренда снижения процентных ставок структура задолженности смещается в сторону долгосрочных кредитов.
Ключевые слова: кредитная задолженность, процентная ставка, динамическое моделирование, модель в пространстве состояний, прогнозирование.
Modelling of trends in the volume and structure of accumulated credit indebtedness in the banking system
Computer Research and Modeling, 2019, v. 11, no. 5, pp. 965-978The volume and structure of accumulated credit debt to the banking system depends on many factors, the most important of which is the level of interest rates. The correct assessment of borrowers’ reaction to the changes in the monetary policy allows to develop econometric models, representing the structure of the credit portfolio in the banking system by terms of lending. These models help to calculate indicators characterizing the level of interest rate risk in the whole system. In the study, we carried out the identification of four types of models: discrete linear model based on transfer functions; the state-space model; the classical econometric model ARMAX, and a nonlinear Hammerstein –Wiener model. To describe them, we employed the formal language of automatic control theory; to identify the model, we used the MATLAB software pack-age. The study revealed that the discrete linear state-space model is most suitable for short-term forecasting of both the volume and the structure of credit debt, which in turn allows to predict trends in the structure of accumulated credit debt on the forecasting horizon of 1 year. The model based on the real data has shown a high sensitivity of the structure of credit debt by pay back periods reaction to the changes in the Ñentral Bank monetary policy. Thus, a sharp increase in interest rates in response to external market shocks leads to shortening of credit terms by borrowers, at the same time the overall level of debt rises, primarily due to the increasing revaluation of nominal debt. During the stable falling trend of interest rates, the structure shifts toward long-term debts.
-
Численный метод нахождения равновесий Нэша и Штакельберга в моделях контроля качества речных вод
Компьютерные исследования и моделирование, 2020, т. 12, № 3, с. 653-667В статье рассмотрена задача построения равновесий Нэша и Штакельберга при исследовании динамической системы контроля качества речных вод. Учитывается влияние субъектов управления двух уровней: одного ведущего и нескольких ведомых. В качестве ведущего (супервайзера) выступает природоохранный орган, а в роли ведомых (агентов) — промышленные предприятия. Основной целью супервайзера является поддержание допустимой концентрации загрязняющих веществ в речной воде. Добиться этого он может не единственным образом, поэтому, кроме того, супервайзер стремится к оптимизации своего целевого функционала. Супервайзер воздействует на агентов, назначая величину платы за сброс загрязнений в водоток. Плата за загрязнение от агента поступает в федеральный и местные бюджеты, затем распределяется на общих основаниях. Таким образом, плата увеличивает бюджет супервайзера, что и отражено в его целевом функционале. Причем плата за сброс загрязнений начисляется за количество и/или качество сброшенных загрязнений. К сожалению, для большинства систем контроля качества речных вод такая практика неэффективна из-за малого размера платы за сброс загрязнений. В статье и решается задача определения оптимального размера платы за сброс загрязнений, который позволяет поддерживать качество речной воды в заданном диапазоне.
Агенты преследуют только свои эгоистические цели, выражаемые их целевыми функционалами, и не обращают внимания на состояние речной системы. Управление агента можно рассматривать как часть стока, которую агент очищает, а управление супервайзера — как назначаемый размер платы за сброс оставшихся загрязнений в водоток.
Для описания изменения концентраций загрязняющих веществ в речной системе используется обыкновенное дифференциальное уравнение. Проблема поддержания заданного качества речной воды в рамках предложенной модели исследуется как с точки зрения агентов, так и с точки зрения супервайзера. В первом случае возникает дифференциальная игра в нормальной форме, в которой строится равновесие Нэша, во втором — иерархическая дифференциальная игра, разыгрываемая в соответствии с информационным регламентом игры Штакельберга. Указаны алгоритмы численного построения равновесий Нэша и Штакельберга для широкого класса входных функций. При построении равновесия Нэша возникает необходимость решения задач оптимального управления. Решение этих задач проводится в соответствии с принципом максимума Понтрягина. Строится функция Гамильтона, полученная система дифференциальных уравнений решается численно методом стрельбы и методом конечных разностей. Проведенные численные расчеты показывают, что низкий размер платы за единицу сброшенных в водоток загрязнений приводит к росту концентрации загрязняющих веществ в водотоке, а высокий — к банкротству предприятий. Это приводит к задаче нахождения оптимальной величины платы за сброс загрязнений, то есть к рассмотрению проблемы с точки зрения супервайзера. В этом случае возникает иерархическая дифференциальная игра супервайзера и агентов, в которой ищется равновесие Штакельберга. Возникает задача максимизации целевого функционала супервайзера с учетом управлений агентов, образующих равновесие Нэша. При нахождении оптимальных управлений супервайзера используется метод качественно репрезентативных сценариев, а для агентов — принцип максимума Понтрягина. Проведены численные эксперименты, найден коэффициент системной согласованности. Полученные численные результаты позволяют сделать вывод, что система контроля качества речных вод плохо системно согласована и для достижения стабильного развития системы необходимо иерархическое управление.
Ключевые слова: равновесие Нэша, равновесие Штакельберга, принцип максимума Понтрягина, экономическое управление.
Numerical method for finding Nash and Shtakelberg equilibria in river water quality control models
Computer Research and Modeling, 2020, v. 12, no. 3, pp. 653-667In this paper we consider mathematical model to control water quality. We study a system with two-level hierarchy: one environmental organization (supervisor) at the top level and a few industrial enterprises (agents) at the lower level. The main goal of the supervisor is to keep water pollution level below certain value, while enterprises pollute water, as a side effect of the manufacturing process. Supervisor achieves its goal by charging a penalty for enterprises. On the other hand, enterprises choose how much to purify their wastewater to maximize their income.The fee increases the budget of the supervisor. Moreover, effulent fees are charged for the quantity and/or quality of the discharged pollution. Unfortunately, in practice, such charges are ineffective due to the insufficient tax size. The article solves the problem of determining the optimal size of the charge for pollution discharge, which allows maintaining the quality of river water in the rear range.
We describe system members goals with target functionals, and describe water pollution level and enterprises state as system of ordinary differential equations. We consider the problem from both supervisor and enterprises sides. From agents’ point a normal-form game arises, where we search for Nash equilibrium and for the supervisor, we search for Stackelberg equilibrium. We propose numerical algorithms for finding both Nash and Stackelberg equilibrium. When we construct Nash equilibrium, we solve optimal control problem using Pontryagin’s maximum principle. We construct Hamilton’s function and solve corresponding system of partial differential equations with shooting method and finite difference method. Numerical calculations show that the low penalty for enterprises results in increasing pollution level, when relatively high penalty can result in enterprises bankruptcy. This leads to the problem of choosing optimal penalty, which requires considering problem from the supervisor point. In that case we use the method of qualitatively representative scenarios for supervisor and Pontryagin’s maximum principle for agents to find optimal control for the system. At last, we compute system consistency ratio and test algorithms for different data. The results show that a hierarchical control is required to provide system stability.
-
Теоретико-игровые и рефлексивные модели боевых действий
Компьютерные исследования и моделирование, 2022, т. 14, № 1, с. 179-203Моделирование боевых действий является актуальной научной и практической задачей, направленной на предоставление командирам и штабам количественных оснований для принятия решений. Авторами предложена функция победы в боевых и военных действиях, основанная на функции конфликта Г. Таллока и учитывающая масштаб боевых (военных) действий. На достаточном объеме данных военной статистики выполнена оценка параметра масштаба и найдены его значения для тактического, оперативного и стратегического уровней. Исследованы теоретико-игровые модели «наступление-оборона», в которых стороны решают ближайшую и последующую задачи, имея построение войск в один или несколько эшелонов. На первом этапе моделирования находится решение ближайшей задачи — прорыв (удержание) пунктов обороны, на втором — решение последующей задачи — разгром противника в глубине обороны (контратака и восстановление обороны). Для тактического уровня с использованием равновесия Нэша найдены решения ближайшей задачи (распределение сил сторон по пунктам обороны) в антагонистической игре по трем критериям: а) прорыв слабейшего пункта; б) прорыв хотя бы одного пункта; в) средневзвешенная вероятность. Показано, что наступающей стороне целесообразно использовать критерий «прорыв хотя бы одного пункта», при котором, при прочих равных условиях, обеспечивается максимальная вероятность прорыва пунктов обороны. На втором этапе моделирования для частного случая (стороны при прорыве и удержании пунктов обороны руководствуются критерием прорыва слабейшего пункта) решена задача распределения сил и средств между тактическими задачами (эшелонами) по двум критериям: а) максимизация вероятности прорыва пункта обороны и вероятности разгрома противника в глубине обороны; б) максимизация минимального значения из названных вероятностей (критерий гарантированного результата). Важным аспектом боевых действий является информированность. Рассмотрены несколько примеров рефлексивных игр (игр, характеризующихся сложной взаимной информированностью) и осуществления информационного управления. Показано, при каких условиях информационное управление увеличивает выигрыш игрока, и найдено оптимальное информационное управление.
Ключевые слова: математическая модель, бой, наступление, оборона, функция победы, теоретико-игровая модель, рефлексивное и информационное управление.
Game-theoretic and reflexive combat models
Computer Research and Modeling, 2022, v. 14, no. 1, pp. 179-203Modeling combat operations is an urgent scientific and practical task aimed at providing commanders and staffs with quantitative grounds for making decisions. The authors proposed the function of victory in combat and military operations, based on the function of the conflict by G. Tullock and taking into account the scale of combat (military) operations. On a sufficient volume of military statistics, the scale parameter was assessed and its values were found for the tactical, operational and strategic levels. The game-theoretic models «offensive – defense», in which the sides solve the immediate and subsequent tasks, having the formation of troops in one or several echelons, have been investigated. At the first stage of modeling, the solution of the immediate task is found — the breakthrough (holding) of defense points, at the second — the solution of the subsequent task — the defeat of the enemy in the depth of the defense (counterattack and restoration of defense). For the tactical level, using the Nash equilibrium, solutions were found for the closest problem (distribution of the forces of the sides by points of defense) in an antagonistic game according to three criteria: a) breakthrough of the weakest point, b) breakthrough of at least one point, and c) weighted average probability. It is shown that it is advisable for the attacking side to use the criterion of «breaking through at least one point», in which, all other things being equal, the maximum probability of breaking through the points of defense is ensured. At the second stage of modeling for a particular case (the sides are guided by the criterion of breaking through the weakest point when breaking through and holding defense points), the problem of distributing forces and facilities between tactical tasks (echelons) was solved according to two criteria: a) maximizing the probability of breaking through the defense point and the probability of defeating the enemy in depth defense, b) maximizing the minimum value of the named probabilities (the criterion of the guaranteed result). Awareness is an important aspect of combat operations. Several examples of reflexive games (games characterized by complex mutual awareness) and information management are considered. It is shown under what conditions information control increases the player’s payoff, and the optimal information control is found.
-
Разработка конструкции, моделирование и управление шарниром с переменной упругостью на основе магнитной пружины кручения
Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1323-1347С появлением промышленных роботов робототехника приобретает значение во всемирном масштабе как в экономике, так и в науке. Однако, их возможности сильно ограничены, особенно в части выполнения контактных задач, в которых есть необходимость регулирования или по крайней мере ограничения усилия в контакте. В определенный момент было замечено, что упругость в механической цепи шарнира, считавшаяся ранее негативным фактором, в этомо тношении напротив является полезной. Данное наблюдение привело к появлению роботов с упругими шарнирами, пригодных к выполнению контактных задач и кооперативной деятельности в частности, в результате чего их распространение сегодня становится всё шире. Многие исследователи стремились реализовать подобные устройства не только в виде простейших последовательных упругих приводов, но и посредствомбо лее сложных шарниров с переменной упругостью (ШПУ), способных изменять собственную механическую жесткость. Все упругие шарниры обеспечивают в определенной мере устойчивость к ударным нагрузкам и безопасность взаимодействия с объектами внешней среды, однако изменение жесткости позволяет получить дополнительные преимущества, такие как энерго-эффективность и адаптируемость к задачам.
В настоящей статье представлена новая реализация ШПУ, с магнитной муфтой в качестве упругого элемента. Магнитная передача является бесконтактной, и потому обладает преимуществом с точки зрения снижения чувствительности к смещению и рассогласованию осей. Описание модели трения также упрощается. Кроме того, данная муфта обладает характеристикой жесткости, которая не только не возрастает резко с повышением нагрузки, но становится более плавной, и даже снижается после точки максимума. Вследствие этого, при достижении максимального момента, муфта проскальзывает, после чего положение равновесия уже определяется новой парой полюсов. В итоге данное решение снижает риск механического повреждения. В статье подробно рассмотрен процесс разработки шарнира, представлена его математическая модель. Также предложена реализация системы управления шарниром и проведено компьютерное моделирование, подтверждающее принятые в разработке решения.
Ключевые слова: робототехника, разработка конструкции, система управления, приводы с последовательной упругостью, приводы с переменной упругостью, магнитные пружины, управление с сохранением упругой структуры.
Design, modeling, and control of a variable stiffness joint based on a torsional magnetic spring
Computer Research and Modeling, 2023, v. 15, no. 5, pp. 1323-1347Industrial robots have made it possible for robotics to become a worldwide discipline both in economy and in science. However, their capabilities are limited, especially regarding contact tasks where it is required to regulate or at least limit contact forces. At one point, it was noticed that elasticity in the joint transmission, which was treated as a drawback previously, is actually helpful in this regard. This observation led to the introduction of elastic joint robots that are well-suited to contact tasks and cooperative behavior in particular, so they become more and more widespread nowadays. Many researchers try to implement such devices not with trivial series elastic actuators (SEA) but with more sophisticated variable stiffness actuators (VSA) that can regulate their own mechanical stiffness. All elastic actuators demonstrate shock robustness and safe interaction with external objects to some extent, but when stiffness may be varied, it provides additional benefits, e. g., in terms of energy efficiency and task adaptability. Here, we present a novel variable stiffness actuator with a magnetic coupler as an elastic element. Magnetic transmission is contactless and thus advantageous in terms of robustness to misalignment. In addition, the friction model of the transmission becomes less complex. It also has milder stiffness characteristic than typical mechanical nonlinear springs, moreover, the stiffness curve has a maximum after which it descends. Therefore, when this maximum torque is achieved, the coupler slips, and a new pair of poles defines the equilibrium position. As a result, the risk of damage is smaller for this design solution. The design of the joint is thoroughly described, along with its mathematical model. Finally, the control system is also proposed, and simulation tests confirm the design ideas.
-
Использование реальных данных из нескольких источников для оптимизации транспортных потоков в пакете CTraf
Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 147-159Рассмотрена задача оптимального управления транспортным потоком в сети городских дорог. Управление осуществляется изменением длительностей рабочих фаз светофоров на регулируемых перекрестках. Приведено описание разработанной системы управления. В системе управления предусмотрено использование трех видов управлений: программного, с обратной связью и ручного. При управлении с обратной связью для определения количественных характеристик транспортного потока используются детекторы дорожной инфраструктуры, видеокамеры, индуктивные петлевые и радиолокационные датчики. Обработка сигналов с детекторов позволяет определить состояние транспортного потока в каждый текущий момент времени. Для определения моментов переключения рабочих фаз светофоров количественные характеристики транспортных потоков поступают в математическую модель транспортного потока, реализованную в вычислительной среде системы автоматического управления транспортными потоками. Модель представляет собой систему конечно-разностных рекуррентных уравнений и описывает изменение транспортного потока на каждом участке дороги в каждый такт времени на основе рассчитанных данных по характеристикам транспортного потока в сети, пропускным способностям маневров и распределению потока на перекрестках с альтернативными направлениями движения. Модель обладает свойствами масштабирования и агрегирования. Структура модели зависит от структуры графа управляемой сети дорог, а количество узлов в графе равно количеству рассматриваемых участков дорог сети. Моделирование изменений транспортного потока в режиме реального времени позволяет оптимально определять длительности рабочих фаз светофоров и обеспечивать управление транспортным потоком с обратной связью по его текущему состоянию. В работе рассмотрена система автоматического сбора и обработки данных, поступающих в модель. Для моделирования состояний транспортного потока в сети и решения задачи оптимального управления транспортным потоком разработан программный комплекс CTraf, краткое описание которого представлено в работе. Приведен пример решения задачи оптимального управления транспортным потокам в сети дорог города Москва на основе реальных данных.
Ключевые слова: управление транспортными потоками, оптимальное управление, моделирование транспортных потоков, эволюционные вычисления, обработка гетерогенных данных.
Utilizing multi-source real data for traffic flow optimization in CTraf
Computer Research and Modeling, 2024, v. 16, no. 1, pp. 147-159The problem of optimal control of traffic flow in an urban road network is considered. The control is carried out by varying the duration of the working phases of traffic lights at controlled intersections. A description of the control system developed is given. The control system enables the use of three types of control: open-loop, feedback and manual. In feedback control, road infrastructure detectors, video cameras, inductive loop and radar detectors are used to determine the quantitative characteristics of current traffic flow state. The quantitative characteristics of the traffic flows are fed into a mathematical model of the traffic flow, implemented in the computer environment of an automatic traffic flow control system, in order to determine the moments for switching the working phases of the traffic lights. The model is a system of finite-difference recurrent equations and describes the change in traffic flow on each road section at each time step, based on retrived data on traffic flow characteristics in the network, capacity of maneuvers and flow distribution through alternative maneuvers at intersections. The model has scaling and aggregation properties. The structure of the model depends on the structure of the graph of the controlled road network. The number of nodes in the graph is equal to the number of road sections in the considered network. The simulation of traffic flow changes in real time makes it possible to optimally determine the duration of traffic light operating phases and to provide traffic flow control with feedback based on its current state. The system of automatic collection and processing of input data for the model is presented. In order to model the states of traffic flow in the network and to solve the problem of optimal traffic flow control, the CTraf software package has been developed, a brief description of which is given in the paper. An example of the solution of the optimal control problem of traffic flows on the basis of real data in the road network of Moscow is given.
-
Адаптивное управление сигналами светофоров на основе обучения с подкреплением, инвариантное к конфигурации светофорного объекта
Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1253-1269В работе представлен метод адаптивного управления сигналами светофоров, инвариантный к конфигурации светофорного объекта. Предложенный метод использует одну модель нейронной сети для управления светофорами различных конфигураций, отличающихся как по числу контролируемых полос движения, так и по используемому набору фаз. Для описания пространства состояний используется как динамическая информация о состоянии транспортного потока, так и статические данные о конфигурации контролируемого перекрестка. Для повышения скорости обучения модели предлагается использовать эксперта, предоставляющего дополнительные данные для обучения модели. В качестве эксперта используется метод адаптивного управления, основанный на максимизации взвешенного потока транспортных средств через перекресток. Экспериментальные исследования разработанного метода, проведенные в системе микроскопического моделирования движения транспортных средств, подтвердили его работоспособность и эффективность. Была показана возможность применения разработанного метода в сценарии моделирования, не используемом в процессе обучения. Представлено сравнение предложенного метода с другими известными решениями задачи управления светофорным объектом, в том числе с методом, используемым в качестве эксперта. В большинстве сценариев разработанный метод показал лучший результат по критериям среднего времени движения и среднего времени ожидания. Преимущество над методом, используемым в качестве эксперта, в зависимости от исследуемого сценария составило от 2% до 12% по критерию среднего времени ожидания транспортных средств и от 1% до 7% по критерию среднего времени движения.
Ключевые слова: управление сигналами светофоров, обучение с подкреплением, подключенные транспортные средства, имитационное моделирование.
Reinforcement learning-based adaptive traffic signal control invariant to traffic signal configuration
Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1253-1269In this paper, we propose an adaptive traffic signal control method invariant to the configuration of the traffic signal. The proposed method uses one neural network model to control traffic signals of various configurations, differing both in the number of controlled lanes and in the used traffic light control cycle (set of phases). To describe the state space, both dynamic information about the current state of the traffic flow and static data about the configuration of a controlled intersection are used. To increase the speed of model training and reduce the required amount of data required for model convergence, it is proposed to use an “expert” who provides additional data for model training. As an expert, we propose to use an adaptive control method based on maximizing the weighted flow of vehicles through an intersection. Experimental studies of the effectiveness of the developed method were carried out in a microscopic simulation software package. The obtained results confirmed the effectiveness of the proposed method in different simulation scenarios. The possibility of using the developed method in a simulation scenario that is not used in the training process was shown. We provide a comparison of the proposed method with other baseline solutions, including the method used as an “expert”. In most scenarios, the developed method showed the best results by average travel time and average waiting time criteria. The advantage over the method used as an expert, depending on the scenario under study, ranged from 2% to 12% according to the criterion of average vehicle waiting time and from 1% to 7% according to the criterion of average travel time.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"