Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Исследование влияния антиангиогенной монотерапии на прогрессию гетерогенной опухоли с помощью методов математического моделирования
Компьютерные исследования и моделирование, 2017, т. 9, № 3, с. 487-501В последнее десятилетие в онкологии наряду с классическими цитотоксическими агентами при химиотерапии стали активно использоваться антиангиогенные препараты. Они направлены не на убийство злокачественных клеток, а на блокирование процесса ангиогенеза — роста новых сосудов в опухолевом микроокружении. Вещества, стимулирующие ангиогенез, в частности фактор роста эндотелия сосудов, активно вырабатываются опухолевыми клетками, находящимися в состоянии метаболического стресса. Считается, что блокирование опухолевой неоваскуляризации должно привести к нехватке питательных веществ в опухоли, а значит, и к остановке или по крайней мере к существенному замедлению ее роста. Клиническая практика применения первого антиангиогенного препарата, бевацизумаба, показала, что в ряде случаев такая терапия не влияет на скорость роста опухоли, тогда как для других типов опухолей антиангиогенная терапия обладает высоким противоопухолевым действием. Однако было показано, что при успешном замедлении роста опухоли терапия бевацизумабом может вызывать направленную прогрессию опухоли к более инвазивному, а значит, более летальному типу. Эти данные требуют теоретического анализа и определения ключевых факторов, приводящих к такой опухолевой прогрессии, которая в литературе ассоциируется с эпителиально-мезенхимальным переходом. Для решения этой задачи была разработана пространственно-распределенная математическая модель роста и антиангиогенной терапии гетерогенной опухоли, состоящей из двух субпопуляций злокачественных клеток. Одна из субпопуляций обладает свойствами, присущими эпителиальному фенотипу, — малой подвижностью и высокой скоростью пролиферации, другая соответствует мезенхимальному фенотипу и обладает высокой подвижностью и медленной скоростью деления. Проведено исследование конкурентной борьбы между этими субпопуляциями в гетерогенной опухоли как в случае роста опухоли без терапии, так и в случае монотерапии бевацизумабом. Показано, что постоянное использование антиангиогенного препарата приводит к увеличению области в пространстве параметров, где происходит доминирование мезенхимального фенотипа: в определенном диапазоне параметров в отсутствие терапии доминирует эпителиальный фенотип, а при терапии бевацизумабом начинает доминировать мезенхимальный фенотип. Данный результат является теоретическим обоснованием наблюдаемой в клинической практике направленной прогрессии опухоли к более инвазивному типу при проведении антиангиогенной терапии.
Ключевые слова: математическое моделирование, прогрессия опухоли, антиангиогенная терапия, бевацизумаб.
Mathematical investigation of antiangiogenic monotherapy effect on heterogeneous tumor progression
Computer Research and Modeling, 2017, v. 9, no. 3, pp. 487-501Просмотров за год: 10. Цитирований: 2 (РИНЦ).In the last decade along with classical cytotoxic agents, antiangiogenic drugs have been actively used in cancer chemotherapy. They are not aimed at killing malignant cells, but at blocking the process of angiogenesis, i.e., the growth of new vessels in the tumor and its surrounding tissues. Agents that stimulate angiogenesis, in particular, vascular endothelial growth factor, are actively produced by tumor cells in the state of metabolic stress. It is believed that blocking of tumor neovascularization should lead to a shortage of nutrients flow to the tumor, and thus can stop, or at least significantly slow down its growth. Clinical practice on the use of first antiangiogenic drug bevacizumab has shown that in some cases such therapy does not influence the growth rate of the tumor, whereas for other types of malignant neoplasms antiangiogenic therapy has a high antitumor effect. However, it has been shown that along with successful slowing of tumor growth, therapy with bevacizumab can induce directed tumor progression to a more invasive, and therefore more lethal, type. These data require theoretical analysis and rationale for the evolutionary factors that lead to the observation of epithelial-mesenchymal transition. For this purpose we have developed a spatially distributed mathematical model of growth and antiangiogenic therapy of heterogeneous tumor consisting of two subpopulations of malignant cells. One of subpopulations possesses inherent characteristics of epithelial phenotype, i.e., low motility and high proliferation rate, the other one corresponds to mesenchymal phenotype having high motility and low proliferation rate. We have performed the investigation of competition between these subpopulations of heterogeneous tumor in the cases of tumor growth without therapy and under bevacizumab monotherapy. It is shown that constant use of antiangiogenic drug leads to an increase of the region in parameter space, where the dominance of mesenchymal phenotype takes place, i.e., within a certain range of parameters in the absence of therapy epithelial phenotype is dominant but during bevacizumab administration mesenchymal phenotype begins to dominate. This result provides a theoretical basis of the clinically observed directed tumor progression to more invasive type under antiangiogenic therapy.
-
Борьба с экономической коррупцией при распределении ресурсов
Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 173-185В теоретико-игровой постановке рассмотрена модель борьбы с коррупцией при распределении ресурсов. Система распределения ресурсов включает в свой состав одного принципала (субъект управления верхнего уровня), одного или нескольких супервайзеров (субъектов среднего уровня) и нескольких агентов (субъекты нижнего уровня). Отношения между субъектами разных уровней строятся на основе иерархии: субъект верхнего уровня воздействует (управляет) на субъектов среднего уровня, а те, в свою очередь, на субъектов нижнего уровня. Предполагается, что коррупции подвержен средний уровень управления. Агенты предлагают супервайзеру взятки, в обмен на которые он предоставляет им дополнительные доли ресурса. Предположим также, что принципал не подвержен коррупции и является бескорыстным, не преследующим частных целей. Исследование модели проведено с точки зрения как супервайзера, так и агентов. C точки зрения агентов, возникает некооперативная игра, в которой находится равновесие Нэша. При этом задачи оптимального управления для частного вида входных функций решаются аналитически с помощью принципа максимума Понтрягина. C точки зрения супервайзера, возникает игра, которая ведется в соответствии с регламентом игры Гермейера Г2t. Указан алгоритм построения равновесия. Стратегия наказания находится аналитически. Стратегия поощрения в случае входных функций общего вида находится численно. Строится дискретный аналог непрерывной модели. Предполагается, что все субъекты управления могут изменять свои стратегии поведения в одни и те же моменты времени конечное число раз. В результате от задачи максимизации своего целевого функционала супервайзер переходит к задаче максимизации целевой функции многих переменных. Для нахождения ее наибольшего значения используется метод качественно репрезентативных сценариев. Идея этого метода состоит в том, что из множества потенциально возможных сценариев управления выбираются только сценарии, позволяющие представить качественно различные пути развития системы. В результате мощность этого множества не слишком велика и удается осуществить полный перебор качественно репрезентативных сценариев и найти стратегию поощрения агентов. После ее нахождения супервайзер предлагает агентам механизм управления с обратной связью по управлению, состоящий в наказании агентов при отклонении от выбранной супервайзером стратегии и поощрении в противном случае.
Ключевые слова: равновесие Нэша, равновесие Штакельберга, коррупция, игры Гермейера, супервайзер, принципал, агент, принцип максимума Понтрягина.
Struggle against economic corruption in resource allocation
Computer Research and Modeling, 2019, v. 11, no. 1, pp. 173-185Просмотров за год: 33. Цитирований: 1 (РИНЦ).A dynamic game theoretic model of struggle against corruption in resource allocation is considered. It is supposed that the system of resource allocation includes one principal, one or several supervisors, and several agents. The relations between them are hierarchical: the principal influences to the supervisors, and they in turn exert influence on the agents. It is assumed that the supervisor can be corrupted. The agents propose bribes to the supervisor who in exchange allocates additional resources to them. It is also supposed that the principal is not corrupted and does not have her own purposes. The model is investigated from the point of view of the supervisor and the agents. From the point of view of agents a non-cooperative game arises with a set of Nash equilibria as a solution. The set is found analytically on the base of Pontryagin maximum principle for the specific class of model functions. From the point of view of the supervisor a hierarchical Germeyer game of the type Г2t is built, and the respective algorithm of its solution is proposed. The punishment strategy is found analytically, and the reward strategy is built numerically on the base of a discrete analogue of the initial continuous- time model. It is supposed that all agents can change their strategies in the same time instants only a finite number of times. Thus, the supervisor can maximize his objective function of many variables instead of maximization of the objective functional. A method of qualitatively representative scenarios is used for the solution. The idea of this method consists in that it is possible to choose a very small number of scenarios among all potential ones that represent all qualitatively different trajectories of the system dynamics. These scenarios differ in principle while all other scenarios yield no essentially new results. Then a complete enumeration of the qualitatively representative scenarios becomes possible. After that, the supervisor reports to the agents the rewardpunishment control mechanism.
-
Ускорение работы двухстадийной модели равновесного распределения потоков по сети
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 343-355В работе приведены возможные улучшения двухстадийной модели равновесного распределения транспортных потоков, повышающие качество детализации моделирования и скорость вычисления алгоритмов. Модель состоит из двух блоков, первый блок — модель расчета матрицы корреспонденций, второй блок — модель равновесного распределения транспортных потоков по путям. Равновесием в двухстадийной модели транспортных потоков называют неподвижную точку цепочки из этих двух моделей. Более подробно теория и эксперименты по данной модели были описаны в предыдущих работах авторов. В этой статье в первую очередь рассмотрена возможность сокращения вычислительного времени алгоритма расчета кратчайших путей (в модели стабильной динамики, равновесно распределяющей потоки). В исходном варианте эта задача была выполнена с помощью алгоритма Дийкстры, но, так как после каждой итерации блока распределения транспортных потоков, время, требующееся для прохода по ребру, изменяется не на всех ребрах (и если изменяется, то очень незначительно), во многом этот алгоритм был избыточен. Поэтому были проведены эксперименты с более новым методом, учитывающим подобные особенности, и приведен краткий обзор других ускоряющих подходов для будущих исследований. Эксперименты показали, что в некоторых случаях использование выбранного T-SWSF-алгоритма действительно сокращает вычислительное время. Во вторую очередь в блоке восстановления матрицы корреспонденций алгоритм Синхорна был заменен на алгоритм ускоренного Синхорна (или AAM-алгоритм), что, к сожалению, не показало ожидаемых результатов, расчетное время не изменилось. Инак онец, в третьем и финальном разделе приведена визуализация результатов экспериментов по добавлению платных дорог в двухстадийную модель, что помогло сократить количество перегруженных ребер в сети. Также во введении кратко описана мотивация данных исследований, приведено описание работы двухстадийной модели, а также на маленьком примере с двумя городами разобрано, как с ее помощью выполняется поиск равновесия.
Ключевые слова: модель расчета матрицы корреспонденций, многостадийная модель, модель равновесного распределения потоков по путям.
Speeding up the two-stage simultaneous traffic assignment model
Computer Research and Modeling, 2022, v. 14, no. 2, pp. 343-355This article describes possible improvements for the simultaneous multi-stage transport model code for speeding up computations and improving the model detailing. The model consists of two blocks, where the first block is intended to calculate the correspondence matrix, and the second block computes the equilibrium distribution of traffic flows along the routes. The first block uses a matrix of transport costs that calculates a matrix of correspondences. It describes the costs (time in our case) of travel from one area to another. The second block presents how exactly the drivers (agents) are distributed along the possible paths. So, knowing the distribution of the flows along the paths, it is possible to calculate the cost matrix. Equilibrium in a two-stage traffic flow model is a fixed point of a sequence of the two described models. Thus, in this paper we report an attempt to influence the calculation speed of Dijkstra’s algorithm part of the model. It is used to calculate the shortest path from one point to another, which should be re-calculated after each iteration of the flow distribution part. We also study and implement the road pricing in the model code, as well as we replace the Sinkhorn algorithm in the calculation of the correspondence matrix part with its faster implementation. In the beginning of the paper, we provide a short theoretical overview of the transport modelling motivation; we discuss current approaches to the modelling and provide an example for demonstration of how the whole cycle of multi-stage transport modelling works.
-
Подход к оценке динамики уровня консолидированности отраcли
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 129-140В данной статье нами предложен новый подход к анализу эконометрических параметров отрасли для уровня консолидированности отрасли. Исследование базируется на простой модели управления отраслью в соответствии с моделью из теории автоматического управления. Состояние отрасли оценивается на основе ежеквартальных эконометрических параметров получаемых в обезличенном виде от каждой компании отрасли через налогового регулятора.
Предложен подход к анализу отрасли, который не предусматривает отслеживания эконометрических показателей каждой компании, но рассматривает параметры всех компаний отрасли, как единого объекта.
Ежеквартальными эконометрическими параметрами для каждой компании отрасли являются доход, количество работников, налоги и сборы, уплачиваемые в бюджет, доход от продажи лицензионных прав на программное обеспечение.
Был использован ABC-метод анализа модифицированный до ABCD-метода (D — компании с нулевым вкладом в соответствующую отраслевую метрику) для различных отраслевых метрик. Были построены Парето-кривые для множества эконометрических параметров отрасли.
Для оценки степени монополизированности отрасли был рассчитан индекс Херфиндаля – Хиршмана (ИХХ) для наиболее чувствительных метрик отрасли. С использованием ИХХ было показано что пандемия COVID-19 не привела к существенным изменениям уровня монополизированности российской ИТ-отрасли.
В качестве наиболее наглядного подхода к отображению отрасли было предложено использовать диаграмму рассеяния в сочетании с присвоением компаниям отрасли цвета в соответствии с их позицией на Парето-кривой. Также продемонстрирован эффект влияния процедуры аккредитации путем отображения отрасли в формате диаграммы рассеяния c красно-черным отображением аккредитованных и неаккредитованных компаний, соответственно.
И заключительным результатом, отраженным в статье является предложение использования процедуры сквозной идентификации при организации цепочек поставок программного обеспечения с целью контроля структуры рынка программного обеспечения. Этот подход позволяет избежать множественного учета при продаже лицензий на программное обеспечение в рамках цепочек поставок.
Результаты работы могут быть положены в основу дальнейшего анализа ИТ-отрасли и перехода к агентному моделированию отрасли.
Approach to Estimating the Dynamics of the Industry Consolidation Level
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 129-140In this article we propose a new approach to the analysis of econometric industry parameters for the industry consolidation level. The research is based on the simple industry automatic control model. The state of the industry is measured by quarterly obtained econometric parameters from each industry’s company provided by the tax control regulator. An approach to analysis of the industry, which does not provide for tracking the economy of each company, but explores the parameters of the set of all companies as a whole, is proposed. Quarterly obtained econometric parameters from each industry’s company are Income, Quantity of employers, Taxes, and Income from Software Licenses. The ABC analysis method was modified by ABCD analysis (D — companies with zero-level impact to industry metrics) and used to make the results obtained for different indicators comparable. Pareto charts were formed for the set of econometric indicators.
To estimate the industry monopolization, the Herfindahl – Hirschman index was calculated for the most sensitive companies metrics. Using the HHI approach, it was proved that COVID-19 does not lead to changes in the monopolization of the Russian IT industry.
As the most visually obvious approach to the industry visualization, scattering diagrams in combination with the Pareto graph colors were proposed. The affect of the accreditation procedure is clearly observed by scattering diagram in combination with red/black dots for accredited and nonaccredited companies respectively.
The last reported result is the proposal to use the Licenses End-to-End Product Identification as the market structure control instrument. It is the basis to avoid the multiple accounting of the licenses reselling within the chain of software distribution.
The results of research could be the basis for future IT industry analysis and simulation on the agent based approach.
-
Модель обоснования направлений сосредоточения усилий пограничной охраны на уровне государства
Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 187-196Важнейшим принципом военной науки и пограничной безопасности является принцип сосредоточения основных усилий на главных направлениях и задачах. На тактическом уровне имеется множество математических моделей для вычисления оптимального распределения ресурса по направлениям и объектам, тогда как на уровне государства соответствующие модели отсутствуют. Используя статистические данные о результатах охраны границы США, вычислен параметр пограничной производственной функции экспоненциального типа, отражающий организационно-технологические возможности пограничной охраны. Производственная функция определяет зависимость вероятности задержания нарушителей от плотности пограничников на километр границы. Финансовые показатели в производственной функции не учитываются, поскольку бюджет на содержание пограничников и оборудование границы коррелирует с количеством пограничных агентов. Определена целевая функция пограничной охраны — суммарный предотвращенный ущерб от задержанных нарушителей с учетом их ожидаемой опасности для государства и общества, подлежащий максимизации. Используя условие Слейтера, найдено решение задачи — вычислены оптимальные плотности пограничной охраны по регионам государства. Имея модель распределения ресурсов, на примере трех пограничных регионов США решена и обратная задача — оценены угрозы в регионах по известному распределению ресурсов. Ожидаемая опасность от отдельного нарушителя на американо-канадской границе в 2–5 раз выше, чем от нарушителя на американо-мексиканской границе. Результаты расчетов соответствуют взглядам специалистов по безопасности США — на американо-мексиканской границе в основном задерживаются нелегальные мигранты, тогда как потенциальные террористы предпочитают использовать другие каналы проникновения в США (включая американо-канадскую границу), где риски быть задержанными минимальны. Также результаты расчетов соответствуют сложившейся практике охраны границы: в 2013 г. численность пограничников вне пунктов пропуска на американо-мексиканской границе увеличилась в 2 раза по сравнению с 2001 г., тогда как на американо-канадской границе — в 4 раза. Практика охраны границы и взгляды специалистов дают основания для утверждения о верификации модели.
Ключевые слова: пограничная безопасность, математическая модель, направление сосредоточения усилий, пограничная производственная функция, нарушители государственной границы, ожидаемая опасность, оптимальная плотность охраны, пограничная статистика.
The model of the rationale for the focus of border security efforts at the state level
Computer Research and Modeling, 2019, v. 11, no. 1, pp. 187-196Просмотров за год: 26.The most important principle of military science and border security is the principle of concentrating the main efforts on the main directions and tasks. At the tactical level, there are many mathematical models for computing the optimal resource allocation by directions and objects, whereas at the state level there are no corresponding models. Using the statistical data on the results of the protection of the US border, an exponential type border production function parameter is calculated that reflects the organizational and technological capabilities of the border guard. The production function determines the dependence of the probability of detaining offenders from the density of border guards per kilometer of the border. Financial indicators in the production function are not taken into account, as the border maintenance budget and border equipment correlate with the number of border agents. The objective function of the border guards is defined — the total prevented damage from detained violators taking into account their expected danger for the state and society, which is to be maximized. Using Slater's condition, the solution of the problem was found — optimal density of border guard was calculated for the regions of the state. Having a model of resource allocation, the example of the three border regions of the United States has also solved the reverse problem — threats in the regions have been assessed based on the known allocation of resources. The expected danger from an individual offender on the US-Canada border is 2–5 times higher than from an offender on the US-Mexican border. The results of the calculations are consistent with the views of US security experts: illegal migrants are mostly detained on the US-Mexican border, while potential terrorists prefer to use other channels of penetration into the US (including the US-Canadian border), where the risks of being detained are minimal. Also, the results of the calculations are consistent with the established practice of border protection: in 2013 the number of border guards outside the checkpoints on the US-Mexican border increased by 2 times compared with 2001, while on the American-Canadian border — 4 times. The practice of border protection and the views of specialists give grounds for approval of the verification of the model.
-
Technoscape: мультиагентная модель эволюции сети городов, объединенных торгово-производственными связями
Компьютерные исследования и моделирование, 2022, т. 14, № 1, с. 163-178В работе предлагается многоагентная локально-нелокальная модель образования глобальной структуры городов с условным названием Technoscape. Technoscape можно в определенной степени считать также моделью возникновения глобальной экономики. Текущий вариант модели рассматривает очень простые способы поведения и взаимодействия агентов, при этом модель демонстрирует весьма интересные пространственно-временные паттерны.
Под локальностью и нелокальностью понимаются пространственные характеристики способа взаимодействия агентов друг с другом и с географическим пространством, на котором разворачивается эволюция системы. Под агентом понимается условный ремесленник, семья или промышленно-торговая фирма, причем не делается разницы между производством и торговлей. Агенты размещены на ограниченном двумерном пространстве, разбитом на квадратные ячейки, и перемещаются по нему. Модель демонстрирует процессы высокой концентрации агентов в выделенных ячейках, что трактуется как образование Technoscape: мультиагентная модель эволюции «сетигородов». Происходит постоянный процесс как возникновения, так и исчезновения городов. Агенты живут Technoscape: мультиагентная модель эволюции «сетивечно», не мутируют и не эволюционируют, хотя это перспективное направление развития модели.
Система Technoscape демонстрирует качественно новый вид самоорганизации. Частично эта самоорганизация напоминает поведение модели сегрегации по Томасу Шеллингу, однако эволюционные правила Technoscape существенно иные. В модели Шеллинга существуют лавины, но без добавления новых агентов в системе существуют простые равновесия, в то время как в Technoscape не существует даже строгих равновесий, в лучшем случае квазиравновесные, медленно изменяющиеся состояния.
Нетривиальный результат в модели Technoscape, также контрастирующий с моделью сегрегации Шеллинга, состоит в том, что агенты проявляют склонность к концентрации в больших городах даже при полном игнорировании локальных связей.
При этом, хотя агенты и стремятся в большие города, размер города не является гарантией стабильности. По ходу эволюции системы происходит постоянное Technoscape: мультиагентная модель эволюции «сетипереманивание» жителей в другие города такого же класса.
Ключевые слова: многоагентные системы, самоорганизация, сложные системы, экономическая география, формирование городов, глобальная экономика, экономика высоких технологий.
Technoscape: multi-agent model for evolution of network of cities, joined by production and trade links
Computer Research and Modeling, 2022, v. 14, no. 1, pp. 163-178The paper presents agent-based model for city formation named Technoscape which is both local and nonlocal. Technoscape can, to a certain degree, be also assumed as a model for emergence of global economy. The current version of the model implements very simple way of agents’ behavior and interaction, still the model provides rather interesting spatio-temporal patterns.
Locality and non-locality mean here the spatial features of the way the agents interact with each other and with geographical space upon which the evolution takes place. Technoscape agent is some conventional artisan, family, or а producing and trading firm, while there is no difference between production and trade. Agents are located upon and move through bounded two-dimensional space divided into square cells. The model demonstrates processes of agents’ concentration in a small set of cells, which is interpreted as «city» formation. Agents are immortal, they don’t mutate and evolve, though this is interesting perspective for the evolution of the model itself.
Technoscape provides some distinctively new type of self-organization. Partially, this type of selforganization resembles the behavior of segregation model by Thomas Shelling, still that model has evolution rules substantially different from Technoscape. In Shelling model there exist avalanches still simple equilibria exist if no new agents are added to the game board, while in Technoscape no such equilibria exist. At best, we can observe quasi-equilibrium, slowly changing global states.
One non-trivial phenomenon Technoscape exhibits, which also contrasts to Shelling segregation model, is the ability of agents to concentrate in local cells (interpreted as cities) even explicitly and totally ignoring local interactions, using non-local interactions only.
At the same time, while the agents tend to concentrate in large one-cell cities, large scale of such cities does not guarantee them from decay: there always exists a process of «enticement» of agents and their flow to new cities.
-
Повышение качества генерации маршрутов в SUMO на основе данных с детекторов с использованием обучения с подкреплением
Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 137-146Данная работа предлагает новый подход к построению высокоточных маршрутов на основе данных от транспортных детекторов в пакете моделирования трафика SUMO. Существующие инструменты, такие как flowrouter и routeSampler, имеют ряд недостатков, таких как отсутствие взаимодействия с сетью в процессе построения маршрутов. Наш rlRouter использует мультиагентное обучение с подкреплением (MARL), где агенты — это входящие полосы движения, а окружающая среда — дорожная сеть. Добавляя в сеть транспортные средства с определенными маршрутами, агенты получают вознаграждение за сопоставление данных с детекторами транспорта. В качестве алгоритма мультиагентного обучения с подкреплением использовался DQN с разделением параметров между агентами и LSTM-слоем для обработки последовательных данных.
Поскольку rlRouter обучается внутри симуляции SUMO, он может лучше восстанавливать маршруты, принимая во внимание взаимодействие транспортных средств внутри сети друг с другом и с сетевой инфраструктурой. Мы смоделировали различные дорожные ситуации на трех разных перекрестках, чтобы сравнить производительность маршрутизаторов SUMO с rlRouter. Мы использовали среднюю абсолютную ошибку (MAE) в качестве меры отклонения кумулятивных данных детекторов и от данных маршрутов. rlRouter позволил добиться высокого соответствия данным с детекторов. Мы также обнаружили, что, максимизируя вознаграждение за соответствие детекторам, результирующие маршруты также становятся ближе к реальным. Несмотря на то, что маршруты, восстановленные с помощью rlRouter, превосходят маршруты, полученные с помощью инструментов SUMO, они не полностью соответствуют реальным из-за естественных ограничений петлевых детекторов. Чтобы обеспечить более правдоподобные маршруты, необходимо оборудовать перекрестки другими видами транспортных счетчиков, например, детекторами-камерами.
Ключевые слова: транспортное моделирование, мультиагентное обучение с подкреплением, интеллектуальные транспортные системы.
Improving the quality of route generation in SUMO based on data from detectors using reinforcement learning
Computer Research and Modeling, 2024, v. 16, no. 1, pp. 137-146This work provides a new approach for constructing high-precision routes based on data from transport detectors inside the SUMO traffic modeling package. Existing tools such as flowrouter and routeSampler have a number of disadvantages, such as the lack of interaction with the network in the process of building routes. Our rlRouter uses multi-agent reinforcement learning (MARL), where the agents are incoming lanes and the environment is the road network. By performing actions to launch vehicles, agents receive a reward for matching data from transport detectors. Parameter Sharing DQN with the LSTM backbone of the Q-function was used as an algorithm for multi-agent reinforcement learning.
Since the rlRouter is trained inside the SUMO simulation, it can restore routes better by taking into account the interaction of vehicles within the network with each other and with the network infrastructure. We have modeled diverse traffic situations on three different junctions in order to compare the performance of SUMO’s routers with the rlRouter. We used Mean Absoluter Error (MAE) as the measure of the deviation from both cumulative detectors and routes data. The rlRouter achieved the highest compliance with the data from the detectors. We also found that by maximizing the reward for matching detectors, the resulting routes also get closer to the real ones. Despite the fact that the routes recovered using rlRouter are superior to the routes obtained using SUMO tools, they do not fully correspond to the real ones, due to the natural limitations of induction-loop detectors. To achieve more plausible routes, it is necessary to equip junctions with other types of transport counters, for example, camera detectors.
-
Математическая модель оптимизации с учетом нескольких критериев качества
Компьютерные исследования и моделирование, 2011, т. 3, № 4, с. 489-502Проведение эффективной региональной политики с целью стабилизации производства невозможно без анализа динамики протекающих экономических процессов. Данная статья посвящена разработке математической модели, отражающей взаимодействие нескольких экономических агентов с учетом их интересов. Разработка такой модели и ее исследование может рассматриваться в качестве важного шага в решении теоретических и практических проблем управления экономическим ростом.
Ключевые слова: математическая модель, экономический рост, многокритериальная задача, экономический агент.
The mathematical optimization model based on several quality criteria
Computer Research and Modeling, 2011, v. 3, no. 4, pp. 489-502Просмотров за год: 7.An effective regional policy in order to stabilize production is impossible without an analysis of the dynamics of economic processes taking place. This article focuses on developing a mathematical model reflecting the interaction of several economic agents with regard to their interests. Developing such a model and its study can be considered as an important step in solving theoretical and practical problems of managing growth.
-
Численный метод нахождения равновесий Нэша и Штакельберга в моделях контроля качества речных вод
Компьютерные исследования и моделирование, 2020, т. 12, № 3, с. 653-667В статье рассмотрена задача построения равновесий Нэша и Штакельберга при исследовании динамической системы контроля качества речных вод. Учитывается влияние субъектов управления двух уровней: одного ведущего и нескольких ведомых. В качестве ведущего (супервайзера) выступает природоохранный орган, а в роли ведомых (агентов) — промышленные предприятия. Основной целью супервайзера является поддержание допустимой концентрации загрязняющих веществ в речной воде. Добиться этого он может не единственным образом, поэтому, кроме того, супервайзер стремится к оптимизации своего целевого функционала. Супервайзер воздействует на агентов, назначая величину платы за сброс загрязнений в водоток. Плата за загрязнение от агента поступает в федеральный и местные бюджеты, затем распределяется на общих основаниях. Таким образом, плата увеличивает бюджет супервайзера, что и отражено в его целевом функционале. Причем плата за сброс загрязнений начисляется за количество и/или качество сброшенных загрязнений. К сожалению, для большинства систем контроля качества речных вод такая практика неэффективна из-за малого размера платы за сброс загрязнений. В статье и решается задача определения оптимального размера платы за сброс загрязнений, который позволяет поддерживать качество речной воды в заданном диапазоне.
Агенты преследуют только свои эгоистические цели, выражаемые их целевыми функционалами, и не обращают внимания на состояние речной системы. Управление агента можно рассматривать как часть стока, которую агент очищает, а управление супервайзера — как назначаемый размер платы за сброс оставшихся загрязнений в водоток.
Для описания изменения концентраций загрязняющих веществ в речной системе используется обыкновенное дифференциальное уравнение. Проблема поддержания заданного качества речной воды в рамках предложенной модели исследуется как с точки зрения агентов, так и с точки зрения супервайзера. В первом случае возникает дифференциальная игра в нормальной форме, в которой строится равновесие Нэша, во втором — иерархическая дифференциальная игра, разыгрываемая в соответствии с информационным регламентом игры Штакельберга. Указаны алгоритмы численного построения равновесий Нэша и Штакельберга для широкого класса входных функций. При построении равновесия Нэша возникает необходимость решения задач оптимального управления. Решение этих задач проводится в соответствии с принципом максимума Понтрягина. Строится функция Гамильтона, полученная система дифференциальных уравнений решается численно методом стрельбы и методом конечных разностей. Проведенные численные расчеты показывают, что низкий размер платы за единицу сброшенных в водоток загрязнений приводит к росту концентрации загрязняющих веществ в водотоке, а высокий — к банкротству предприятий. Это приводит к задаче нахождения оптимальной величины платы за сброс загрязнений, то есть к рассмотрению проблемы с точки зрения супервайзера. В этом случае возникает иерархическая дифференциальная игра супервайзера и агентов, в которой ищется равновесие Штакельберга. Возникает задача максимизации целевого функционала супервайзера с учетом управлений агентов, образующих равновесие Нэша. При нахождении оптимальных управлений супервайзера используется метод качественно репрезентативных сценариев, а для агентов — принцип максимума Понтрягина. Проведены численные эксперименты, найден коэффициент системной согласованности. Полученные численные результаты позволяют сделать вывод, что система контроля качества речных вод плохо системно согласована и для достижения стабильного развития системы необходимо иерархическое управление.
Ключевые слова: равновесие Нэша, равновесие Штакельберга, принцип максимума Понтрягина, экономическое управление.
Numerical method for finding Nash and Shtakelberg equilibria in river water quality control models
Computer Research and Modeling, 2020, v. 12, no. 3, pp. 653-667In this paper we consider mathematical model to control water quality. We study a system with two-level hierarchy: one environmental organization (supervisor) at the top level and a few industrial enterprises (agents) at the lower level. The main goal of the supervisor is to keep water pollution level below certain value, while enterprises pollute water, as a side effect of the manufacturing process. Supervisor achieves its goal by charging a penalty for enterprises. On the other hand, enterprises choose how much to purify their wastewater to maximize their income.The fee increases the budget of the supervisor. Moreover, effulent fees are charged for the quantity and/or quality of the discharged pollution. Unfortunately, in practice, such charges are ineffective due to the insufficient tax size. The article solves the problem of determining the optimal size of the charge for pollution discharge, which allows maintaining the quality of river water in the rear range.
We describe system members goals with target functionals, and describe water pollution level and enterprises state as system of ordinary differential equations. We consider the problem from both supervisor and enterprises sides. From agents’ point a normal-form game arises, where we search for Nash equilibrium and for the supervisor, we search for Stackelberg equilibrium. We propose numerical algorithms for finding both Nash and Stackelberg equilibrium. When we construct Nash equilibrium, we solve optimal control problem using Pontryagin’s maximum principle. We construct Hamilton’s function and solve corresponding system of partial differential equations with shooting method and finite difference method. Numerical calculations show that the low penalty for enterprises results in increasing pollution level, when relatively high penalty can result in enterprises bankruptcy. This leads to the problem of choosing optimal penalty, which requires considering problem from the supervisor point. In that case we use the method of qualitatively representative scenarios for supervisor and Pontryagin’s maximum principle for agents to find optimal control for the system. At last, we compute system consistency ratio and test algorithms for different data. The results show that a hierarchical control is required to provide system stability.
-
Агентная модель межкультурных взаимодействий: возникновение культурных неопределенностей
Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1143-1162В статье описывается имитационная агентная модель межкультурных взаимодействий в стране, население которой принадлежит к разным культурам. Считается, что пространство культур может быть представлено как гильбертово пространство, в котором различным культурам соответствуют определенные подпространства. В модели понятие «культура» понимается как некоторое структурированное подпространство гильбертова пространства. Это позволяет описывать состояние агентов вектором в гильбертовом пространстве. Считается, что каждый агент описывается принадлежностью к определенной культуре. Численности агентов, принадлежащие определенным культурам, определяются демографическими процессами, которые соответствуют данным культурам, глубиной и целостностью образовательного процесса, а также интенсивностью межкультурных контактов. Взаимодействие между агентами происходит внутри кластеров, на которые по определенным критериям разбивается все множество агентов. При взаимодействии между агентами по определенному алгоритму изменяются длина и угол, характеризующий состояние агента. В процессе имитации в зависимости от количества агентов, относящихся к различным культурам, интенсивности демографических и образовательных процессов, а также интенсивности межкультурных контактов формируются совокупности агентов (кластеры), агенты которых принадлежат разным культурам. Такие межкультурные кластеры не принадлежат целиком ни к одной из рассматриваемых первоначально в модели культур. Такие межкультурные кластеры порождают неопределенности в культурной динамике. В работе приводятся результаты имитационных экспериментов, которые иллюстрируют влияние демографических и образовательных процессов на динамику межкультурных кластеров. Обсуждаются вопросы развития предложенного подхода к изучению (обсуждению) переходных состояний развития культур.
The agent model of intercultural interactions: the emergence of cultural uncertainties
Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1143-1162The article describes a simulation agent-based model of intercultural interactions in a country whose population belongs to different cultures. It is believed that the space of cultures can be represented as a Hilbert space, in which certain subspaces correspond to different cultures. In the model, the concept of culture is understood as a structured subspace of the Hilbert space. This makes it possible to describe the state of agents by a vector in a Hilbert space. It is believed that each agent is described by belonging to a certain «culture». The number of agents belonging to certain cultures is determined by demographic processes that correspond to these cultures, the depth and integrity of the educational process, as well as the intensity of intercultural contacts. Interaction between agents occurs within clusters, into which, according to certain criteria, the entire set of agents is divided. When agents interact according to a certain algorithm, the length and angle that characterize the state of the agent change. In the process of imitation, depending on the number of agents belonging to different cultures, the intensity of demographic and educational processes, as well as the intensity of intercultural contacts, aggregates of agents (clusters) are formed, the agents of which belong to different cultures. Such intercultural clusters do not entirely belong to any of the cultures initially considered in the model. Such intercultural clusters create uncertainties in cultural dynamics. The paper presents the results of simulation experiments that illustrate the influence of demographic and educational processes on the dynamics of intercultural clusters. The issues of the development of the proposed approach to the study (discussion) of the transitional states of the development of cultures are discussed.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"