Текущий выпуск Номер 3, 2025 Том 17

Все выпуски

Результаты поиска по 'метод моментов':
Найдено статей: 89
  1. Руденко В.Д., Юдин Н.Е., Васин А.А.
    Обзор выпуклой оптимизации марковских процессов принятия решений
    Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 329-353

    В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — стратегии, принимающие решение по известному состоянию среды на данный момент. Также рассмотрены основные итеративные алгоритмы оптимизации политики, построенные на решении уравнений Беллмана. Важным разделом данной статьи стало рассмотрение альтернативы к подходу $Q$-обучения — метода прямой максимизации средней награды агента для избранной стратегии от взаимодействия со средой. Таким образом, решение данной задачи выпуклой оптимизации представимо в виде задачи линейного программирования. В работе демонстрируется, как аппарат выпуклой оптимизации применяется для решения задачи обучения с подкреплением (Reinforcement Learning, RL). В частности, показано, как понятие сильной двойственности позволяет естественно модифицировать постановку задачи RL, показывая эквивалентность между максимизацией награды агента и поиском его оптимальной стратегии. В работе также рассматривается вопрос сложности оптимизации MDP относительно количества троек «состояние–действие–награда», получаемых в результате взаимодействия со средой. Представлены оптимальные границы сложности решения MDP в случае эргодического процесса с бесконечным горизонтом, а также в случае нестационарного процесса с конечным горизонтом, который можно перезапускать несколько раз подряд или сразу запускать параллельно в нескольких потоках. Также в обзоре рассмотрены последние результаты по уменьшению зазора нижней и верхней оценки сложности оптимизации MDP с усредненным вознаграждением (Averaged MDP, AMDP). В заключение рассматриваются вещественнозначная параметризация политики агента и класс градиентных методов оптимизации через максимизацию $Q$-функции ценности. В частности, представлен специальный класс MDP с ограничениями на ценность политики (Constrained Markov Decision Process, CMDP), для которых предложен общий прямодвойственный подход к оптимизации, обладающий сильной двойственностью.

  2. Потапов И.И., Потапов Д.И.
    Модель установившегося течения реки в поперечном сечении изогнутого русла
    Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1163-1178

    Моделирование русловых процессов при исследовании береговых деформаций русла требует вычисления параметров гидродинамического потока, учитывающих существование вторичных поперечных течений, формирующихся на закруглении русла. Трехмерное моделирование таких процессов на текущий момент возможно только для небольших модельных каналов, для реальных речных потоков необходимы модели пониженной размерности. При этом редукция задачи от трехмерной модели движения речного потока к двумерной модели потока в плоскости створа канала предполагает, что рассматриваемый гидродинамический поток является квазистационарным, и для него выполнены гипотезы об асимптотическом поведении потока по потоковой координате створа. С учетом данных ограничений в работе сформулирована математическая модель задачи о движении стационарного турбулентного спокойного речного потока в створе канала. Задача сформулирована в смешанной постановке скорости — «вихрь – функция тока». В качестве дополнительных условий для редукции задачи требуется задание граничных условий на свободной поверхности потока для поля скорости, определяемого в нормальном и касательном направлении к оси створа. Предполагается, что значения данных скоростей должны быть определены из решения вспомогательных задач или получены из данных натурных или экспериментальных измерений.

    Для решения сформулированной задачи используется метод конечных элементов в формулировке Петрова – Галёркина. Получен дискретный аналог задачи и предложен алгоритм ее решения. Выполненные численные исследования показали в целом хорошую согласованность полученных решений при их сравнении с известными экспериментальными данными.

    Полученные погрешности авторы связывают с необходимостью более точного определения циркуляционного поля скоростей в створе потока путем подбора и калибровки более подходящей модели вычисления турбулентной вязкости и граничных условий на свободной границе створа.

  3. Курушина С.Е., Федорова Е.А., Гуровская Ю.А.
    Методика анализа шумоиндуцированных явлений в двухкомпонентных стохастических системах реакционно-диффузионного типа со степенной нелинейностью
    Компьютерные исследования и моделирование, 2025, т. 17, № 2, с. 277-291

    В работе построена и исследуется обобщенная модель, описывающая двухкомпонентные системы реакционно-диффузионного типа со степенной нелинейностью и учитывающая влияние внешних шумов. Для анализа обобщенной модели разработана методология, включающая в себя линейный анализ устойчивости, нелинейный анализ устойчивости и численное моделирование эволюции системы. Методика проведения линейного анализа опирается на базовые подходы, в которых для получения характеристического уравнения используется матрица линеаризации. Нелинейный анализ устойчивости проводится с точностью до моментов третьего порядка включительно. Для этого функции, описывающие динамику компонент, раскладываются в ряд Тейлора до слагаемых третьего порядка. Затем с помощью теоремы Новикова проводится процедура усреднения. В результате полученные уравнения образуют бесконечную иерархично подчиненную структуру, которую в определенный момент необходимо прервать. Для этого пренебрегаем вкладом слагаемых выше третьего порядка как в самих уравнениях, так и при построении уравнений моментов. Полученные уравнения образуют набор линейных уравнений, из которых формируется матрица устойчивости. Эта матрица имеет довольно сложную структуру, в связи с чем ее решение может быть получено только численно. Для проведения численного исследования эволюции системы выбран метод переменных направлений. Из-за наличия в анализируемой системе стохастической части метод был модифицирован таким образом, что на целых слоях проводится генерация случайных полей с заданным распределением и функцией корреляции, отвечающих за шумовой вклад в общую нелинейность. Апробация разработанной методологии проведена на предложенной Barrio et al. модели реакции – диффузии, по результатам исследования которой им показана схожесть получаемых структур с пигментацией рыб. В настоящей работе внимание сосредоточено на анализе поведения системы в окрестности ненулевой стационарной точки. Изучена зависимость действительной части собственных значений от волнового числа. В линейном анализе получена область значений волновых чисел, при которых возникает неустойчивость Тьюринга. Нелинейный анализ и численное моделирование эволюции системы проводятся для параметров модели, которые, напротив, находятся вне области неустойчивости Тьюринга. В рамках нелинейного анализа найдены интенсивности аддитивного шума, при которых, несмотря на отсутствие условий для возникновения диффузионной неустойчивости, система переходит в неустойчивое состояние. Результаты численного моделирования эволюции апробируемой модели демонстрируют процесс образования пространственных структур тьюрингового типа при воздействии на нее аддитивного шума.

  4. Шумов В.В.
    Учет психологических факторов в моделях боя (конфликта)
    Компьютерные исследования и моделирование, 2016, т. 8, № 6, с. 951-964

    Ход и исход боя в значительной степени зависят от морального духа войск, характеризуемого процентом потерь (убитых и раненых), при котором войска еще продолжают сражаться. Всякий бой есть психологический акт, заканчивающийся отказом от него одной из сторон. Обычно в моделях боя психологический фактор учитывают в решении уравнений Ланчестера (условие равенства сил, когда численность одной из сторон обращается в ноль). При этом подчеркивается, что модели ланчестеровского типа удовлетворительно описывают динамику боя только на начальных его стадиях. Для разрешения данного противоречия предложено использовать модификацию уравнений Ланчестера, учитывающую тот факт, что в любой момент боя по противнику ведут огонь не пораженные и не отказавшиеся от сражения бойцы. Полученные дифференциальные уравнения решаются численным методом и позволяют в динамике учитывать влияние психологического фактора и оценивать время завершения конфликта. Вычислительные эксперименты подтверждают известный из военной теории факт, что бой обычно заканчивается отказом бойцов одной из сторон от его продолжения (уклонение от боя в различных формах). Наряду с моделями временно́й и пространственной динамики предложено ис- пользовать модификацию функции технологии конфликта С. Скапердаса, основанную на учете принципов боя. Для оценки вероятности победы одной из сторон в бою учитываются проценты выдерживаемых сторонами кровавых потерь и показатель боевого превосходства. Последний является средним геометрическим параметров, характеризующих всестороннее обеспечение боя, разведку, маневр и огонь. Анализ хода и исхода ряда военных компаний последних десятилетий показал, что процент выдерживаемых военных потерь резко снизился в странах с низким уровнем рождаемости. Наличие технологического превосходства над противником не гарантирует военного успеха, особенно в случае продолжительного конфликта. В этой связи представляются актуальными дальнейшие исследования, позволяющие количественно учесть вклад психологического фактора в ход и исход боя, а также учитывать влияние социально-психологических воздействий.

    Просмотров за год: 7. Цитирований: 4 (РИНЦ).
  5. Королева М.Р., Мищенкова О.В., Редер Т., Тененев В.А., Чернова А.А.
    Численное моделирование процесса срабатывания предохранительного клапана
    Компьютерные исследования и моделирование, 2018, т. 10, № 4, с. 495-509

    Рассматриваются вопросы построения математической модели процесса срабатывания пружинного предохранительного клапана прямого действия, в том числе и вопросыоб основания физически корректной величинына чального подъема диска при решении сопряженной задачи о движении диска в рабочем объеме клапана для газовых сред. Проводится обзор существующих подходов и методов решения данного типа задач. Приводятся постановка задачи о срабатывании клапана при повышении давления в резервуаре и математическая модель процесса срабатывания клапана. Особое внимание уделяется вопросам связывания физических подзадач. Описываются используемые методы, численные схемы и алгоритмы. Математическое моделирование проводится на основе фундаментальной системыдиф ференциальных уравнений движения вязкого сжимаемого газа, совместно с уравнением движения диска. В осесимметричной постановке решение рассматриваемой задачи строится численно с использованием метода конечных объемов. Сопоставляются результаты решения задачи о срабатывании предохранительного клапана, полученные с использованием вязкой модели и модели течения идеального газа. В невязкой постановке задача решается с использованием схемы Годунова, реализуемой в рамках авторского кода, а в вязкой постановке — на основе метода Курганова–Тадмора, реализуемого в рамках open source пакета OpenFOAM. Проводится сравнение результатов двух расчетов. В результате выполненных расчетов была получена зависимость высоты подъема диска от времени, которая сопоставляется с экспериментальными данными. Приводятся распределение давления газа по поверхности диска, а также профили скорости в поперечных сечениях зазора для различных высот подъема диска. Показывается, что величина начального подъема диска не влияет на характер течения газа и динамику подвижной части клапана, что может существенно сократить время расчета полного цикла работы клапана с момента его открытия до закрытия при понижении давления ниже установленного уровня. Для проверки адекватности и корректности используемых численных схем проводится моделирование процесса срабатывания клапана в рамках метода Годунова для невязкого газа. Полученные данные хорошо коррелируются между собой, что свидетельствует как о корректности сформулированной математической модели процесса срабатывания клапана, так и о возможности применения для описания динамики предохранительных клапанов модели невязкого газа.

    Просмотров за год: 34. Цитирований: 1 (РИНЦ).
  6. Русяк И.Г., Тененев В.А.
    К вопросу о численном моделировании внутренней баллистики для трубчатого заряда в пространственной постановке
    Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 993-1010

    Для трубчатых пороховых элементов большого удлинения, используемых в артиллерийских метательных зарядах, имеют место условия неравномерного горения. Здесь необходимо параллельно рассматривать процессы горения и движения пороховых газов внутри и вне каналов пороховых трубок. Без этого невозможно адекватно поставить и решить задачи о воспламенении, эрозионном горении и напряженно-деформированном состоянии трубчатых пороховых элементов в процессе выстрела. В работе представлена физико-математическая постановка основной задачи внутренней баллистики артиллерийского выстрела для заряда, состоящего из совокупности пороховых трубок. Горение и движение пучка пороховых трубок по каналу ствола моделируются эквивалентным трубчатым зарядом всестороннего горения. Площади торца и сечения канала такого заряда (эквивалентной трубки) равны сумме площадей торцов и сечений каналов пороховых трубок соответственно. Поверхность горения канала равна сумме внутренних поверхностей трубок в пучке. Внешняя поверхность горения эквивалентной трубки равна сумме внешних поверхностей трубок в пучке. Предполагается, что эквивалентная трубка движется по оси канала ствола. Скорость движения эквивалентного трубчатого заряда и его текущее положение определяются из второго закона Ньютона. Для расчета параметров течения использованы двумерные осесимметричные уравнения газовой динамики, для решения которых строится осесимметричная ортогонализированная разностная сетка, адаптирующаяся к условиям течения. При перемещении и горении трубки разностная сетка перестраивается с учетом изменяющихся областей интегрирования. Для численного решения системы газодинамических уравнений применяется метод контрольного объема. Параметры газа на границах контрольных объемов определяются с использованием автомодельного решения задачи о распаде произвольного разрыва С.К. Годунова. Разработанная методика использована при расчетах внутрибаллистических параметров артиллерийского выстрела. Данный подход рассмотрен впервые и позволяет по-новому подойти к проектированию трубчатых артиллерийских зарядов, поскольку позволяет получить необходимую информацию в виде полей скорости и давления пороховых газов для расчета процесса постепенного воспламенения, нестационарного эрозионного горения, напряженно-деформированного состояния и прочности пороховых элементов при выстреле. Представлены временные зависимости параметров внутрибаллистического процесса и распределения основных параметров течения продуктов горения в различные моменты времени.

  7. Митрофанова А.Ю., Темная О.С., Сафин А.Р., Кравченко О.В., Никитов С.А.
    Моделирование усиления спиновых волн в ферромагнитных пленках с помощью применения метода характеристик к нелинейному уравнению переноса
    Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 795-803

    В работе приведен анализ нелинейного уравнения переноса огибающей магнитостатической спиновой волны (МСВ) с учетом переноса спинового момента методом характеристик. Продемонстрирована зависимость амплитуды МСВ от коэффициента нелинейности. На фазовых портретах наглядно продемонстрирована зависимость искомой функции от коэффициента нелинейности. Посредством исследования характера эволюции начального профиля волны методом фазовой плоскости установлено, что действительная и мнимая части волны осциллируют. Показан переход траекторий из неустойчивого фокуса в предельный цикл, который соответствует осцилляции действительной и мнимой частей. Для амплитуды волны такой переход характеризуется ее усилением или затуханием (в зависимости от коэффициента нелинейности и выбранных начальных условий) до некоторого порогового значения. Показано, что время переходного процесса от усиления (затухания) к стабилизации амплитуды также зависит от параметра нелинейности. Выяснено, что на интервале усиления амплитуды спиновой волны происходит уменьшение времени переходного процесса, а большим параметрам нелинейности соответствуют меньшие значения амплитуды.

  8. Аксёнов А.А., Жлуктов С.В., Каширин В.С., Сазонова М.Л., Черный С.Г., Дроздова Е.А., Роде А.А.
    Численное моделирование в ПК FlowVision распыла и испарения сырья в потоке газа-теплоносителя при печном производстве технического углерода
    Компьютерные исследования и моделирование, 2023, т. 15, № 4, с. 921-939

    Технический углерод (сажа) — продукт, получаемый термическим разложением (пиролизом) углеводородов (как правило, нефти) в потоке газа-теплоносителя. Технический углерод широко применяется в качестве усиливающего компонента в производстве резин и пластических масс. В производстве шин используется 70% всего выпускаемого углерода. При печном производстве углерода жидкое углеводородное сырье впрыскивается форсунками в поток продуктов сгорания природного газа. Происходит распыл и испарение сырья с дальнейшим пиролизом. Важно, чтобы сырье полностью испарилось до начала пиролиза, иначе будет образовываться кокс, загрязняющий продукт. Для совершенствования технологии производства углерода, в частности обеспечения полного испарения сырья до начала пиролиза, невозможно обойтись без математического моделирования самого процесса. Оно является важнейшим способом получения наиболее полной и детальной информации об особенностях работы реактора.

    В программном комплексе (ПК) FlowVision разрабатываются трехмерная математическая модель и метод расчета распыла и испарения сырья в потоке газа-теплоносителя. Для отработки методики моделирования в качестве сырья выбрана вода. Рабочими веществами в камере реактора являются продукты сгорания природного газа. Движение капель сырья и испарение в потоке газа моделируются в рамках эйлерова подхода взаимодействия дисперсной и сплошной сред. Представлены результаты расчета распыла и испарения сырья в реакторе для производства технического углерода. По найденному в каждый момент времени распределению множества капель распыла сырья в реакторе определяется важный параметр, характеризующий мелкость распыла — средний саутеровский диаметр.

  9. В работе развивается новый математический метод решения задачи совместного расчета параметров сигнала и шума в условиях распределения Райса, основанный на комбинировании метода максимума правдоподобия и метода моментов. При этом определение искомых параметров задачи осуществляется посредством обработки выборочных измерений амплитуды анализируемого райсовского сигнала. Получена система уравнений для искомых параметров сигнала и шума, а также представлены результаты численных расчетов, подтверждающие эффективность предлагаемого метода. Показано, что решение двухпараметрической задачи разработанным методом не приводит к увеличению объема требуемых вычислительных ресурсов по сравнению с решением однопараметрической задачи. В частном случае малой величины отношения сигнала к шуму получено аналитическое решение задачи. В работе проведено исследование зависимости погрешности и разброса расчетных данных для искомых параметров от количества измерений в экспериментальной выборке. Как показали численные эксперименты, величина разброса расчетных значений искомых параметров сигнала и шума, полученных предлагаемым методом, изменяется обратно пропорционально количеству измерений в выборке. Проведено сопоставление точности оценивания искомых райсовских параметров предлагаемым методом и ранее развитым вариантом метода моментов. Решаемая в работе задача является значимой для целей обработки райсовских данных, в частности, в системах магнитно-резонансной визуализации, в системах ультразвуковой визуализации, при анализе оптических сигналов в системах дальнометрии, в радиолокации, а также при решении многих других научных и прикладных задач, адекватно описываемых статистической моделью Райса.

    Просмотров за год: 11.
  10. Мальсагов М.Х., Угольницкий Г.А., Усов А.Б.
    Борьба с экономической коррупцией при распределении ресурсов
    Компьютерные исследования и моделирование, 2019, т. 11, № 1, с. 173-185

    В теоретико-игровой постановке рассмотрена модель борьбы с коррупцией при распределении ресурсов. Система распределения ресурсов включает в свой состав одного принципала (субъект управления верхнего уровня), одного или нескольких супервайзеров (субъектов среднего уровня) и нескольких агентов (субъекты нижнего уровня). Отношения между субъектами разных уровней строятся на основе иерархии: субъект верхнего уровня воздействует (управляет) на субъектов среднего уровня, а те, в свою очередь, на субъектов нижнего уровня. Предполагается, что коррупции подвержен средний уровень управления. Агенты предлагают супервайзеру взятки, в обмен на которые он предоставляет им дополнительные доли ресурса. Предположим также, что принципал не подвержен коррупции и является бескорыстным, не преследующим частных целей. Исследование модели проведено с точки зрения как супервайзера, так и агентов. C точки зрения агентов, возникает некооперативная игра, в которой находится равновесие Нэша. При этом задачи оптимального управления для частного вида входных функций решаются аналитически с помощью принципа максимума Понтрягина. C точки зрения супервайзера, возникает игра, которая ведется в соответствии с регламентом игры Гермейера Г2t. Указан алгоритм построения равновесия. Стратегия наказания находится аналитически. Стратегия поощрения в случае входных функций общего вида находится численно. Строится дискретный аналог непрерывной модели. Предполагается, что все субъекты управления могут изменять свои стратегии поведения в одни и те же моменты времени конечное число раз. В результате от задачи максимизации своего целевого функционала супервайзер переходит к задаче максимизации целевой функции многих переменных. Для нахождения ее наибольшего значения используется метод качественно репрезентативных сценариев. Идея этого метода состоит в том, что из множества потенциально возможных сценариев управления выбираются только сценарии, позволяющие представить качественно различные пути развития системы. В результате мощность этого множества не слишком велика и удается осуществить полный перебор качественно репрезентативных сценариев и найти стратегию поощрения агентов. После ее нахождения супервайзер предлагает агентам механизм управления с обратной связью по управлению, состоящий в наказании агентов при отклонении от выбранной супервайзером стратегии и поощрении в противном случае.

    Просмотров за год: 33. Цитирований: 1 (РИНЦ).
Страницы: « первая предыдущая следующая последняя »

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.