Все выпуски
- 2026 Том 18
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Решение негладких распределенных минимаксных задач с применением техники сглаживания
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 469-480Распределенные седловые задачи имеют множество различных приложений в оптимизации, теории игр и машинном обучении. Например, обучение генеративных состязательных сетей может быть представлено как минимаксная задача, а также задача обучения линейных моделей с регуляризатором может быть переписана как задача поиска седловой точки. В данной статье исследуются распределенные негладкие седловые задачи с липшицевыми целевыми функциями (возможно, недифференцируемыми). Целевая функция представляется в виде суммы нескольких слагаемых, распределенных между группой вычислительных узлов. Каждый узел имеет доступ к локально хранимой функции. Узлы, или агенты, обмениваются информацией через некоторую коммуникационную сеть, которая может быть централизованной или децентрализованной. В централизованной сети есть универсальный агрегатор информации (сервер или центральный узел), который напрямую взаимодействует с каждым из агентов и, следовательно, может координировать процесс оптимизации. В децентрализованной сети все узлы равноправны, серверный узел отсутствует, и каждый агент может общаться только со своими непосредственными соседями.
Мы предполагаем, что каждый из узлов локально хранит свою целевую функцию и может вычислить ее значение в заданных точках, т. е. имеет доступ к оракулу нулевого порядка. Информация нулевого порядка используется, когда градиент функции является трудно вычислимым, а также когда его невозможно вычислить или когда функция не дифференцируема. Например, в задачах обучения с подкреплением необходимо сгенерировать траекторию для оценки текущей стратегии. Этот процесс генерирования траектории и оценки политики можно интерпретировать как вычисление значения функции. Мы предлагаем подход, использующий технику сглаживания, т. е. применяющий метод первого порядка к сглаженной версии исходной функции. Можно показать, что стохастический градиент сглаженной функции можно рассматривать как случайную двухточечную аппроксимацию градиента исходной функции. Подходы, основанные на сглаживании, были изучены для распределенной минимизации нулевого порядка, и наша статья обобщает метод сглаживания целевой функции на седловые задачи.
Ключевые слова: выпуклая оптимизация, распределенная оптимизация. -
Связь между дискретными финансовыми моделями и непрерывными моделями с процессами Винера и Пуассона
Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 781-795Работа посвящена исследованию связей между дискретными и непрерывными моделями финансовых процессов и их вероятностных характеристик. Во-первых, установлена связь между процессами цен акций, хеджирующего портфеля и опционов в моделях, обусловленных биномиальными возмущениями и предельными для них возмущениями типа броуновского движения. Во-вторых, указаны аналоги в коэффициентах стохастических уравнений с различными случайными процессами, непрерывными и скачкообразными, и в коэффициентах соответствующих детерминированных уравнений для их вероятностных характеристик.
Изложение результатов исследования связей и нахождения аналогий, полученных в настоящей работе, привело к необходимости адекватного изложения предварительных сведений и результатов из финансовой математики, а также описания связанных с ней объектов стохастического анализа.
В работе частично новые и известные результаты изложены в доступной форме для тех, кто не является специалистом по финансовой математике и стохастическому анализу и кому эти результаты важны с точки зрения приложений. Конкретно, представлены следующие разделы.
• В одно- и $n$-периодных биномиальных моделях предложен единый подход к определению на вероятностном пространстве риск-нейтральной меры, с которой дисконтированная цена опциона становится мартингалом. Полученная мартингальная формула для цены опциона пригодна для численного моделирования. В следующих разделах подход на основе риск-нейтральных мер применяется для исследования финансовых процессов в моделях непрерывного времени.
• В непрерывном времени рассмотрены модели цены акций, хеджирующего портфеля и опциона в форме стохастических уравнений с интегралом Ито по броуновскому движению и по компенсированному процессу Пуассона. Изучение свойств процессов, являющихся решениями стохастических уравнений, в этом разделе опирается на один из центральных объектов стохастического анализа — формулу Ито, методике применения которой уделено особое внимание.
• Представлена знаменитая формула Блэка –Шоулза, дающая решение уравнения в частных производных для функции $v(t, x)$, которая при подстановке $x = S (t)$, где $S(t)$ — цена акций в момент времени $t$, дает цену опциона в модели с непрерывным возмущением броуновским движением.
• Предложен аналог формулы Блэка – Шоулза для случая модели со скачкообразным возмущением процессом Пуассона. Вывод этой формулы опирается на технику риск-нейтральных мер и лемму независимости.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"





