Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Применение ансамбля нейросетей и методов статистической механики для предсказания связывания пептида с главным комплексом гистосовместимости
Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1383-1395Белки главного комплекса гистосовместимости (ГКГС) играют ключевую роль в работе адаптивной иммунной системы, и определение связывающихся с ними пептидов — важный шаг в разработке вакцин и понимании механизмов аутоиммунных заболеваний. На сегодняшний день существует ряд методов для предсказания связывания определенной аллели ГКГС с пептидом. Одним из лучших таких методов является NetMHCpan-4.0, основанный на ансамбле искусственных нейронных сетей. В данной работе представлена методология качественного улучшения архитектуры нейронной сети, лежащей в основе NetMHCpan-4.0. Предлагаемый метод использует технику построения ансамбля и добавляет в качестве входных данных оценку модели Поттса, взятой из статистической механики и являющейся обобщением модели Изинга. В общем случае модельо тражает взаимодействие спинов в кристаллической решетке. Применительно к задаче белок-пептидного взаимодействия вместо спинов используются типы аминокислот, находящихся в кармане связывания. В предлагаемом методе модель Поттса используется для более всестороннего представления физической природы взаимодействия полипептидных цепей, входящих в состав комплекса. Для оценки взаимодействия комплекса «ГКГС + пептид» нами используется двумерная модель Поттса с 20 состояниями (соответствующими основным аминокислотам). Решая обратную задачу с использованием данных об экспериментально подтвержденных взаимодействующих парах, мы получаем значения параметров модели Поттса, которые затем применяем для оценки новой пары «ГКГС + пептид», и дополняем этим значением входные данные нейронной сети. Такой подход, в сочетании с техникой построения ансамбля, позволяет улучшитьт очность предсказания, по метрике положительной прогностической значимости (PPV), по сравнению с базовой моделью.
Ключевые слова: главный комплекс гистосовместимости, аффинностьсв язывания, нейронная сеть, машинное обучение, модельП оттса. -
Технология сбора исходных данных для построения моделей оценки функционального состояния человека по зрачковой реакции на изменение освещенности в решении отдельных задач обеспечения транспортной безопасности
Компьютерные исследования и моделирование, 2021, т. 13, № 2, с. 417-427В данной статье решается задача разработки технологии сбора исходных данных для построения моделей оценки функционального состояния человека. Данное состояние оценивается по зрачковой реакции человека на изменение освещенности на основе метода пупиллометрии. Данный метод предполагает сбор и анализ исходных данных (пупиллограмм), представленных в виде временных рядов, характеризующих динамику изменения зрачков человека на световое импульсное воздействие. Анализируются недостатки традиционного подхода к сбору исходных данных с применением методов компьютерного зрения и сглаживания временных рядов. Акцентируется внимание на важности качества исходных данных для построения адекватных математических моделей. Актуализируется необходимость ручной разметки окружностей радужной оболочки глаза и зрачка для повышения точности и качества исходных данных. Описываются этапы предложенной технологии сбора исходных данных. Приводится пример полученной пупиллограммы, имеющей гладкую форму и не содержащей выбросы, шумы, аномалии и пропущенные значения. На основе представленной технологии разработан программно-аппаратный комплекс, представляющий собой совокупность специального программного обеспечения, имеющего два основных модуля, и аппаратной части, реализованной на базе микрокомпьютера Raspberry Pi 4 Model B, с периферийным оборудованием, реализующим заданный функционал. Для оценки эффективности разработанной технологии используются модели однослойного персептрона и коллектива нейронных сетей, для построения которых использовались исходные данные о функциональном состоянии утомления человека. Проведенные исследования показали, что применение ручной разметки исходных данных (по сравнению с автоматическими методами компьютерного зрения) приводит к снижению числа ошибок 1-го и 2-года рода и, соответственно, повышению точности оценки функционального состояния человека. Таким образом, представленная технология сбора исходных данных может эффективно использоваться для построения адекватных моделей оценки функционального состояния человека по зрачковой реакции на изменение освещенности. Использование таких моделей актуально в решении отдельных задач обеспечения транспортной безопасности, в частности мониторинга функционального состояния водителей.
-
Применение модели кинетического типа для изучения пространственного распространения COVID-19
Компьютерные исследования и моделирование, 2021, т. 13, № 3, с. 611-627Предлагается простая модель на основе уравнения кинетического типа для описания распространения вируса в пространстве посредством миграции носителей вируса из выделенного центра. Рассматриваются страны, для которых применима одномерная модель: Россия, Италия, Чили. Одномерный подход возможен из-за географического расположения этих стран и их протяженности в направлениях от центров заражения (Москвы, Ломбардии и Сантьяго соответственно). Определяется изменение плотности зараженных во времени и пространстве. Применяется двухпараметрическая модель. Первый параметр — величина средней скорости распространения, соответствующий переносу инфицированных транспортными средствами. Второй параметр — частота уменьшения количества инфицированных элементов по мере продвижения по территории страны, что связано с прибытием пассажиров в места назначения, а также с карантинными мерами, препятствующими их перемещению по стране. Параметры модели определяются по фактически известным данным. Строится аналитическое решение, для получения серии расчетов применяются также простые численные методы. В модели рассматривается пространственное распространение заболевания, при этом заражения на местах не учитываются. Поэтому вычисленные значения на начальном этапе хорошо соответствуют экспериментальным данным, а затем плотность заболевших начинает быстрее возрастать из-за заражений на местах. Тем не менее модельные расчеты позволяют делать некоторые предсказания. Помимо скорости заражения, возможна аналогичная «скорость выздоровления». По моменту времени достижения охвата большей части населения страны при движении фронта выздоровления делается вывод о начале глобального выздоровления, что соответствует реальным данным.
-
Методика имитационного моделирования на основе обучающих данных для двухфазного течения в гетерогенной пористой среде
Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 779-792Классические численные методы, применяемые для предсказания эволюции гидродинамических систем, предъявляют высокие требования к вычислительным ресурсам и накладывают ограничения на число вариантов геолого-гидродинамических моделей, расчет эволюции состояний которых возможно осуществлять в практических условиях. Одним из перспективных подходов к разработке эвристических оценок, которые могли бы ускорить рассмотрение вариантов гидродинамических моделей, является имитационное моделирование на основе обучающих данных. В рамках этого подхода методы машинного обучения используются для настройки весов искусственной нейронной сети (ИНС), предсказывающей состояние физической системы в заданный момент времени на основе начальных условий. В данной статье описаны оригинальная архитектура ИНС и специфическая процедура обучения, формирующие эвристическую модель двухфазного течения в гетерогенной пористой среде. Основанная на ИНС модель с приемлемой точностью предсказывает состояния расчетных блоков моделируемой системы в произвольный момент времени (с известными ограничениями) на основе только начальных условий: свойств гетерогенной проницаемости среды и размещения источников и стоков. Предложенная модель требует на порядки меньшего процессорного времени в сравнении с классическим численным методом, который послужил критерием оценки эффективности обученной модели. Архитектура ИНС включает ряд подсетей, обучаемых в различных комбинациях на нескольких наборах обучающих данных. Для обучения ИНС в рамках многоэтапной процедуры применены техники состязательного обучения и переноса весов из обученной модели.
-
Ускорение работы двухстадийной модели равновесного распределения потоков по сети
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 343-355В работе приведены возможные улучшения двухстадийной модели равновесного распределения транспортных потоков, повышающие качество детализации моделирования и скорость вычисления алгоритмов. Модель состоит из двух блоков, первый блок — модель расчета матрицы корреспонденций, второй блок — модель равновесного распределения транспортных потоков по путям. Равновесием в двухстадийной модели транспортных потоков называют неподвижную точку цепочки из этих двух моделей. Более подробно теория и эксперименты по данной модели были описаны в предыдущих работах авторов. В этой статье в первую очередь рассмотрена возможность сокращения вычислительного времени алгоритма расчета кратчайших путей (в модели стабильной динамики, равновесно распределяющей потоки). В исходном варианте эта задача была выполнена с помощью алгоритма Дийкстры, но, так как после каждой итерации блока распределения транспортных потоков, время, требующееся для прохода по ребру, изменяется не на всех ребрах (и если изменяется, то очень незначительно), во многом этот алгоритм был избыточен. Поэтому были проведены эксперименты с более новым методом, учитывающим подобные особенности, и приведен краткий обзор других ускоряющих подходов для будущих исследований. Эксперименты показали, что в некоторых случаях использование выбранного T-SWSF-алгоритма действительно сокращает вычислительное время. Во вторую очередь в блоке восстановления матрицы корреспонденций алгоритм Синхорна был заменен на алгоритм ускоренного Синхорна (или AAM-алгоритм), что, к сожалению, не показало ожидаемых результатов, расчетное время не изменилось. Инак онец, в третьем и финальном разделе приведена визуализация результатов экспериментов по добавлению платных дорог в двухстадийную модель, что помогло сократить количество перегруженных ребер в сети. Также во введении кратко описана мотивация данных исследований, приведено описание работы двухстадийной модели, а также на маленьком примере с двумя городами разобрано, как с ее помощью выполняется поиск равновесия.
-
Исследование влияния миграции на социальную напряженность с использованием модели сплошной социальной стратификации
Компьютерные исследования и моделирование, 2022, т. 14, № 3, с. 661-673Фоновая социальная напряженность общества может быть количественно оценена по различным статистическим индикаторам. Модели, прогнозирующие динамику социальной напряженности, успешно применяются для описания различных социальных процессов. Когда количество рассматриваемых групп общества мало, динамику соответствующих индикаторов можно описать при помощи системы обыкновенных дифференциальных уравнений. При увеличении количества взаимодействующих элементов резко возрастает сложность задач, что существенно затрудняет их аналитическое исследование. Модель сплошной социальной стратификации получаетсяв результате перехода от дискретной цепочки взаимодействующих социальных слоев к их непрерывному распределению на некотором интервале, то есть перехода к модели сплошной среды. В этом случае напряженность распространяется локально, но в действительности элита общества влияет на все слои через средства массовой информации, а также интернет позволяет влиять всем группам на другие. Эти факторы можно учесть через слагаемое модели, описывающее негативное внешнее воздействие. В настоящей работе предложена модель сплошной социальной стратификации, описывающая динамику системы из двух социумов, связанных через процесс миграции населения. Предполагается, что из социального слоя системы-донора с наибольшей напряженностью происходит отток людей, переносящих свою напряженность в систему-акцептор, причем при миграции люди попадают в более бедные слои принимающего общества. Рассматриваетсяслуч ай пространственно однородных коэффициентов, что соответствует частному случаю небольшого социума. При помощи метода конечных объемов построена пространственнаяди скретизация задачи, корректно отражающая конечную скорость распространения напряженности в обществе. Выполнена проверка выбранной дискретизации путем сравненияч исленного решения с точными решениями вспомогательного уравнения нелинейной диффузии. Проведено численное исследование системы с миграцией при различных значениях параметров, проанализировано влияние интенсивности миграции на принимающее общество, найдены условия дестабилизации общества акцептора под влиянием миграции. Полученные в работе результаты могут быть применены при дальнейшем исследовании модели в случае пространственно неоднородных коэффициентов, что соответствует более реалистичной картине общества.
-
Математические и вычислительные проблемы, связанные с образованием структур в сложных системах
Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 805-815В данной работе рассматривается система уравнений магнитной гидродинамики (МГД). Найденные точные решения описывают течения жидкости в пористой среде и связаны с вопросами разработки кернового симулятора и задачами управления параметрами несжимаемой жидкости и направлены на создание отечественной технологии «цифровое месторождение». Центральной проблемой, связанной с использованием вычислительной техники, являются сеточные аппроксимации большой размерности и суперЭВМ высокой производительности с большим числом параллельно работающих микропроцессоров. В качестве возможной альтернативы сеточным аппроксимациям большой размерности разрабатываются кинетические методы решения дифференциальных уравнений и методы «склейки» точных решений на грубых сетках. Сравнительный анализ эффективности вычислительных систем позволяет сделать вывод о необходимости развития организации вычислений, основанных на целочисленной арифметике в сочетании с универсальными приближенными методами. Предложен класс точных решений системы Навье – Стокса, описывающий трехмерные течения для несжимаемой жидкости, а также точные решения нестационарной трехмерной магнитной гидродинамики. Эти решения важны для практических задач управляемой динамики минерализованных флюидов, а также для создания библиотек тестов для верификации приближенных методов. Выделены ряд явлений, связанных с образованием макроскопических структур за счет высокой интенсивности взаимодействия элементов пространственно однородных систем, а также их возникновение за счет линейного пространственного переноса в пространственно-неоднородных системах. Принципиальным является то, что возникновение структур — это следствие разрывности операторов в нормах законов сохранения. Наиболее разработанной и универсальной является теория вычислительных методов для линейных задач. Поэтому с этой точки зрения важными являются процедуры «погружения» нелинейных задач в общие классы линейных за счет изменения исходной размерности описания и расширения функциональных пространств. Отождествление функциональных решений с функциями позволяет вычислять интегральные средние неизвестной, но в то же время ее нелинейные суперпозиции, вообще говоря, не являются слабыми пределами нелинейных суперпозиций приближений метода, т.е. существуют функциональные решения, которые не являются обобщенными в смысле С. Л. Соболева.
-
Мониторинг распространения борщевика Сосновского с использованием алгоритма машинного обучения «случайный лес» в Google Earth Engine
Компьютерные исследования и моделирование, 2022, т. 14, № 6, с. 1357-1370Изучение спектрального отклика растений на основе данных, собранных с помощью дистанционного зондирования, имеет большой потенциал для решения реальных проблем в различных областях исследований. В этом исследовании мы использовали спектральные свойства для идентификации инвазивного растения — борщевика Сосновского — по спутниковым снимкам. Борщевик Сосновского — инвазивное растение, которое наносит много вреда людям, животным и экосистеме в целом. Мы использовали выборочные данные о геолокации мест произрастания борщевика в Московской области, собранные с 2018 по 2020 год, и спутниковые снимки Sentinel-2 для спектрального анализа с целью его обнаружения на снимках. Мы развернули модель машинного обучения Random Forest (RF) на облачной платформе Google Earth Engine (GEE). Алгоритм обучается на наборе данных, состоящем из 12 каналов спутниковых снимков Sentinel-2, цифровой модели рельефа и некоторых спектральных индексов, которые используются в алгоритме в качестве параметров. Используемый подход заключается в выявлении биофизических параметров борщевика Сосновского по его коэффициентам отражения с уточнением радиочастотной модели непосредственно по набору данных. Наши результаты наглядно демонстрируют насколько сочетание методов дистанционного зондирования и машинного обучения может помочь в обнаружении борщевика и контроле его инвазивного распространения. Наш подход обеспечивает высокую точность обнаружения очагов произрастания борщевика Сосновского, составляющую 96,93 %.
Ключевые слова: борщевик Сосновского, инвазивные растения, Google Earth Engine, машинное обучение, случайный лес. -
Подход к оценке динамики уровня консолидированности отраcли
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 129-140В данной статье нами предложен новый подход к анализу эконометрических параметров отрасли для уровня консолидированности отрасли. Исследование базируется на простой модели управления отраслью в соответствии с моделью из теории автоматического управления. Состояние отрасли оценивается на основе ежеквартальных эконометрических параметров получаемых в обезличенном виде от каждой компании отрасли через налогового регулятора.
Предложен подход к анализу отрасли, который не предусматривает отслеживания эконометрических показателей каждой компании, но рассматривает параметры всех компаний отрасли, как единого объекта.
Ежеквартальными эконометрическими параметрами для каждой компании отрасли являются доход, количество работников, налоги и сборы, уплачиваемые в бюджет, доход от продажи лицензионных прав на программное обеспечение.
Был использован ABC-метод анализа модифицированный до ABCD-метода (D — компании с нулевым вкладом в соответствующую отраслевую метрику) для различных отраслевых метрик. Были построены Парето-кривые для множества эконометрических параметров отрасли.
Для оценки степени монополизированности отрасли был рассчитан индекс Херфиндаля – Хиршмана (ИХХ) для наиболее чувствительных метрик отрасли. С использованием ИХХ было показано что пандемия COVID-19 не привела к существенным изменениям уровня монополизированности российской ИТ-отрасли.
В качестве наиболее наглядного подхода к отображению отрасли было предложено использовать диаграмму рассеяния в сочетании с присвоением компаниям отрасли цвета в соответствии с их позицией на Парето-кривой. Также продемонстрирован эффект влияния процедуры аккредитации путем отображения отрасли в формате диаграммы рассеяния c красно-черным отображением аккредитованных и неаккредитованных компаний, соответственно.
И заключительным результатом, отраженным в статье является предложение использования процедуры сквозной идентификации при организации цепочек поставок программного обеспечения с целью контроля структуры рынка программного обеспечения. Этот подход позволяет избежать множественного учета при продаже лицензий на программное обеспечение в рамках цепочек поставок.
Результаты работы могут быть положены в основу дальнейшего анализа ИТ-отрасли и перехода к агентному моделированию отрасли.
-
Экспериментальное сравнение алгоритмов поиска вектора PageRank
Компьютерные исследования и моделирование, 2023, т. 15, № 2, с. 369-379Задача поиска PageRank вектора представляет большой научный и практический интерес ввиду своей применимости к работе современных поисковых систем. Несмотря на то, что данная задача сводится к поиску собственного вектора стохастической матрицы $P$, потребность в новых алгоритмах для ее решения обусловлена большими размерами входных данных. Для достижения не более чем линейного времени работы применяются различные рандомизированные методы, возвращающие ожидаемый ответ лишь с некоторой достаточно близкой к единице вероятностью. Нами рассматриваются два таких способа, сводящие задачу поиска вектора PageRank к задаче поиска равновесия в антагонистической матричной игре, которая затем решается с помощью алгоритма Григориадиса – Хачияна. При этом данная реализация эффективно работает в предположении о разреженности матрицы, подаваемой на вход. Насколько нам известно, до сих пор не было ни одной успешной реализации ни алгоритма Григориадиса – Хачияна, ни его применения к задаче поиска вектора PageRank. Данная статья ставит перед собой задачу восполнить этот пробел. В работе приводится описание двух версий алгоритма с псевдокодом и некоторые детали их реализации. Кроме того, в работе рассматривается другой вероятностный метод поиска вектора PageRank, а именно Markov chain Monte Carlo (MCMC), с целью сравнения результатов работы указанных алгоритмов на матрицах с различными значениями спектральной щели. Последнее представляет особый интерес, поскольку значение спектральной щели сильно влияет на скорость сходимости MCMC, и не оказывает никакого влияния на два других подхода. Сравнение проводилось на сгенерированных графах двух видов: цепочках и $d$-мерных кубах. Проведенные эксперименты, как и предсказывает теория, демонстрируют эффективность алгоритма Григориадиса – Хачияна по сравнению с MCMC для разреженных графов с маленьким значением спектральной щели. Весь код находится в открытом доступе, так чтобы все желающие могли воспроизвести полученные результаты самостоятельно, или же использовать данную реализацию в своих нуждах. Работа имеет чисто практическую направленность, никаких теоретических результатов авторами получено не было.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"