Текущий выпуск Номер 6, 2025 Том 17

Все выпуски

Результаты поиска по 'factor analysis':
Найдено статей: 64
  1. Шахгельдян К.И., Куксин Н.С., Домжалов И.Г., Пак Р.Л., Гельцер Б.И.
    Случайный лес факторов риска как прогностический инструмент неблагоприятных событий в клинической медицине
    Компьютерные исследования и моделирование, 2025, т. 17, № 5, с. 987-1004

    Целью исследования являются разработка ансамблевого метода машинного обучения, обеспечивающего построение интерпретируемых прогностических моделей, и его апробация на примере прогнозирования внутригоспитальной летальности (ВГЛ) у больных инфарктом миокарда с подъемом сегмента ST (ИМпST).

    Проведено ретроспективное когортное исследование по данным 5446 электронных историй болезни пациентов с ИМпST, которым выполнялось чрескожное коронарное вмешательство (ЧКВ). Было выделено две группы лиц, первую изк оторых составили 335 (6,2%) больных, умерших в стационаре, вторую — 5111 (93,8%) — с благоприятным исходом лечения. Пул потенциальных предикторов был сформирован с помощью методов математической статистики. С помощью методов мультиметрической категоризации (минимизация p-value, максимизация площади под ROC-кривой-AUC и результаты анализа shap-value), деревьев решений и многофакторной логистической регрессии (МЛР) предикторы были преобразованы в факторы риска ВГЛ. Для разработки прогностических моделей ВГЛ использовали МЛР, случайный лес факторов риска (СЛФР), стохастический градиентный бустинг (XGboost), случай- ный лес, методы Adaptive boosting, Gradient Boosting, Light Gradient-Boosting Machine, Categorical Boosting (CatBoost), Explainable Boosting Machine и Stacking.

    Авторами разработан метод СЛФР, который обобщает результаты прогноза модифицированных деревьев решений, выделяет факторы риска и ранжирует их по интенсивности влияния на вероятность развития неблагоприятного события. СЛФР позволяет разрабатывать модели с высоким прогностическим потенциалом (AUC = 0,908), сопоста- вимым с моделями CatBoost и Stacking (AUC: 0,904 и 0,908 соответственно). Метод СЛФР может рассматриваться в качестве важного инструмента для клинического обоснования результатов прогноза и стать основой для разработки высокоточных интерпретируемых моделей.

    Shakhgeldyan K.I., Kuksin N.S., Domzhalov I.G., Pak R.L., Geltser B.I.
    Random forest of risk factors as a predictive tool for adverse events in clinical medicine
    Computer Research and Modeling, 2025, v. 17, no. 5, pp. 987-1004

    The aim of study was to develop an ensemble machine learning method for constructing interpretable predictive models and to validate it using the example of predicting in-hospital mortality (IHM) in patients with ST-segment elevation myocardial infarction (STEMI).

    A retrospective cohort study was conducted using data from 5446 electronic medical records of STEMI patients who underwent percutaneous coronary intervention (PCI). Patients were divided into two groups: 335 (6.2%) patients who died during hospitalization and 5111 (93.8%) patients with a favourable in-hospital outcome. A pool of potential predictors was formed using statistical methods. Through multimetric categorization (minimizing p-values, maximizing the area under the ROC curve (AUC), and SHAP value analysis), decision trees, and multivariable logistic regression (MLR), predictors were transformed into risk factors for IHM. Predictive models for IHM were developed using MLR, Random Forest Risk Factors (RandFRF), Stochastic Gradient Boosting (XGboost), Random Forest (RF), Adaptive boosting, Gradient Boosting, Light Gradient-Boosting Machine, Categorical Boosting (CatBoost), Explainable Boosting Machine and Stacking methods.

    Authors developed the RandFRF method, which integrates the predictive outcomes of modified decision trees, identifies risk factors and ranks them based on their contribution to the risk of adverse outcomes. RandFRF enables the development of predictive models with high discriminative performance (AUC 0.908), comparable to models based on CatBoost and Stacking (AUC 0.904 and 0.908, respectively). In turn, risk factors provide clinicians with information on the patient’s risk group classification and the extent of their impact on the probability of IHM. The risk factors identified by RandFRF can serve not only as rationale for the prediction results but also as a basis for developing more accurate models.

  2. Рухленко А.С., Злобина К.Е., Гурия Г.Т.
    Гидродинамическая активация свертывания крови в стенозированных сосудах. Теоретический анализ
    Компьютерные исследования и моделирование, 2012, т. 4, № 1, с. 155-183

    В настоящей работе исследованы гидродинамические механизмы активации плазменного звена системы свертывания крови при числах Рейнольдса в интервале от 10 до 500. Условия активации изучены в рамках модели, предполагающей, что проницаемость сосудистых стенок по отношению к первичным активаторам системы свертывания крови возрастает с увеличением касательного напряжения. Обнаружено несколько характерных сценариев развития процессов тромбообразования. Изучено влияние изменения топологии течения на активацию внутрисосудистого свертывания крови. Установлено, что пороговая активация плазменного звена системы гемостаза в стенозированных сосудах может иметь место не только при ослаблении, но и при интенсификации кровотока. В заключительной части работы обсуждены возможные медицинские приложения полученных результатов.

    Rukhlenko A.S., Zlobina K.E., Guria G.T.
    Hydrodynamical activation of blood coagulation in stenosed vessels. Theoretical analysis
    Computer Research and Modeling, 2012, v. 4, no. 1, pp. 155-183

    The mechanisms of hydrodynamical activation of blood coagulation system are investigated in stenosed vessels for a wide range of Reynolds number values (from 10 up to 500). It is assumed that the vessel wall permeability for procoagulant factors rapidly increases when wall shear stress exceeds specific threshold value. A number of patterns of blood coagulation processes development are described. The influence of blood flow topology changes on activation of blood coagulation is explored. It is established that not only blood flow decrease, but also its increase may promote activation of blood coagulation. It was found that dependence of thrombogenic danger of stenosis on vessel lumen blockage ratio is non-monotonic. The relevance of obtained theoretical results for clinical practice is discussed.

    Просмотров за год: 2. Цитирований: 5 (РИНЦ).
  3. Разработана математическая модель роста опухоли в ткани с учетом ангиогенеза и антиангиогенной терапии. В модели учтены как конвективные потоки в ткани, так и собственная подвижность клеток опухоли. Считается, что клетка начинает мигрировать, если концентрация питательного вещества падает ниже критического уровня, и возвращается в состояние пролиферации в области с высокой концентрацией пищи. Злокачественные клетки, находящиеся в состоянии метаболического стресса, вырабатывают фактор роста эндотелия сосудов (VEGF), стимулируя опухолевый ангиогенез, что увеличивает приток питательных веществ. В работе моделируется антиангиогенный препарат, который необратимо связывается с VEGF, переводя его в неактивное состояние. Проведено численное исследование влияния концентрации и эффективности антиангиогенного препарата на скорость роста и структуру опухоли. Показано, что сама по себе противоопухолевая антиангиогенная терапия способна замедлить рост малоинвазивной опухоли, но не способна его полностью остановить.

    A mathematical model of tumor growth in tissue taking into account angiogenesis and antiangiogenic therapy is developed. In the model the convective flows in tissue are considered as well as individual motility of tumor cells. It is considered that a cell starts to migrate if the nutrient concentration falls lower than the critical level and returns into proliferation in the region with high nutrient concentration. Malignant cells in the state of metabolic stress produce vascular endothelial growth factor (VEGF), stimulating tumor angiogenesis, which increases the nutrient supply. In this work an antiangiogenic drug which bounds irreversibly to VEGF, converting it to inactive form, is modeled. Numerical analysis of influence of antiangiogenic drug concentration and efficiency on tumor rate of growth and structure is performed. It is shown that antiangiogenic therapy can decrease the growth of low-invasive tumor, but is not able to stop it completely.

    Просмотров за год: 4. Цитирований: 1 (РИНЦ).
  4. Салихова Т.Ю., Пушин Д.М., Гурия Г.Т.
    Исследование гидродинамической активации тромбоцитов в артериовенозных фистулах для гемодиализа
    Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 703-721

    Методами математического моделирования изучена гидродинамическая активация тромбоцитов в артериовенозных фистулах, используемых для проведения гемодиализа. Цель работы — найти те конфигурации артериовенозных фистул, риск активации в которых снижен при типичных для фистул скоростей течения. В рамках развитого подхода условием гидродинамической активации считалось превышение кумулятивным напряжением сдвига определенного порога. Величина порога зависела от степени мультимерности макромолекул фактора фон Виллебранда, играющих роль гидродинамических сенсоров у тромбоцитов. В работе было изучено влияние ряда представляющих интерес параметров артериовенозных фистул, таких как величина анастомозного угла, интенсивность кровотока, а также мультимерность макромолекул фактора фон Виллебранда, на активацию тромбоцитов. Построены параметрические диаграммы, позволяющие выделять области параметров, соответствующие наличию или отсутствию гидродинамической активации тромбоцитов. Получены скейлинговые соотношения, характеризующие критические кривые на параметрических диаграммах. Анализ влияния величины анастомозного угла на гидродинамическую активацию тромбоцитов показал, что тупые анастомозные углы должны в меньшей мере приводить к активации, чем острые. Исследование различных типов соединения артерий и вен в артериовенозных фистулах показало, что к числу наиболее безопасных относится конфигурация «конец вены в конец артерии». Для всех исследованных конфигураций артериовенозных фистул критические кривые, разделяющие области на параметрических диаграммах, являются монотонно убывающими функциями от степени мультимерности фактора фон Виллебранда. Выяснилось, что интенсивность кровотока через фистульную вену оказывает существенное влияние на вероятность запуска тромбообразования, в то время как направление течения через дистальную артерию значимо не сказывается на активации тромбоцитов. Полученные результаты позволяют определять конфигурации фистул, наиболее безопасные с точки зрения запуска тромбообразования. Авторы полагают, что результаты работы могут представлять интерес для врачей, выполняющих хирургические операции по созданию артериовенозных фистул для гемодиализа. В заключении обсуждается ряд клинических приложений результатов.

    Salikhova T.Y., Pushin D.M., Guria G.T.
    Investigation of shear-induced platelet activation in arteriovenous fistulas for haemodialysis
    Computer Research and Modeling, 2023, v. 15, no. 3, pp. 703-721

    Numerical modeling of shear-induced platelet activation in haemodialysis arteriovenous fistulas was carried out in this work. The goal was to investigate the mechanisms of threshold shear-induced platelet activation in fistulas. For shear-induced platelet activation to take place, shear stress accumulated by platelets along corresponding trajectories in blood flow had to exceed a definite threshold value. The threshold value of cumulative shear stress was supposed to depend on the multimer size of von Willebrand factor macromolecules acting as hydrodynamic sensors for platelets. The effect of arteriovenous fistulas parameters, such as the anastomotic angle, blood flow rate, and the multimer size of von Willebrand factor macromolecules, on platelet activation risk was studied. Parametric diagrams have been constructed that make it possible to distinguish the areas of parameters corresponding to the presence or absence of shear-induced platelet activation. Scaling relations that approximate critical curves on parametric diagrams were obtained. Analysis showed that threshold fistula flow rate is higher for obtuse anastomotic angle than for sharp ones. This means that a fistula with obtuse angle can be used in wider flow rate range without risk of platelet activation. In addition, a study of different anastomosis configurations of arteriovenous fistulas showed that the configuration “end of vein to end of artery” is among the safest. For all the investigated anastomosis configurations, the critical curves on the parametric diagrams were monotonically decreasing functions of von Willebrand factor multimer size. It was shown that fistula flow rate should have a significant impact on the probability of thrombus formation initiation, while the direction of flow through the distal artery did not affect platelet activation. The obtained results allowed to determine the safest fistula configurations with respect to thrombus formation triggering. The authors believe that the results of the work may be of interest to doctors performing surgical operations for creation of arteriovenous fistulas for haemodialysis. In the final section of the work, possible clinical applications of the obtained results by means of mathematical modeling are discussed.

  5. Работа посвящена анализу медико-биологических данных, получаемых с помощью локомоторных тренировок и тестирований космонавтов, проводимых как на Земле, так и во время полета. Данные эксперименты можно описать как движение космонавта по беговой дорожке согласно прописанному регламенту в различных скоростных режимах, во время которых не только записывается скорость, но и собирается ряд показателей, включающих частоту сердечных сокращений, величину давления на опору и пр. С целью анализа динамики состояния космонавта на протяжении длительного времени, для независимой оценки целевых показателей необходимо проводить качественную сегментацию режимов его движения. Особую актуальность данная задача приобретает при разработке автономной системы жизнеобеспечения космонавтов, которая будет действовать без сопровождения персонала с Земли. При сегментации целевых данных сложность заключается в наличии различных аномалий, включая отход испытуемого от заранее прописанного регламента, переходы между режимами движения произвольного вида и длительности, аппаратные сбои и пр. Статья включает в себя подробный обзор ряда современных ретроспективных (оффлайн) непараметрических методов поиска многократных разладок во временном ряде, где под разладкой понимается резкое изменение свойств наблюдаемого ряда, происходящее в неизвестный заранее момент времени. Особое внимание уделено алгоритмам и статистическим показателям, которые определяют степень однородности данных, а также способам поиска точек разладки. В данной работе рассматриваются подходы, основанные на методах динамического программирования и скользящего окна. Вторая часть статьи посвящена численному моделированию представленных методов на характерных примерах экспериментальных данных, включающих как простые, так и сложные скоростные профили движения. Проведенный анализ позволил выделить методы, которые в дальнейшем будут проанализированы на полном корпусе данных. Предпочтение отдается методам, обеспечивающим близость разметки к заданному эталону, потенциально позволяющим детектировать обе границы переходных процессов, а также обладающим робастностью относительно внутренних параметров.

    Shestoperov A.I., Ivchenko A.V., Fomina E.V.
    Changepoint detection in biometric data: retrospective nonparametric segmentation methods based on dynamic programming and sliding windows
    Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1295-1321

    This paper is dedicated to the analysis of medical and biological data obtained through locomotor training and testing of astronauts conducted both on Earth and during spaceflight. These experiments can be described as the astronaut’s movement on a treadmill according to a predefined regimen in various speed modes. During these modes, not only the speed is recorded but also a range of parameters, including heart rate, ground reaction force, and others, are collected. In order to analyze the dynamics of the astronaut’s condition over an extended period, it is necessary to perform a qualitative segmentation of their movement modes to independently assess the target metrics. This task becomes particularly relevant in the development of an autonomous life support system for astronauts that operates without direct supervision from Earth. The segmentation of target data is complicated by the presence of various anomalies, such as deviations from the predefined regimen, arbitrary and varying duration of mode transitions, hardware failures, and other factors. The paper includes a detailed review of several contemporary retrospective (offline) nonparametric methods for detecting multiple changepoints, which refer to sudden changes in the properties of the observed time series occurring at unknown moments. Special attention is given to algorithms and statistical measures that determine the homogeneity of the data and methods for detecting change points. The paper considers approaches based on dynamic programming and sliding window methods. The second part of the paper focuses on the numerical modeling of these methods using characteristic examples of experimental data, including both “simple” and “complex” speed profiles of movement. The analysis conducted allowed us to identify the preferred methods, which will be further evaluated on the complete dataset. Preference is given to methods that ensure the closeness of the markup to a reference one, potentially allow the detection of both boundaries of transient processes, as well as are robust relative to internal parameters.

  6. Кирилюк И.Л.
    Модели производственных функций для российской экономики
    Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 293-312

    В статье проведён сравнительный анализ применимости нескольких вариантов моделей производственной функции для анализа современной экономики России. Посредством регрессионного анализа оценено влияние таких факторов, как цены на нефть на мировом рынке, инновационные процессы, гипотеза о постоянной отдаче от факторов производства. Расчёты производились как для экономики в целом, так и для отдельных её отраслей. Показано, что рассматриваемые модели экономики России в целом и ряда её отраслей применительно к реальным данным демонстрируют значимую возрастающую отдачу по труду. Обсуждаются ограничения применимости моделей.

    Kirilyuk I.L.
    Models of production functions for the Russian economy
    Computer Research and Modeling, 2013, v. 5, no. 2, pp. 293-312

    A comparative analysis of the applicability of several variants of the production function models for the analysis of modern Russian economy is presented in a paper. Through regression analysis, the effect of such factors as the oil prices on the world market, the innovation, the hypothesis of constant returns to factors of production is estimated. Calculations were made both for the economy as a whole and for separate industries. It is shown that the models of the economy of Russia as a whole and some of its industries in relation to real data have significant increasing returns to labor. Limits of applicability for the models are discussed.

    Просмотров за год: 21. Цитирований: 65 (РИНЦ).
  7. Васюков А.В., Беклемышева К.А., Онучин Е.С., Товарнова Н.А., Петров И.Б.
    Расчет скорости поперечной волны при ударе по предварительно нагруженным нитям
    Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 887-897

    В работе рассматривается задача о поперечном ударе по тонкой предварительно нагруженной нити. Общепринятая теория о поперечному даре по тонкой нити отталкивается от классических публикаций Рахматулина и Смита. На основании теории Рахматулина – Смита получены соотношения, широко используемые в инженерной практике. Однако существуют многочисленные данные о том, что экспериментальные результаты могут существенно отличаться от оценок, сделанных на базе этих соотношений. Краткий обзор факторов, которые вызывают отличия, приведен в тексте статьи.

    Основное внимание в данной статье уделяется скорости поперечной волны, формирующейся при ударе, так как только ее можно непосредственно наблюдать и измерять с помощью высокоскоростной съемки или иных методов. Рассматривается влияние предварительного натяжения нити на скорость волны. Данный фактор важен, так как он неизбежно возникает в результатах натурных испытаний в силу того, что надежное закрепление и точное позиционирование нити на экспериментальной установке требует некоторого ее натяжения. В данной работе показано, что предварительная деформация нити существенно влияет на скорость поперечной волны, возникающей в ходе ударного взаимодействия.

    Выполнены расчеты серии постановок для нитей Kevlar 29 и Spectra 1000. Для различных уровней начального натяжения получены скорости поперечных волн. Приведено прямое сравнение численных результатов и аналитических оценок с данными экспериментов. Для рассмотренных постановок скорость поперечной волны в свободной и в нагруженной нити отличалась практически в два раза. Таким образом, показано, что измерения, основанные на высокоскоростной съемке и анализе наблюдаемых поперечных волн, должны учитывать предварительную деформацию нити.

    В работе предложена формула для быстрой оценки скорости поперечной волны в натянутых нитях. Данная формула получена из основных соотношений теории Рахматулина – Смита в предположении большой начальной деформации нити. На примере рассмотренных постановок для Kevlar 29 и Spectra 1000 показано, что полученная формула может давать существенно лучшие результаты, чем классическое приближение. Также показано, что прямой численный расчет дает результаты, которые оказываются значительно ближе к экспериментальным данным, чем любая из рассмотренных аналитических оценок.

    Vasyukov A.V., Beklemysheva K.A., Onuchin E.S., Tovarnova N.A., Petrov I.B.
    Calculation of transverse wave speed in preloaded fibres under an impact
    Computer Research and Modeling, 2022, v. 14, no. 4, pp. 887-897

    The paper considers the problem of transverse impact on a thin preloaded fiber. The commonly accepted theory of transverse impact on a thin fiber is based on the classical works of Rakhmatulin and Smith. The simple relations obtained from the Rakhmatulin – Smith theory are widely used in engineering practice. However, there are numerous evidences that experimental results may differ significantly from estimations based on these relations. A brief overview of the factors that cause the differences is given in this article.

    This paper focuses on the shear wave velocity, as it is the only feature that can be directly observed and measured using high-speed cameras or similar methods. The influence of the fiber preload on the wave speed is considered. This factor is important, since it inevitably arises in the experimental results. The reliable fastening and precise positioning of the fiber during the experiments requires its preload. This work shows that the preload significantly affects the shear wave velocity in the impacted fiber.

    Numerical calculations were performed for Kevlar 29 and Spectra 1000 yarns. Shear wave velocities are obtained for different levels of initial tension. A direct comparison of numerical results and analytical estimations with experimental data is presented. The speed of the transverse wave in free and preloaded fibers differed by a factor of two for the setup parameters considered. This fact demonstrates that measurements based on high-speed imaging and analysis of the observed shear waves should take into account the preload of the fibers.

    This paper proposes a formula for a quick estimation of the shear wave velocity in preloaded fibers. The formula is obtained from the basic relations of the Rakhmatulin – Smith theory under the assumption of a large initial deformation of the fiber. The formula can give significantly better results than the classical approximation, this fact is demonstrated using the data for preloaded Kevlar 29 and Spectra 1000. The paper also shows that direct numerical calculation has better corresponding with the experimental data than any of the considered analytical estimations.

  8. Говорков Д.А., Новиков В.П., Соловьёв И.Г., Цибульский В.Р.
    Интервальный анализ динамики растительного покрова
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1191-1205

    В развитие ранее полученного результата по моделированию динамики растительного покрова, вследствие изменчивости температурного фона, представлена новая схема интервального анализа динамики флористических образов формаций в случае, когда параметр скорости реагирования модели динамики каждого учетного вида растения задан интервалом разброса своих возможных значений. Желаемая в фундаментальных исследованиях детализация описания функциональных параметров макромоделей биоразнообразия, учитывающая сущностные причины наблюдаемых эволюционных процессов, может оказаться проблемной задачей. Использование более надежных интервальных оценок вариабельности функциональных параметров «обходит» проблему неопределенности в вопросах первичного оценивания эволюции фиторесурсного потенциала осваиваемых подконтрольных территорий. Полученные решения сохраняют не только качественную картину динамики видового разнообразия, но и дают строгую, в рамках исходных предположений, количественную оценку меры присутствия каждого вида растения. Практическая значимость схем двустороннего оценивания на основе конструирования уравнений для верхних и нижних границ траекторий разброса решений зависит от условий и меры пропорционального соответствия интервалов разбросов исходных параметров с интервалами разбросов решений. Для динамических систем желаемая пропорциональность далеко не всегда обеспечивается. Приведенные примеры демонстрирует приемлемую точность интервального оценивания эволюционных процессов. Важно заметить, что конструкции оценочных уравнений порождают исчезающие интервалы разбросов решений для квазипостоянных температурных возмущений системы. Иными словами, траектории стационарных температурных состояний растительного покрова предложенной схемой интервального оценивания не огрубляется. Строгость результата интервального оценивания видового состава растительного покрова формаций может стать определяющим фактором при выборе метода в задачах анализа динамики видового разнообразия и растительного потенциала территориальных систем ресурсно-экологического мониторинга. Возможности предложенного подхода иллюстрируются геоинформационными образами вычислительного анализа динамики растительного покрова полуострова Ямал и графиками ретроспективного анализа флористической изменчивости формаций ландшафтно-литологической группы «Верховые» по данным вариации летнего температурного фона метеостанции г. Салехарда от 2010 до 1935 года. Разработанные показатели флористической изменчивости и приведенные графики характеризуют динамику видового разнообразия, как в среднем, так и индивидуально, в виде интервалов возможных состояний по каждому учетному виду растения.

    Govorkov D.A., Novikov V.P., Solovyev I.G., Tsibulsky V.R.
    Interval analysis of vegetation cover dynamics
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1191-1205

    In the development of the previously obtained result on modeling the dynamics of vegetation cover, due to variations in the temperature background, a new scheme for the interval analysis of the dynamics of floristic images of formations is presented in the case when the parameter of the response rate of the model of the dynamics of each counting plant species is set by the interval of scatter of its possible values. The detailed description of the functional parameters of macromodels of biodiversity, desired in fundamental research, taking into account the essential reasons for the observed evolutionary processes, may turn out to be a problematic task. The use of more reliable interval estimates of the variability of functional parameters “bypasses” the problem of uncertainty in the primary assessment of the evolution of the phyto-resource potential of the developed controlled territories. The solutions obtained preserve not only a qualitative picture of the dynamics of species diversity, but also give a rigorous, within the framework of the initial assumptions, a quantitative assessment of the degree of presence of each plant species. The practical significance of two-sided estimation schemes based on the construction of equations for the upper and lower boundaries of the trajectories of the scatter of solutions depends on the conditions and measure of proportional correspondence of the intervals of scatter of the initial parameters with the intervals of scatter of solutions. For dynamic systems, the desired proportionality is not always ensured. The given examples demonstrate the acceptable accuracy of interval estimation of evolutionary processes. It is important to note that the constructions of the estimating equations generate vanishing intervals of scatter of solutions for quasi-constant temperature perturbations of the system. In other words, the trajectories of stationary temperature states of the vegetation cover are not roughened by the proposed interval estimation scheme. The rigor of the result of interval estimation of the species composition of the vegetation cover of formations can become a determining factor when choosing a method in the problems of analyzing the dynamics of species diversity and the plant potential of territorial systems of resource-ecological monitoring. The possibilities of the proposed approach are illustrated by geoinformation images of the computational analysis of the dynamics of the vegetation cover of the Yamal Peninsula and by the graphs of the retro-perspective analysis of the floristic variability of the formations of the landscapelithological group “Upper” based on the data of the summer temperature background of the Salehard weather station from 2010 to 1935. The developed indicators of floristic variability and the given graphs characterize the dynamics of species diversity, both on average and individually in the form of intervals of possible states for each species of plant.

  9. Ирхин И.А., Булатов В.Г., Воронцов К.В.
    Аддитивная регуляризация тематических моделей с быстрой векторизацией текста
    Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1515-1528

    Задача вероятностного тематического моделирования заключается в том, чтобы по заданной коллекции текстовых документов найти две матрицы: матрицу условных вероятностей тем в документах и матрицу условных вероятностей слов в темах. Каждый документ представляется в виде мультимножества слов, то есть предполагается, что для выявления тематики документа не важен порядок слов в нем, а важна только их частота. При таком предположении задача сводится к вычислению низкорангового неотрицательного матричного разложения, наилучшего по критерию максимума правдоподобия. Данная задача имеет в общем случае бесконечное множество решений, то есть является некорректно поставленной. Для регуляризации ее решения к логарифму правдоподобия добавляется взвешенная сумма оптимизационных критериев, с помощью которых формализуются дополнительные требования к модели. При моделировании больших текстовых коллекций хранение первой матрицы представляется нецелесообразным, поскольку ее размер пропорционален числу документов в коллекции. В то же время тематические векторные представления документов необходимы для решения многих задач текстовой аналитики — информационного поиска, кластеризации, классификации, суммаризации текстов. На практике тематический вектор вычисляется для каждого документа по необходимости, что может потребовать десятков итераций по всем словам документа. В данной работе предлагается способ быстрого вычисления тематического вектора для произвольного текста, требующий лишь одной итерации, то есть однократного прохода по всем словам документа. Для этого в модель вводится дополнительное ограничение в виде уравнения, позволяющего вычислять первую матрицу через вторую за линейное время. Хотя формально данное ограничение не является оптимизационным критерием, фактически оно выполняет роль регуляризатора и может применяться в сочетании с другими критериями в рамках теории аддитивной регуляризации тематических моделей ARTM. Эксперименты на трех свободно доступных текстовых коллекциях показали, что предложенный метод улучшает качество модели по пяти оценкам качества, характеризующим разреженность, различность, информативность и когерентность тем. Для проведения экспериментов использовались библиотеки с открытымк одомB igARTM и TopicNet.

    Irkhin I.A., Bulatov V.G., Vorontsov K.V.
    Additive regularizarion of topic models with fast text vectorizartion
    Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1515-1528

    The probabilistic topic model of a text document collection finds two matrices: a matrix of conditional probabilities of topics in documents and a matrix of conditional probabilities of words in topics. Each document is represented by a multiset of words also called the “bag of words”, thus assuming that the order of words is not important for revealing the latent topics of the document. Under this assumption, the problem is reduced to a low-rank non-negative matrix factorization governed by likelihood maximization. In general, this problem is ill-posed having an infinite set of solutions. In order to regularize the solution, a weighted sum of optimization criteria is added to the log-likelihood. When modeling large text collections, storing the first matrix seems to be impractical, since its size is proportional to the number of documents in the collection. At the same time, the topical vector representation (embedding) of documents is necessary for solving many text analysis tasks, such as information retrieval, clustering, classification, and summarization of texts. In practice, the topical embedding is calculated for a document “on-the-fly”, which may require dozens of iterations over all the words of the document. In this paper, we propose a way to calculate a topical embedding quickly, by one pass over document words. For this, an additional constraint is introduced into the model in the form of an equation, which calculates the first matrix from the second one in linear time. Although formally this constraint is not an optimization criterion, in fact it plays the role of a regularizer and can be used in combination with other regularizers within the additive regularization framework ARTM. Experiments on three text collections have shown that the proposed method improves the model in terms of sparseness, difference, logLift and coherence measures of topic quality. The open source libraries BigARTM and TopicNet were used for the experiments.

  10. Тупица Н.К.
    Об адаптивных ускоренных методах и их модификациях для альтернированной минимизации
    Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 497-515

    В первой части работы получена оценка скорости сходимости ранее известного ускоренного метода первого порядка AGMsDR на классе задач минимизации, вообще говоря, невыпуклых функций с $M$-липшицевым градиентом и удовлетворяющих условию Поляка – Лоясиевича. При реализации метода не требуется знать параметр $\mu^{PL}>0$ из условия Поляка – Лоясиевича, при этом метод демонстрирует линейную скорость сходимости (сходимость со скоростью геометрической прогрессии со знаменателем $\left.\left(1 - \frac{\mu^{PL}}{M}\right)\right)$. Ранее для метода была доказана сходимость со скоростью $O\left(\frac1{k^2}\right)$ на классе выпуклых задач с $M$-липшицевым градиентом. А также сходимость со скоростью геометрической прогрессии, знаменатель которой $\left(1 - \sqrt{\frac{\mu^{SC}}{M}}\right)$, но только если алгоритму известно значение параметра сильной выпуклости $\mu^{SC}>0$. Новизна результата заключается в том, что удается отказаться от использования методом значения параметра $\mu^{SC}>0$ и при этом сохранить линейную скорость сходимости, но уже без корня в знаменателе прогрессии.

    Во второй части представлена новая модификация метода AGMsDR для решения задач, допускающих альтернированную минимизацию (Alternating AGMsDR). Доказываются аналогичные оценки скорости сходимости на тех же классах оптимизационных задач.

    Таким образом, представлены адаптивные ускоренные методы с оценкой сходимости $O\left(\min\left\lbrace\frac{M}{k^2},\,\left(1-{\frac{\mu^{PL}}{M}}\right)^{(k-1)}\right\rbrace\right)$ на классе выпуклых функций с $M$-липшицевым градиентом, которые удовлетворяют условию Поляка – Лоясиевича. При этом для работы метода не требуются значения параметров $M$ и $\mu^{PL}$. Если же условие Поляка – Лоясиевича не выполняется, то можно утверждать, что скорость сходимости равна $O\left(\frac1{k^2}\right)$, но при этом методы не требуют никаких изменений.

    Также рассматривается адаптивная каталист-оболочка неускоренного градиентного метода, которая позволяет доказать оценку скорости сходимости $O\left(\frac1{k^2}\right)$. Проведено экспериментальное сравнение неускоренного градиентного метода с адаптивным выбором шага, ускоренного с помощью адаптивной каталист-оболочки с методами AGMsDR, Alternating AGMsDR, APDAGD (Adaptive Primal-Dual Accelerated Gradient Descent) и алгоритмом Синхорна для задачи, двойственной к задаче оптимального транспорта.

    Проведенные вычислительные эксперименты показали более быструю работу метода Alternating AGMsDR по сравнению как с неускоренным градиентным методом, ускоренным с помощью адаптивной каталист-оболочки, так и с методом AGMsDR, несмотря на асимптотически одинаковые гарантии скорости сходимости $O\left(\frac1{k^2}\right)$. Это может быть объяснено результатом о линейной скорости сходимости метода Alternating AGMsDR на классе задач, удовлетворяющих условию Поляка – Лоясиевича. Гипотеза была проверена на квадратичных задачах. Метод Alternating AGMsDR показал более быструю сходимость по сравнению с методом AGMsDR.

    Tupitsa N.K.
    On accelerated adaptive methods and their modifications for alternating minimization
    Computer Research and Modeling, 2022, v. 14, no. 2, pp. 497-515

    In the first part of the paper we present convergence analysis of AGMsDR method on a new class of functions — in general non-convex with $M$-Lipschitz-continuous gradients that satisfy Polyak – Lojasiewicz condition. Method does not need the value of $\mu^{PL}>0$ in the condition and converges linearly with a scale factor $\left(1 - \frac{\mu^{PL}}{M}\right)$. It was previously proved that method converges as $O\left(\frac1{k^2}\right)$ if a function is convex and has $M$-Lipschitz-continuous gradient and converges linearly with a~scale factor $\left(1 - \sqrt{\frac{\mu^{SC}}{M}}\right)$ if the value of strong convexity parameter $\mu^{SC}>0$ is known. The novelty is that one can save linear convergence if $\frac{\mu^{PL}}{\mu^{SC}}$ is not known, but without square root in the scale factor.

    The second part presents modification of AGMsDR method for solving problems that allow alternating minimization (Alternating AGMsDR). The similar results are proved.

    As the result, we present adaptive accelerated methods that converge as $O\left(\min\left\lbrace\frac{M}{k^2},\,\left(1-{\frac{\mu^{PL}}{M}}\right)^{(k-1)}\right\rbrace\right)$ on a class of convex functions with $M$-Lipschitz-continuous gradient that satisfy Polyak – Lojasiewicz condition. Algorithms do not need values of $M$ and $\mu^{PL}$. If Polyak – Lojasiewicz condition does not hold, the convergence is $O\left(\frac1{k^2}\right)$, but no tuning needed.

    We also consider the adaptive catalyst envelope of non-accelerated gradient methods. The envelope allows acceleration up to $O\left(\frac1{k^2}\right)$. We present numerical comparison of non-accelerated adaptive gradient descent which is accelerated using adaptive catalyst envelope with AGMsDR, Alternating AGMsDR, APDAGD (Adaptive Primal-Dual Accelerated Gradient Descent) and Sinkhorn's algorithm on the problem dual to the optimal transport problem.

    Conducted experiments show faster convergence of alternating AGMsDR in comparison with described catalyst approach and AGMsDR, despite the same asymptotic rate $O\left(\frac1{k^2}\right)$. Such behavior can be explained by linear convergence of AGMsDR method and was tested on quadratic functions. Alternating AGMsDR demonstrated better performance in comparison with AGMsDR.

Страницы: « первая предыдущая следующая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.