Все выпуски
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Анализ прогностических свойств тремора земной поверхности с помощью разложения Хуанга
Компьютерные исследования и моделирование, 2024, т. 16, № 4, с. 939-958Предлагается метод анализа тремора земной поверхности, измеряемого средствами космической геодезии с целью выделения прогностических эффектов активизации сейсмичности. Метод иллюстрируется на примере совместного анализа совокупности синхронных временных рядов ежесуточных вертикальных смещений земной поверхности на Японских островах для интервала времени 2009–2023 гг. Анализ основан на разбиении исходных данных (1047 временных рядов) на блоки (кластеры станций) и последовательном применении метода главных компонент. Разбиение сети станций на кластеры производится методом k-средних из критерия максимума псевдо-статистики. Для Японии оптимальное число кластеров было выбрано равным 15. К временным рядам главных компонент от блоков станций применяется метод разложения Хуанга на последовательность независимых эмпирических мод колебаний (Empirical Mode Decomposition, EMD). Для обеспечения устойчивости оценок волновых форм EMD-разложения производилось усреднение 1000 независимых аддитивных реализаций белого шума ограниченной амплитуды. С помощью разложения Холецкого ковариационной матрицы волновых форм первых трех EMD-компонент в скользящем временном окне определены индикаторы аномального поведения тремора. Путем вычисления корреляционной функции между средними индикаторами аномального поведения и выде- лившейся сейсмической энергии в окрестности Японских островов установлено, что всплески меры ано- мального поведения тремора предшествуют выбросам сейсмической энергии. Целью статьи является про- яснение распространенных гипотез о том, что движения земной коры, регистрируемые средствами космической геодезии, могут содержать прогностическую информацию. То, что смещения, регистрируемые геодезическими методами, реагируют на последствия землетрясений, широко известно и многократно демонстрировалось. Но выделение геодезических эффектов, предвещающих сейсмические события, является значительно более сложной задачей. В нашей статье мы предлагаем один из методов обнаружения прогностических эффектов в данных космической геодезии.
Ключевые слова: тремор земной поверхности, кластерный анализ, метод главных компонент, разложение Хуанга, мера аномального поведения временных рядов, корреляционная функция.
Analysis of predictive properties of ground tremor using Huang decomposition
Computer Research and Modeling, 2024, v. 16, no. 4, pp. 939-958A method is proposed for analyzing the tremor of the earth’s surface, measured by means of space geodesy, in order to highlight the prognostic effects of seismicity activation. The method is illustrated by the example of a joint analysis of a set of synchronous time series of daily vertical displacements of the earth’s surface on the Japanese Islands for the time interval 2009–2023. The analysis is based on dividing the source data (1047 time series) into blocks (clusters of stations) and sequentially applying the principal component method. The station network is divided into clusters using the K-means method from the maximum pseudo-F-statistics criterion, and for Japan the optimal number of clusters was chosen to be 15. The Huang decomposition method into a sequence of independent empirical oscillation modes (EMD — Empirical Mode Decomposition) is applied to the time series of principal components from station blocks. To provide the stability of estimates of the waveforms of the EMD decomposition, averaging of 1000 independent additive realizations of white noise of limited amplitude was performed. Using the Cholesky decomposition of the covariance matrix of the waveforms of the first three EMD components in a sliding time window, indicators of abnormal tremor behavior were determined. By calculating the correlation function between the average indicators of anomalous behavior and the released seismic energy in the vicinity of the Japanese Islands, it was established that bursts in the measure of anomalous tremor behavior precede emissions of seismic energy. The purpose of the article is to clarify common hypotheses that movements of the earth’s crust recorded by space geodesy may contain predictive information. That displacements recorded by geodetic methods respond to the effects of earthquakes is widely known and has been demonstrated many times. But isolating geodetic effects that predict seismic events is much more challenging. In our paper, we propose one method for detecting predictive effects in space geodesy data.
-
Исследование влияния миграции на социальную напряженность с использованием модели сплошной социальной стратификации
Компьютерные исследования и моделирование, 2022, т. 14, № 3, с. 661-673Фоновая социальная напряженность общества может быть количественно оценена по различным статистическим индикаторам. Модели, прогнозирующие динамику социальной напряженности, успешно применяются для описания различных социальных процессов. Когда количество рассматриваемых групп общества мало, динамику соответствующих индикаторов можно описать при помощи системы обыкновенных дифференциальных уравнений. При увеличении количества взаимодействующих элементов резко возрастает сложность задач, что существенно затрудняет их аналитическое исследование. Модель сплошной социальной стратификации получаетсяв результате перехода от дискретной цепочки взаимодействующих социальных слоев к их непрерывному распределению на некотором интервале, то есть перехода к модели сплошной среды. В этом случае напряженность распространяется локально, но в действительности элита общества влияет на все слои через средства массовой информации, а также интернет позволяет влиять всем группам на другие. Эти факторы можно учесть через слагаемое модели, описывающее негативное внешнее воздействие. В настоящей работе предложена модель сплошной социальной стратификации, описывающая динамику системы из двух социумов, связанных через процесс миграции населения. Предполагается, что из социального слоя системы-донора с наибольшей напряженностью происходит отток людей, переносящих свою напряженность в систему-акцептор, причем при миграции люди попадают в более бедные слои принимающего общества. Рассматриваетсяслуч ай пространственно однородных коэффициентов, что соответствует частному случаю небольшого социума. При помощи метода конечных объемов построена пространственнаяди скретизация задачи, корректно отражающая конечную скорость распространения напряженности в обществе. Выполнена проверка выбранной дискретизации путем сравненияч исленного решения с точными решениями вспомогательного уравнения нелинейной диффузии. Проведено численное исследование системы с миграцией при различных значениях параметров, проанализировано влияние интенсивности миграции на принимающее общество, найдены условия дестабилизации общества акцептора под влиянием миграции. Полученные в работе результаты могут быть применены при дальнейшем исследовании модели в случае пространственно неоднородных коэффициентов, что соответствует более реалистичной картине общества.
Ключевые слова: социальнаяна пряженность, модель сплошной социальной стратификации, уравнение нелинейной диффузии, метод конечных объемов.
Analysing the impact of migration on background social strain using a continuous social stratification model
Computer Research and Modeling, 2022, v. 14, no. 3, pp. 661-673The background social strain of a society can be quantitatively estimated using various statistical indicators. Mathematical models, allowing to forecast the dynamics of social strain, are successful in describing various social processes. If the number of interacting groups is small, the dynamics of the corresponding indicators can be modelled with a system of ordinary differential equations. The increase in the number of interacting components leads to the growth of complexity, which makes the analysis of such models a challenging task. A continuous social stratification model can be considered as a result of the transition from a discrete number of interacting social groups to their continuous distribution in some finite interval. In such a model, social strain naturally spreads locally between neighbouring groups, while in reality, the social elite influences the whole society via news media, and the Internet allows non-local interaction between social groups. These factors, however, can be taken into account to some extent using the term of the model, describing negative external influence on the society. In this paper, we develop a continuous social stratification model, describing the dynamics of two societies connected through migration. We assume that people migrate from the social group of donor society with the highest strain level to poorer social layers of the acceptor society, transferring the social strain at the same time. We assume that all model parameters are constants, which is a realistic assumption for small societies only. By using the finite volume method, we construct the spatial discretization for the problem, capable of reproducing finite propagation speed of social strain. We verify the discretization by comparing the results of numerical simulations with the exact solutions of the auxiliary non-linear diffusion equation. We perform the numerical analysis of the proposed model for different values of model parameters, study the impact of migration intensity on the stability of acceptor society, and find the destabilization conditions. The results, obtained in this work, can be used in further analysis of the model in the more realistic case of inhomogeneous coefficients.
-
Сравнительный анализ методов оптимизации для решения задачи интервальной оценки потерь электроэнергии
Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 231-239Данная работа посвящена сравнительному анализу оптимизационных методов и алгоритмов для проведения интервальной оценки технических потерь электроэнергии в распределительных сетях напряжением 6–20 кВ. Задача интервальной оценки потерь сформулирована в виде задачи многомерной условной минимизации/максимизации с неявной целевой функцией. Рассмотрен ряд методов численной оптимизации первого и нулевого порядков, с целью определения наиболее подходящего для решения рассмотренной проблемы. Таким является алгоритм BOBYQA, в котором целевая функция заменяется ее квадратичной аппроксимацией в пределах доверительной области.
Ключевые слова: методы оптимизации, технические потери электроэнергии, распределительные сети, BOBYQA.
Comparative analysis of optimization methods for electrical energy losses interval evaluation problem
Computer Research and Modeling, 2013, v. 5, no. 2, pp. 231-239Просмотров за год: 2. Цитирований: 1 (РИНЦ).This article is dedicated to a comparison analysis of optimization methods, in order to perform an interval estimation of electrical energy technical losses in distribution networks of voltage 6–20 kV. The issue of interval evaluation is represented as a multi-dimensional conditional minimization/maximization problem with implicit target function. A number of numerical optimization methods of first and zero orders is observed, with the aim of determining the most suitable for the problem of interest. The desired algorithm is BOBYQA, in which the target function is replaced with its quadratic approximation in some trusted region.
-
Популяционные волны и их бифуркации в модели «активный хищник – пассивная жертва»
Компьютерные исследования и моделирование, 2020, т. 12, № 4, с. 831-843В работе изучаются пространственно-временные режимы, реализующиеся в системе типа «хищник– жертва». Предполагается, что хищники перемещаются направленно и случайно, а жертвы распространяются только диффузионно. Демографические процессы в популяции хищников не учитываются, их общая численность постоянна и является параметром. Переменные модели — плотности популяций хищников и жертв, скорость хищников — связаны между собой системой трех уравнений типа «реакция – диффузия – адвекция». Система рассматривается на кольцевом ареале (с периодическими условиями на границах интервала). Исследуются бифуркации волновых режимов при изменении двух параметров — общего количества хищников и их коэффициента таксисного ускорения.
Основным методом исследования является численный анализ. Пространственная аппроксимация задачи в частных производных производится методом конечных разностей. Интегрирование полученной системы обыкновенных дифференциальных уравнений по времени проводится методом Рунге – Кутты. Для анализа динамических режимов используются построение отображения Пуанкаре, расчет показателей Ляпунова и спектр Фурье.
Показано, что популяционные волны в предположениях модели могут возникать в результате направленных перемещений хищников. Динамика в системе качественно меняется при росте их общего количества. При малых значениях устойчив стационарный однородный режим, который сменяется автоколебаниями в виде бегущих волн. Форма волн претерпевает изменения с ростом бифуркационного параметра, ее усложнение происходит за счет увеличения числа временных колебательных мод. Большой коэффициент таксисного ускорения приводит к переходу от многочастотных к хаотическим и гиперхаотическим популяционным волнам. При большом количестве хищников реализуется стационарный режим с отсутствием жертв.
Population waves and their bifurcations in a model “active predator – passive prey”
Computer Research and Modeling, 2020, v. 12, no. 4, pp. 831-843Our purpose is to study the spatio-temporal population wave behavior observed in the predator-prey system. It is assumed that predators move both directionally and randomly, and prey spread only diffusely. The model does not take into account demographic processes in the predator population; it’s total number is constant and is a parameter. The variables of the model are the prey and predator densities and the predator speed, which are connected by a system of three reaction – diffusion – advection equations. The system is considered on an annular range, that is the periodic conditions are set at the boundaries of the interval. We have studied the bifurcations of wave modes arising in the system when two parameters are changed — the total number of predators and their taxis acceleration coefficient.
The main research method is a numerical analysis. The spatial approximation of the problem in partial derivatives is performed by the finite difference method. Integration of the obtained system of ordinary differential equations in time is carried out by the Runge –Kutta method. The construction of the Poincare map, calculation of Lyapunov exponents, and Fourier analysis are used for a qualitative analysis of dynamic regimes.
It is shown that, population waves can arise as a result of existence of directional movement of predators. The population dynamics in the system changes qualitatively as the total predator number increases. А stationary homogeneous regime is stable at low value of parameter, then it is replaced by self-oscillations in the form of traveling waves. The waveform becomes more complicated as the bifurcation parameter increases; its complexity occurs due to an increase in the number of temporal vibrational modes. A large taxis acceleration coefficient leads to the possibility of a transition from multi-frequency to chaotic and hyperchaotic population waves. A stationary regime without preys becomes stable with a large number of predators.
-
Метод оценки риска возникновения сердечно-сосудистой недостаточности при физической нагрузке с использованием лазерной автодинной интерферометрии
Компьютерные исследования и моделирование, 2017, т. 9, № 2, с. 311-321Представлены результаты исследования риска возникновения сердечно-сосудистой недостаточности юных спортсменов и подростков при стрессовой физической нагрузке. Описан метод скрининг-диагностики риска развития коллапсоидных осложнений. Приведены результаты бесконтактного измерения формы пульсовой волны лучевой артерии в области запястья с использованием полупроводникового лазерного автодина. При измерениях использовался лазерный диод типа RLD-650 со следующими характеристиками: мощность излучения — 5 мВт, длина волны излучения — 654 нм. Была решена задача по восстановлению формы движения отражателя, в качестве которого выступала поверхность кожи над артерией человека, апробирован метод оценки риска возникновения сердечно-сосудистой недостаточности при физической нагрузке и проведен анализ результатов его применения для оценки риска развития коллапсоидной реакции у юных спортсменов. В качестве анализируемых параметров были выбраны следующие показатели: крутизна систолического подъема на участке быстрой и медленной фазы, скорость изменения пульсовой волны на катакроте, вариабельность кардиоинтервалов, определяемая по временным интервалам между максимумами пульсовых волн. Форма пульсовой волны анализировалась по ее первой и второй производной по времени. Нули первой производной пульсовой волны позволяют выделить время систолического подъема. Минимум второй производной соответствует окончанию фазы быстрого и началу фазы медленного нарастания давления в систолу. Использование первой и второй производной пульсовой волны позволило раздельно анализировать форму пульсовой волны в фазе быстрого и в фазе медленного роста давления во время систолического подъема. Показано, что наличие аномалий в форме пульсовой волны в сочетании с ваготоническим типом нервной регуляции сердечно-сосудистой системы является признаком возникновения опасности коллапсоидной реакции при физической нагрузке.
Ключевые слова: сердечно-сосудистая система, пульсовая волна, скрининг-диагностика, полупроводниковый лазерный автодин.
Method of estimation of heart failure during a physical exercise
Computer Research and Modeling, 2017, v. 9, no. 2, pp. 311-321Просмотров за год: 8. Цитирований: 1 (РИНЦ).The results of determination of the risk of cardiovascular failure of young athletes and adolescents in stressful physical activity have been demonstrated. The method of screening diagnostics of the risk of developing heart failure has been described. The results of contactless measurement of the form of the pulse wave of the radial artery using semiconductor laser autodyne have been presented. In the measurements used laser diode type RLD-650 specifications: output power of 5 mW, emission wavelength 654 nm. The problem was solved by the reduced form of the reflector movement, which acts as the surface of the skin of the human artery, tested method of assessing the risk of cardiovascular disease during exercise and the analysis of the results of its application to assess the risk of cardiovascular failure reactions of young athletes. As analyzed parameters were selected the following indicators: the steepness of the rise in the systolic portion of the fast and slow phase, the rate of change in the pulse wave catacrota variability of cardio intervals as determined by the time intervals between the peaks of the pulse wave. It analyzed pulse wave form on its first and second derivative with respect to time. The zeros of the first derivative of the pulse wave allow to set aside time in systolic rise. A minimum of the second derivative corresponds to the end of the phase and the beginning of the slow pressure build-up in the systole. Using the first and second derivative of the pulse wave made it possible to separately analyze the pulse wave form phase of rapid and slow pressure increase phase during systolic expansion. It has been established that the presence of anomalies in the form of the pulse wave in combination with vagotonic nervous regulation of the cardiovascular system of a patient is a sign of danger collapse of circulation during physical exercise.
-
Анализ социально-информационного влияния на примере войн США в Корее, Вьетнаме и Ираке
Компьютерные исследования и моделирование, 2014, т. 6, № 1, с. 167-184В первом разделе работы предложено определение функции представления (восприятия) о показателях, являющихся компонентами субъективной картины мира индивидов. Используя основной психофизический закон в форме С. Стивенса и опираясь на гипотезы социализации, рациональности, индивидуального выбора, комплексности информационных воздействий, динамики представлений и восприятий, доступности, получены формальные зависимости, позволяющие вычислять функции представления (восприятия) для показателей вероятностного (известна функция распределения или субъективная вероятность) и интервального типов. Во втором и третьем разделах выполнена оценка параметров функции представления по данным опросов населения США, связанных с войной в Корее, во Вьетнаме и в Ираке.
Ключевые слова: общественное мнение, представление и восприятие, социально-информационные воздействия, основной психофизический закон, математическая модель.
Analysis of socio-informational influence through the examples of US wars in Korea, Vietnam, and Iraq
Computer Research and Modeling, 2014, v. 6, no. 1, pp. 167-184Просмотров за год: 2. Цитирований: 3 (РИНЦ).In the first section of the paper a definition of presentation (perception) functions — components of individual’s subjective view of the world — are proposed. Using the basic psychophysical law formulated by S. Stevens, and relying on the hypotheses of socialization, rationality, individual choice, complexity of informational influences, dynamics of ideas and perceptions, and accessibility, formal dependence was derived allowing to calculate the function of presentation (perception) for probabilistic indicators (with known distribution function or subjective probability) and of interval type. In the second and third sections parameters of the presentation function according to surveys of the U.S. population related to the war in Korea, Vietnam, and Iraq are estimated.
-
Влияние сократимости сердца и его сосудистой нагрузки на частоту сердечных сокращений у спортсменов
Компьютерные исследования и моделирование, 2017, т. 9, № 2, с. 323-329Частота сердечных сокращений (ЧСС) является наиболее доступным для измерения показателем. С целью контроля индивидуальной реакции на нагрузочность физических упражнений ЧСС измеряется при выполнении спортсменами мышечной работы разных типов (работа на силовых тренажерах, различные виды тренировочных и соревновательных нагрузок). По величине ЧСС и динамике ее изменения при мышечной работе и восстановлении можно объективно судить о функциональном состоянии сердечно-сосудистой системы спортсмена, об уровне его индивидуальной физической работоспособности, а также об адаптивной реакции на ту или иную физическую нагрузку. Однако ЧСС не является самостоятельным детерминантом физического состояния спортсмена. Величина ЧСС формируется в результате взаимодействия основных физиологических механизмов, определяющих гемодинамический режим сердечного выброса. Сердечный ритм зависит, с одной стороны, от сократимости сердца, от венозного возврата, от объемов предсердий и желудочков сердца, а с другой стороны — от сосудистой нагрузки сердца, основными компонентами которой являются эластическое и периферическое сопротивление артериальной системы. Величины сосудистых сопротивлений артериальной системы зависят от мощности мышечной работы и времени ее выполнения. Чувствительность ЧСС к изменениям сосудистой нагрузки сердца и его сократимости определялась у спортсменов по результатам парного регрессионного анализа одновременно зарегистрированных данных ЧСС, периферического $(R)$ и эластического $(E_a)$ сопротивлений (сосудистая нагрузка сердца), а также механической мощности $(W)$ сердечных сокращений (сократимость сердца). Коэффициенты чувствительности и коэффициенты парной корреляции между ЧСС и показателями сосудистой нагрузки и сократимости левого желудочка сердца спортсмена определялись в покое и при выполнении мышечной работы на велоэргометре. Показано, что с ростом мощности велоэргометрической нагрузки и увеличением ЧСС возрастают также коэффициенты корреляции и чувствительности между ЧСС и показателями сосудистой нагрузки сердца $(R, E_a)$ и его сократимости $(W)$.
Ключевые слова: частота сердечных сокращений, артериальное давление, фазовые интервалы сердечного цикла, сосудистые сопротивления, коэффициент чувствительности, коэффициент корреляции, сократимость, мощность сердечных сокращений.
Effects of the heart contractility and its vascular load on the heart rate in athlets
Computer Research and Modeling, 2017, v. 9, no. 2, pp. 323-329Просмотров за год: 5. Цитирований: 1 (РИНЦ).Heart rate (HR) is the most affordable indicator for measuring. In order to control the individual response to physical exercises of different load types heart rate is measured when the athletes perform different types of muscular work (strength machines, various types of training and competitive exercises). The magnitude of heart rate and its dynamics during muscular work and recovery can be objectively judged on the functional status of the cardiovascular system of an athlete, the level of its individual physical performance, as well as an adaptive response to a particular exercise. However, the heart rate is not an independent determinant of the physical condition of an athlete. HR size is formed by the interaction of the basic physiological mechanisms underlying cardiac hemodynamic ejection mode. Heart rate depends on one hand, on contractility of the heart, the venous return, the volumes of the atria and ventricles of the heart and from vascular heart load, the main components of which are elastic and peripheral resistance of the arterial system on the other hand. The values of arterial system vascular resistances depend on the power of muscular work and its duration. HR sensitivity to changes in heart load and vascular contraction was determined in athletes by pair regression analysis simultaneously recorded heart rate data, and peripheral $(R)$ and elastic $(E_a)$ resistance (heart vascular load), and the power $(W)$ of heartbeats (cardiac contractility). The coefficients of sensitivity and pair correlation between heart rate indicators and vascular load and contractility of left ventricle of the heart were determined in athletes at rest and during the muscular work on the cycle ergometer. It is shown that increase in both ergometer power load and heart rate is accompanied by the increase of correlation coefficients and coefficients of the heart rate sensitivity to $R$, $E_a$ and $W$.
-
A framework for medical image segmentation based on measuring diversity of pixel’s intensity utilizing interval approach
Компьютерные исследования и моделирование, 2021, т. 13, № 5, с. 1059-1066Segmentation of medical image is one of the most challenging tasks in analysis of medical image. It classifies the organs pixels or lesions from medical images background like MRI or CT scans, that is to provide critical information about the human organ’s volumes and shapes. In scientific imaging field, medical imaging is considered one of the most important topics due to the rapid and continuing progress in computerized medical image visualization, advances in analysis approaches and computer-aided diagnosis. Digital image processing becomes more important in healthcare field due to the growing use of direct digital imaging systems for medical diagnostics. Due to medical imaging techniques, approaches of image processing are now applicable in medicine. Generally, various transformations will be needed to extract image data. Also, a digital image can be considered an approximation of a real situation includes some uncertainty derived from the constraints on the process of vision. Since information on the level of uncertainty will influence an expert’s attitude. To address this challenge, we propose novel framework involving interval concept that consider a good tool for dealing with the uncertainty, In the proposed approach, the medical images are transformed into interval valued representation approach and entropies are defined for an image object and background. Then we determine a threshold for lower-bound image and for upper-bound image, and then calculate the mean value for the final output results. To demonstrate the effectiveness of the proposed framework, we evaluate it by using synthetic image and its ground truth. Experimental results showed how performance of the segmentation-based entropy threshold can be enhanced using proposed approach to overcome ambiguity.
A framework for medical image segmentation based on measuring diversity of pixel’s intensity utilizing interval approach
Computer Research and Modeling, 2021, v. 13, no. 5, pp. 1059-1066Segmentation of medical image is one of the most challenging tasks in analysis of medical image. It classifies the organs pixels or lesions from medical images background like MRI or CT scans, that is to provide critical information about the human organ’s volumes and shapes. In scientific imaging field, medical imaging is considered one of the most important topics due to the rapid and continuing progress in computerized medical image visualization, advances in analysis approaches and computer-aided diagnosis. Digital image processing becomes more important in healthcare field due to the growing use of direct digital imaging systems for medical diagnostics. Due to medical imaging techniques, approaches of image processing are now applicable in medicine. Generally, various transformations will be needed to extract image data. Also, a digital image can be considered an approximation of a real situation includes some uncertainty derived from the constraints on the process of vision. Since information on the level of uncertainty will influence an expert’s attitude. To address this challenge, we propose novel framework involving interval concept that consider a good tool for dealing with the uncertainty, In the proposed approach, the medical images are transformed into interval valued representation approach and entropies are defined for an image object and background. Then we determine a threshold for lower-bound image and for upper-bound image, and then calculate the mean value for the final output results. To demonstrate the effectiveness of the proposed framework, we evaluate it by using synthetic image and its ground truth. Experimental results showed how performance of the segmentation-based entropy threshold can be enhanced using proposed approach to overcome ambiguity.
-
Семантическая структуризация текстовых документов на основе паттернов сущностей естественного языка
Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1185-1197Рассматривается технология создания паттернов из слов (понятий) естественного языка по текстовым данным в модели «мешок слов». Паттерны применяются для снижения размерности исходного пространства в описании документов и поиска семантически связанных слов по темам. Процесс снижения размерности реализуется через формирование по паттернам латентных признаков. Исследуется многообразие структур отношений документов для разбиения их на темы в латентном пространстве.
Считается, что заданное множество документов (объектов) разделено на два непересекающихся класса, для анализа которых необходимо использовать общий словарь. Принадлежность слов к общему словарю изначально неизвестна. Объекты классов рассматриваются в ситуации оппозиции друг к другу. Количественные параметры оппозиционности определяются через значения устойчивости каждого признака и обобщенные оценки объектов по непересекающимся наборам признаков.
Для вычисления устойчивости используются разбиения значений признаков на непересекающиеся интервалы, оптимальные границы которых определяются по специальному критерию. Максимум устойчивости достигается при условии, что в границах каждого интервала содержатся значения одного из двух классов.
Состав признаков в наборах (паттернах из слов) формируется из упорядоченной по значениям устойчивости последовательности. Процесс формирования паттернов и латентных признаков на их основе реализуется по правилам иерархической агломеративной группировки.
Набор латентных признаков используется для кластерного анализа документов по метрическим алгоритмам группировки. В процессе анализа применяется коэффициент контентной аутентичности на основе данных о принадлежности документов к классам. Коэффициент является численной характеристикой доминирования представителей классов в группах.
Для разбиения документов на темы предложено использовать объединение групп по отношению их центров. В качестве закономерностей по каждой теме рассматривается упорядоченная по частоте встречаемости последовательность слов из общего словаря.
Приводятся результаты вычислительного эксперимента на коллекциях авторефератов научных диссертаций. Сформированы последовательности слов из общего словаря по четырем темам.
Ключевые слова: тематическое моделирование, иерархическая агломеративная группировка, онтология, общий словарь, контентная аутентичность.
Semantic structuring of text documents based on patterns of natural language entities
Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1185-1197The technology of creating patterns from natural language words (concepts) based on text data in the bag of words model is considered. Patterns are used to reduce the dimension of the original space in the description of documents and search for semantically related words by topic. The process of dimensionality reduction is implemented through the formation of patterns of latent features. The variety of structures of document relations is investigated in order to divide them into themes in the latent space.
It is considered that a given set of documents (objects) is divided into two non-overlapping classes, for the analysis of which it is necessary to use a common dictionary. The belonging of words to a common vocabulary is initially unknown. Class objects are considered as opposition to each other. Quantitative parameters of oppositionality are determined through the values of the stability of each feature and generalized assessments of objects according to non-overlapping sets of features.
To calculate the stability, the feature values are divided into non-intersecting intervals, the optimal boundaries of which are determined by a special criterion. The maximum stability is achieved under the condition that the boundaries of each interval contain values of one of the two classes.
The composition of features in sets (patterns of words) is formed from a sequence ordered by stability values. The process of formation of patterns and latent features based on them is implemented according to the rules of hierarchical agglomerative grouping.
A set of latent features is used for cluster analysis of documents using metric grouping algorithms. The analysis applies the coefficient of content authenticity based on the data on the belonging of documents to classes. The coefficient is a numerical characteristic of the dominance of class representatives in groups.
To divide documents into topics, it is proposed to use the union of groups in relation to their centers. As patterns for each topic, a sequence of words ordered by frequency of occurrence from a common dictionary is considered.
The results of a computational experiment on collections of abstracts of scientific dissertations are presented. Sequences of words from the general dictionary on 4 topics are formed.
-
Интервальный анализ динамики растительного покрова
Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1191-1205В развитие ранее полученного результата по моделированию динамики растительного покрова, вследствие изменчивости температурного фона, представлена новая схема интервального анализа динамики флористических образов формаций в случае, когда параметр скорости реагирования модели динамики каждого учетного вида растения задан интервалом разброса своих возможных значений. Желаемая в фундаментальных исследованиях детализация описания функциональных параметров макромоделей биоразнообразия, учитывающая сущностные причины наблюдаемых эволюционных процессов, может оказаться проблемной задачей. Использование более надежных интервальных оценок вариабельности функциональных параметров «обходит» проблему неопределенности в вопросах первичного оценивания эволюции фиторесурсного потенциала осваиваемых подконтрольных территорий. Полученные решения сохраняют не только качественную картину динамики видового разнообразия, но и дают строгую, в рамках исходных предположений, количественную оценку меры присутствия каждого вида растения. Практическая значимость схем двустороннего оценивания на основе конструирования уравнений для верхних и нижних границ траекторий разброса решений зависит от условий и меры пропорционального соответствия интервалов разбросов исходных параметров с интервалами разбросов решений. Для динамических систем желаемая пропорциональность далеко не всегда обеспечивается. Приведенные примеры демонстрирует приемлемую точность интервального оценивания эволюционных процессов. Важно заметить, что конструкции оценочных уравнений порождают исчезающие интервалы разбросов решений для квазипостоянных температурных возмущений системы. Иными словами, траектории стационарных температурных состояний растительного покрова предложенной схемой интервального оценивания не огрубляется. Строгость результата интервального оценивания видового состава растительного покрова формаций может стать определяющим фактором при выборе метода в задачах анализа динамики видового разнообразия и растительного потенциала территориальных систем ресурсно-экологического мониторинга. Возможности предложенного подхода иллюстрируются геоинформационными образами вычислительного анализа динамики растительного покрова полуострова Ямал и графиками ретроспективного анализа флористической изменчивости формаций ландшафтно-литологической группы «Верховые» по данным вариации летнего температурного фона метеостанции г. Салехарда от 2010 до 1935 года. Разработанные показатели флористической изменчивости и приведенные графики характеризуют динамику видового разнообразия, как в среднем, так и индивидуально, в виде интервалов возможных состояний по каждому учетному виду растения.
Ключевые слова: биоразнообразие, динамика, растительный покров, формация, интервальный анализ, границы разброса решений, равновесное состояние, динамика реагирования.
Interval analysis of vegetation cover dynamics
Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1191-1205In the development of the previously obtained result on modeling the dynamics of vegetation cover, due to variations in the temperature background, a new scheme for the interval analysis of the dynamics of floristic images of formations is presented in the case when the parameter of the response rate of the model of the dynamics of each counting plant species is set by the interval of scatter of its possible values. The detailed description of the functional parameters of macromodels of biodiversity, desired in fundamental research, taking into account the essential reasons for the observed evolutionary processes, may turn out to be a problematic task. The use of more reliable interval estimates of the variability of functional parameters “bypasses” the problem of uncertainty in the primary assessment of the evolution of the phyto-resource potential of the developed controlled territories. The solutions obtained preserve not only a qualitative picture of the dynamics of species diversity, but also give a rigorous, within the framework of the initial assumptions, a quantitative assessment of the degree of presence of each plant species. The practical significance of two-sided estimation schemes based on the construction of equations for the upper and lower boundaries of the trajectories of the scatter of solutions depends on the conditions and measure of proportional correspondence of the intervals of scatter of the initial parameters with the intervals of scatter of solutions. For dynamic systems, the desired proportionality is not always ensured. The given examples demonstrate the acceptable accuracy of interval estimation of evolutionary processes. It is important to note that the constructions of the estimating equations generate vanishing intervals of scatter of solutions for quasi-constant temperature perturbations of the system. In other words, the trajectories of stationary temperature states of the vegetation cover are not roughened by the proposed interval estimation scheme. The rigor of the result of interval estimation of the species composition of the vegetation cover of formations can become a determining factor when choosing a method in the problems of analyzing the dynamics of species diversity and the plant potential of territorial systems of resource-ecological monitoring. The possibilities of the proposed approach are illustrated by geoinformation images of the computational analysis of the dynamics of the vegetation cover of the Yamal Peninsula and by the graphs of the retro-perspective analysis of the floristic variability of the formations of the landscapelithological group “Upper” based on the data of the summer temperature background of the Salehard weather station from 2010 to 1935. The developed indicators of floristic variability and the given graphs characterize the dynamics of species diversity, both on average and individually in the form of intervals of possible states for each species of plant.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"