Текущий выпуск Номер 1, 2024 Том 16

Все выпуски

Результаты поиска по 'Gaussian noise':
Найдено статей: 7
  1. Иванова А.С., Омельченко С.С., Котлярова Е.В., Матюхин В.В.
    Калибровка параметров модели расчета матрицы корреспонденций для г. Москвы
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 961-978

    В данной работе рассматривается задача восстановления матрицы корреспонденций для наблюдений реальных корреспонденций в г. Москве. Следуя общепринятому подходу [Гасников и др., 2013], транспортная сеть рассматривается как ориентированный граф, дуги которого соответствуют участкам дороги, а вершины графа — районы, из которых выезжают / в которые въезжают участники движения. Число жителей города считается постоянным. Задача восстановления матрицы корреспонденций состоит в расчете всех корреспонденций израйона $i$ в район $j$.

    Для восстановления матрицы предлагается использовать один из наиболее популярных в урбанистике способов расчета матрицы корреспонценций — энтропийная модель. В работе, в соответствии с работой [Вильсон, 1978], приводится описание эволюционного обоснования энтропийной модели, описывается основная идея перехода к решению задачи энтропийно-линейного программирования (ЭЛП) при расчете матрицы корреспонденций. Для решения полученной задачи ЭЛП предлагается перейти к двойственной задаче и решать задачу относительно двойственных переменных. В работе описывается несколько численных методов оптимизации для решения данной задачи: алгоритм Синхорна и ускоренный алгоритм Синхорна. Далее приводятся численные эксперименты для следующих вариантов функций затрат: линейная функция затрат и сумма степенной и логарифмической функции затрат. В данных функциях затраты представляют из себя некоторую комбинацию среднего времени в пути и расстояния между районами, которая зависит от параметров. Для каждого набора параметров функции затрат рассчитывается матрица корреспонденций и далее оценивается качество восстановленной матрицы относительно известной матрицы корреспонденций. Мы предполагаем, что шум в восстановленной матрице корреспонденций является гауссовским, в результате в качестве метрики качества выступает среднеквадратичное отклонение. Данная задача представляет из себя задачу невыпуклой оптимизации. В статье приводится обзор безградиенных методов оптимизации для решения невыпуклых задач. Так как число параметров функции затрат небольшое, для определения оптимальных параметров функции затрат было выбрано использовать метод перебора по сетке значений. Таким образом, для каждого набора параметров рассчитывается матрица корреспонденций и далее оценивается качество восстановленной матрицы относительно известной матрицы корреспонденций. Далее по минимальному значению невязки для каждой функции затрат определяется, для какой функции затрат и при каких значениях параметров восстановленная матрица наилучшим образом описывает реальные корреспонденции.

    Ivanova A.S., Omelchenko S.S., Kotliarova E.V., Matyukhin V.V.
    Calibration of model parameters for calculating correspondence matrix for Moscow
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 961-978

    In this paper, we consider the problem of restoring the correspondence matrix based on the observations of real correspondences in Moscow. Following the conventional approach [Gasnikov et al., 2013], the transport network is considered as a directed graph whose edges correspond to road sections and the graph vertices correspond to areas that the traffic participants leave or enter. The number of city residents is considered constant. The problem of restoring the correspondence matrix is to calculate all the correspondence from the $i$ area to the $j$ area.

    To restore the matrix, we propose to use one of the most popular methods of calculating the correspondence matrix in urban studies — the entropy model. In our work, which is based on the work [Wilson, 1978], we describe the evolutionary justification of the entropy model and the main idea of the transition to solving the problem of entropy-linear programming (ELP) in calculating the correspondence matrix. To solve the ELP problem, it is proposed to pass to the dual problem. In this paper, we describe several numerical optimization methods for solving this problem: the Sinkhorn method and the Accelerated Sinkhorn method. We provide numerical experiments for the following variants of cost functions: a linear cost function and a superposition of the power and logarithmic cost functions. In these functions, the cost is a combination of average time and distance between areas, which depends on the parameters. The correspondence matrix is calculated for multiple sets of parameters and then we calculate the quality of the restored matrix relative to the known correspondence matrix.

    We assume that the noise in the restored correspondence matrix is Gaussian, as a result, we use the standard deviation as a quality metric. The article provides an overview of gradient-free optimization methods for solving non-convex problems. Since the number of parameters of the cost function is small, we use the grid search method to find the optimal parameters of the cost function. Thus, the correspondence matrix calculated for each set of parameters and then the quality of the restored matrix is evaluated relative to the known correspondence matrix. Further, according to the minimum residual value for each cost function, we determine for which cost function and at what parameter values the restored matrix best describes real correspondence.

  2. Pham C.T., Tran T.T., Dang H.P.
    Image noise removal method based on nonconvex total generalized variation and primal-dual algorithm
    Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 527-541

    In various applications, i. e., astronomical imaging, electron microscopy, and tomography, images are often damaged by Poisson noise. At the same time, the thermal motion leads to Gaussian noise. Therefore, in such applications, the image is usually corrupted by mixed Poisson – Gaussian noise.

    In this paper, we propose a novel method for recovering images corrupted by mixed Poisson – Gaussian noise. In the proposed method, we develop a total variation-based model connected with the nonconvex function and the total generalized variation regularization, which overcomes the staircase artifacts and maintains neat edges.

    Numerically, we employ the primal-dual method combined with the classical iteratively reweighted $l_1$ algorithm to solve our minimization problem. Experimental results are provided to demonstrate the superiority of our proposed model and algorithm for mixed Poisson – Gaussian removal to state-of-the-art numerical methods.

    Pham C.T., Tran T.T., Dang H.P.
    Image noise removal method based on nonconvex total generalized variation and primal-dual algorithm
    Computer Research and Modeling, 2023, v. 15, no. 3, pp. 527-541

    In various applications, i. e., astronomical imaging, electron microscopy, and tomography, images are often damaged by Poisson noise. At the same time, the thermal motion leads to Gaussian noise. Therefore, in such applications, the image is usually corrupted by mixed Poisson – Gaussian noise.

    In this paper, we propose a novel method for recovering images corrupted by mixed Poisson – Gaussian noise. In the proposed method, we develop a total variation-based model connected with the nonconvex function and the total generalized variation regularization, which overcomes the staircase artifacts and maintains neat edges.

    Numerically, we employ the primal-dual method combined with the classical iteratively reweighted $l_1$ algorithm to solve our minimization problem. Experimental results are provided to demonstrate the superiority of our proposed model and algorithm for mixed Poisson – Gaussian removal to state-of-the-art numerical methods.

  3. Курушина С.Е., Шаповалова Е.А.
    Рождение и развитие беспорядка внутри упорядоченного состояния в пространственно распределенной модели химической реакции
    Компьютерные исследования и моделирование, 2017, т. 9, № 4, с. 595-607

    В работе изложены основные моменты приближения среднего поля в применении к многокомпонентным стохастическим реакционно-диффузионным системам.

    Представлена изучаемая модель химической реакции — брюсселятор. Записаны кинетические уравнения реакции, учитывающие диффузию промежуточных компонент и флуктуации концентраций исходных веществ. Флуктуации моделируются как случайные гауссовы однородные и изотропные в пространстве поля, с нулевым средним и пространственной корреляционной функцией, имеющей нетривиальную структуру. В работе рассматриваются значения параметров модели, соответствующие пространственно неоднородному упорядоченному состоянию в детерминированном случае.

    В работе получено одноточечное двумерное нелинейное самосогласованное уравнение Фоккера–Планка в интерпретации Стратоновича в приближении среднего поля для пространственно распределенного стохастического брюсселятора, которое описывает динамику плотности распределения вероятностей значений концентраций компонент рассматриваемой системы. Найдены значения интенсивности внешнего шума, соответствующие двум типам решений уравнения Фоккера–Планка: решению с времен- ной бимодальностью и решению с многократным чередованием одно- и бимодального видов плотности вероятностей. Проведено численное исследование динамики плотности распределения вероятностей и изучено поведение во времени дисперсий, математических ожиданий и наиболее вероятных значений концентраций компонент при различных значениях интенсивности шума и бифуркационного параметра в указанных областях параметров задачи.

    Показано, что, начиная с некоторого значения интенсивности внешнего шума, внутри упорядоченной фазы зарождается беспорядок, существующий конечное время, причем чем больше шум, тем больше его время жизни. Чем дальше от точки бифуркации, тем меньше шум, который его порождает, и тем уже область значений интенсивности шума, при которых система эволюционирует к упорядоченному, но уже новому статистически стационарному состоянию. При некотором втором значении интенсивности шума возникает перемежаемость упорядоченной и разупорядоченной фаз. Увеличение интенсивности шума приводит к тому, что частота перемежаемости увеличивается.

    Таким образом, показано, что сценарием шумоиндуцированного перехода «порядок–беспорядок» в изучаемой системе является перемежаемость упорядоченной и разупорядоченной фаз.

    Kurushina S.E., Shapovalova E.A.
    Origin and growth of the disorder within an ordered state of the spatially extended chemical reaction model
    Computer Research and Modeling, 2017, v. 9, no. 4, pp. 595-607

    We now review the main points of mean-field approximation (MFA) in its application to multicomponent stochastic reaction-diffusion systems.

    We present the chemical reaction model under study — brusselator. We write the kinetic equations of reaction supplementing them with terms that describe the diffusion of the intermediate components and the fluctuations of the concentrations of the initial products. We simulate the fluctuations as random Gaussian homogeneous and spatially isotropic fields with zero means and spatial correlation functions with a non-trivial structure. The model parameter values correspond to a spatially-inhomogeneous ordered state in the deterministic case.

    In the MFA we derive single-site two-dimensional nonlinear self-consistent Fokker–Planck equation in the Stratonovich's interpretation for spatially extended stochastic brusselator, which describes the dynamics of probability distribution density of component concentration values of the system under consideration. We find the noise intensity values appropriate to two types of Fokker–Planck equation solutions: solution with transient bimodality and solution with the multiple alternation of unimodal and bimodal types of probability density. We study numerically the probability density dynamics and time behavior of variances, expectations, and most probable values of component concentrations at various noise intensity values and the bifurcation parameter in the specified region of the problem parameters.

    Beginning from some value of external noise intensity inside the ordered phase disorder originates existing for a finite time, and the higher the noise level, the longer this disorder “embryo” lives. The farther away from the bifurcation point, the lower the noise that generates it and the narrower the range of noise intensity values at which the system evolves to the ordered, but already a new statistically steady state. At some second noise intensity value the intermittency of the ordered and disordered phases occurs. The increasing noise intensity leads to the fact that the order and disorder alternate increasingly.

    Thus, the scenario of the noise induced order–disorder transition in the system under study consists in the intermittency of the ordered and disordered phases.

    Просмотров за год: 7.
  4. Ряшко Л.Б., Слепухина Е.С.
    Анализ воздействия аддитивного и параметрического шума на модель нейрона Моррис –Лекара
    Компьютерные исследования и моделирование, 2017, т. 9, № 3, с. 449-468

    Работа посвящена проблеме анализа эффектов, связанных с воздействием аддитивного и параметрического шума на процессы, происходящие в нервной клетке. Это исследование проводится на примере известной модели Моррис–Лекара, которая описывается двумерной системой обыкновенных дифференциальных уравнений. Одним из основных свойств нейрона является возбудимость — способность отвечать на внешнее воздействие резким изменением электрического потенциала на мембране клетки. В данной статье рассматривается набор параметров, при котором модель демонстрирует возбудимость класса 2. Динамика системы исследуется при изменении параметра внешнего тока. Рассматриваются две параметрические зоны: зона моностабильности, в которой единственным аттрактором детерминированной системы является устойчивое равновесие, и зона бистабильности, характеризующаяся сосуществованием устойчивого равновесия и предельного цикла. Показывается, что в обоих случаях под действием шума в системе генерируются колебания смешанных мод (т. е. чередование колебаний малых и больших амплитуд). В зоне моностабильности данный феномен связан с высокой возбудимостью системы, а в зоне бистабильности он объясняется индуцированными шумом переходами между аттракторами. Это явление подтверждается изменениями плотности распределения случайных траекторий, спектральной плотности и статистиками межспайковых интервалов. Проводится сравнение действия аддитивного и параметрического шума. Показывается, что при добавлении параметрического шума стохастическая генерация колебаний смешанных мод наблюдается при меньших интенсивностях, чем при воздействии аддитивного шума. Для количественного анализа этих стохастических феноменов предлагается и применяется подход, основанный на технике функций стохастической чувствительности и методе доверительных областей. В случае устойчивого равновесия это эллипс, а для устойчивого предельного цикла такой областью является доверительная полоса. Исследование взаимного расположения доверительных областей и границы, разделяющей бассейны притяжения аттракторов, при изменении параметров шума позволяет предсказать возникновение индуцированных шумом переходов. Эффективность данного аналитического подхода подтверждается хорошим соответствием теоретических оценок с результатами прямого численного моделирования.

    Ryashko L.B., Slepukhina E.S.
    Analysis of additive and parametric noise effects on Morris – Lecar neuron model
    Computer Research and Modeling, 2017, v. 9, no. 3, pp. 449-468

    This paper is devoted to the analysis of the effect of additive and parametric noise on the processes occurring in the nerve cell. This study is carried out on the example of the well-known Morris – Lecar model described by the two-dimensional system of ordinary differential equations. One of the main properties of the neuron is the excitability, i.e., the ability to respond to external stimuli with an abrupt change of the electric potential on the cell membrane. This article considers a set of parameters, wherein the model exhibits the class 2 excitability. The dynamics of the system is studied under variation of the external current parameter. We consider two parametric zones: the monostability zone, where a stable equilibrium is the only attractor of the deterministic system, and the bistability zone, characterized by the coexistence of a stable equilibrium and a limit cycle. We show that in both cases random disturbances result in the phenomenon of the stochastic generation of mixed-mode oscillations (i. e., alternating oscillations of small and large amplitudes). In the monostability zone this phenomenon is associated with a high excitability of the system, while in the bistability zone, it occurs due to noise-induced transitions between attractors. This phenomenon is confirmed by changes of probability density functions for distribution of random trajectories, power spectral densities and interspike intervals statistics. The action of additive and parametric noise is compared. We show that under the parametric noise, the stochastic generation of mixed-mode oscillations is observed at lower intensities than under the additive noise. For the quantitative analysis of these stochastic phenomena we propose and apply an approach based on the stochastic sensitivity function technique and the method of confidence domains. In the case of a stable equilibrium, this confidence domain is an ellipse. For the stable limit cycle, this domain is a confidence band. The study of the mutual location of confidence bands and the boundary separating the basins of attraction for different noise intensities allows us to predict the emergence of noise-induced transitions. The effectiveness of this analytical approach is confirmed by the good agreement of theoretical estimations with results of direct numerical simulations.

    Просмотров за год: 11.
  5. Башкирцева И.А., Перевалова Т.В., Ряшко Л.Б.
    Метод стохастической чувствительности в анализе динамических трансформаций в модели «две жертвы – хищник»
    Компьютерные исследования и моделирование, 2022, т. 14, № 6, с. 1343-1356

    Данная работа посвящена исследованию проблемы моделирования и анализа сложных колебательных режимов, как регулярных, так и хаотических, в системах взаимодействующих популяций в присутствии случайных возмущений. В качестве исходной концептуальной детерминированной модели рассматривается вольтерровская система трех дифференциальных уравнений, описывающая динамику популяций жертв двух конкурирующих видов и хищника. Данная модель учитывает следующие ключевые биологические факторы: естественный прирост жертв, их внутривидовую и межвидовую конкуренцию, вымирание хищников в отсутствие жертв, скорость выедания жертв хищником, прирост популяции хищника вследствие выедания жертв, интенсивность внутривидовой конкуренции в популяции хищника. В качестве бифуркационного параметра используется скорость роста второй популяции жертв. На некотором интервале изменения этого параметра система демонстрирует большое разнообразие динамических режимов: равновесных, колебательных и хаотических. Важной особенностью этой модели является мультистабильность. В данной работе мы фокусируемся на изучении параметрической зоны тристабильности, когда в системе сосуществуют устойчивое равновесие и два предельных цикла. Такая биритмичность в присутствии случайных возмущений порождает новые динамические режимы, не имеющие аналогов в детерминированном случае. Целью статьи является детальное изучение стохастических явлений, вызванных случайными флуктуациями скорости роста второй популяции жертв. В качестве математической модели таких флуктуаций мы рассматриваем белый гауссовский шум. Методами прямого численного моделирования решений соответствующей системы стохастических дифференциальных уравнений выявлены и описаны следующие феномены: однонаправленные стохастические переходы с одного цикла на другой; триггерный режим, вызванный переходами между циклами; индуцированный шумом переход с циклов на равновесие, отвечающее вымиранию популяции хищника и второй жертвы. В статье представлены результаты анализа этих явлений с помощью показателей Ляпунова, выявлены параметрические условия переходов от порядка к хаосу и от хаоса к порядку. Для аналитического исследования таких вызванных шумом многоэтапных переходов были применены техника функций стохастической чувствительности и метод доверительных областей. В статье показано, как этот математический аппарат позволяет спрогнозировать интенсивность шума, приводящего к качественным трансформациям режимов стохастической популяционной динамики.

    Bashkirtseva I.A., Perevalova T.V., Ryashko L.B.
    Stochastic sensitivity analysis of dynamic transformations in the “two prey – predator” model
    Computer Research and Modeling, 2022, v. 14, no. 6, pp. 1343-1356

    This work is devoted to the study of the problem of modeling and analyzing complex oscillatory modes, both regular and chaotic, in systems of interacting populations in the presence of random perturbations. As an initial conceptual deterministic model, a Volterra system of three differential equations is considered, which describes the dynamics of prey populations of two competing species and a predator. This model takes into account the following key biological factors: the natural increase in prey, their intraspecific and interspecific competition, the extinction of predators in the absence of prey, the rate of predation by predators, the growth of the predator population due to predation, and the intensity of intraspecific competition in the predator population. The growth rate of the second prey population is used as a bifurcation parameter. At a certain interval of variation of this parameter, the system demonstrates a wide variety of dynamic modes: equilibrium, oscillatory, and chaotic. An important feature of this model is multistability. In this paper, we focus on the study of the parametric zone of tristability, when a stable equilibrium and two limit cycles coexist in the system. Such birhythmicity in the presence of random perturbations generates new dynamic modes that have no analogues in the deterministic case. The aim of the paper is a detailed study of stochastic phenomena caused by random fluctuations in the growth rate of the second population of prey. As a mathematical model of such fluctuations, we consider white Gaussian noise. Using methods of direct numerical modeling of solutions of the corresponding system of stochastic differential equations, the following phenomena have been identified and described: unidirectional stochastic transitions from one cycle to another, trigger mode caused by transitions between cycles, noise-induced transitions from cycles to the equilibrium, corresponding to the extinction of the predator and the second prey population. The paper presents the results of the analysis of these phenomena using the Lyapunov exponents, and identifies the parametric conditions for transitions from order to chaos and from chaos to order. For the analytical study of such noise-induced multi-stage transitions, the technique of stochastic sensitivity functions and the method of confidence regions were applied. The paper shows how this mathematical apparatus allows predicting the intensity of noise, leading to qualitative transformations of the modes of stochastic population dynamics.

  6. Силаева В.А., Силаева М.В., Силаев А.М.
    Оценивание параметров моделей временных рядов с марковскими переключениями режимов
    Компьютерные исследования и моделирование, 2018, т. 10, № 6, с. 903-918

    В работе рассматривается задача оценивания параметров временных рядов, описываемых регрессионными моделями с марковскими переключениями двух режимов в случайные моменты времени и независимыми гауссовскими шумами. Для решения предлагается вариант EM-алгоритма, основанный на итерационной процедуре, в ходе которой происходит чередование оценивания параметров регрессии при заданной последовательности переключений режимов и оценивания последовательности переключений при заданных параметрах моделей регрессии. В отличие от известных методов оценивания параметров регрессий с марковскими переключениями режимов, которые основаны на вычислении апостериорных вероятностей дискретных состояний последовательности переключений, в работе находятся оптимальные по критерию максимума апостериорной вероятности оценки процесса переключений. В результате предлагаемый алгоритм оказывается более простым и требует меньшее количество расчетов. Компьютерное моделирование позволяет выявить факторы, влияющие на точность оценивания. К таким факторам относятся число наблюдений, количество неизвестных параметров регрессии, степень их различия в разных режимах работы, а также величина отношения сигнала к шуму, которую в моделях регрессии можно связать с величиной коэффициента детерминации. Предложенный алгоритм применяется для задачи оценивания параметров в моделях регрессии для доходности индекса РТС в зависимости от доходностей индекса S&P 500 и акций «Газпрома» за период с 2013 года по 2018 год. Проводится сравнение оценок параметров, найденных с помощью предлагаемого алгоритма, с оценками, которые формируются с использованием эконометрического пакета EViews, и с оценками обычного метода наименьших квадратов без учета переключений режимов. Учет переключений позволяет получить более точное представление о структуре статистической зависимости исследуемых переменных. В моделях с переключениями рост отношения сигнала к шуму приводит к тому, что уменьшаются различия в оценках, вырабатываемых предлагаемым алгоритмом и с помощью программы EViews.

    Silaeva V.A., Silaeva M.V., Silaev A.M.
    Estimation of models parameters for time series with Markov switching regimes
    Computer Research and Modeling, 2018, v. 10, no. 6, pp. 903-918

    The paper considers the problem of estimating the parameters of time series described by regression models with Markov switching of two regimes at random instants of time with independent Gaussian noise. For the solution, we propose a variant of the EM algorithm based on the iterative procedure, during which an estimation of the regression parameters is performed for a given sequence of regime switching and an evaluation of the switching sequence for the given parameters of the regression models. In contrast to the well-known methods of estimating regression parameters in the models with Markov switching, which are based on the calculation of a posteriori probabilities of discrete states of the switching sequence, in the paper the estimates are calculated of the switching sequence, which are optimal by the criterion of the maximum of a posteriori probability. As a result, the proposed algorithm turns out to be simpler and requires less calculations. Computer modeling allows to reveal the factors influencing accuracy of estimation. Such factors include the number of observations, the number of unknown regression parameters, the degree of their difference in different modes of operation, and the signal-to-noise ratio which is associated with the coefficient of determination in regression models. The proposed algorithm is applied to the problem of estimating parameters in regression models for the rate of daily return of the RTS index, depending on the returns of the S&P 500 index and Gazprom shares for the period from 2013 to 2018. Comparison of the estimates of the parameters found using the proposed algorithm is carried out with the estimates that are formed using the EViews econometric package and with estimates of the ordinary least squares method without taking into account regimes switching. The account of regimes switching allows to receive more exact representation about structure of a statistical dependence of investigated variables. In switching models, the increase in the signal-to-noise ratio leads to the fact that the differences in the estimates produced by the proposed algorithm and using the EViews program are reduced.

    Просмотров за год: 36.
  7. В работе рассматривается метод исследования панельных данных, основанный на использовании агломеративной иерархической кластеризации — группировки объектов на основании сходства и разли- чия их признаков в иерархию вложенных друг в друга кластеров. Применялись 2 альтернативных способа вычисления евклидовых расстояний между объектами — расстояния между усредненными по интервалу наблюдений значениями и расстояния с использованием данных за все рассматриваемые годы. Сравнивались 3 альтернативных метода вычисления расстояний между кластерами. В первом случае таким расстоянием считается расстояние между ближайшими элементами из двух кластеров, во втором — среднее по парам элементов, в третьем — расстояние между наиболее удаленными элементами. Исследована эффективность использования двух индексов качества кластеризации — индекса Данна и Силуэта для выбора оптимального числа кластеров и оценки статистической значимости полученных решений. Способ оценивания статистической достоверности кластерной структуры заключался в сравнении качества кластеризации, на реальной выборке с качеством кластеризаций на искусственно сгенерированных выборках панельных данных с теми же самыми числом объектов, признаков и длиной рядов. Генерация производилась из фиксированного вероятностного распределения. Использовались способы симуляции, имитирующие гауссов белый шум и случайное блуждание. Расчеты с индексом Силуэт показали, что случайное блуждание характеризуется не только ложной регрессией, но и ложной кластеризацией. Кластеризация принималась достоверной для данного числа выделенных кластеров, если значение индекса на реальной выборке оказывалось больше значения 95%-ного квантиля для искусственных данных. В качестве выборки реальных данных использован набор временных рядов показателей, характеризующих производство в российских регионах. Для этих данных только Силуэт показывает достоверную кластеризацию на уровне $p < 0.05$. Расчеты также показали, что значения индексов для реальных данных в целом ближе к значениям для случайных блужданий, чем для белого шума, но имеют значимые отличия и от тех, и от других. Визуально можно выделить скопления близко расположенных друг от друга в трехмерном признаковом пространстве точек, выделяемые также в качестве кластеров применяемым алгоритмом иерархической кластеризации.

    Kirilyuk I.L., Sen'ko O.V.
    Assessing the validity of clustering of panel data by Monte Carlo methods (using as example the data of the Russian regional economy)
    Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1501-1513

    The paper considers a method for studying panel data based on the use of agglomerative hierarchical clustering — grouping objects based on the similarities and differences in their features into a hierarchy of clusters nested into each other. We used 2 alternative methods for calculating Euclidean distances between objects — the distance between the values averaged over observation interval, and the distance using data for all considered years. Three alternative methods for calculating the distances between clusters were compared. In the first case, the distance between the nearest elements from two clusters is considered to be distance between these clusters, in the second — the average over pairs of elements, in the third — the distance between the most distant elements. The efficiency of using two clustering quality indices, the Dunn and Silhouette index, was studied to select the optimal number of clusters and evaluate the statistical significance of the obtained solutions. The method of assessing statistical reliability of cluster structure consisted in comparing the quality of clustering on a real sample with the quality of clustering on artificially generated samples of panel data with the same number of objects, features and lengths of time series. Generation was made from a fixed probability distribution. At the same time, simulation methods imitating Gaussian white noise and random walk were used. Calculations with the Silhouette index showed that a random walk is characterized not only by spurious regression, but also by “spurious clustering”. Clustering was considered reliable for a given number of selected clusters if the index value on the real sample turned out to be greater than the value of the 95% quantile for artificial data. A set of time series of indicators characterizing production in the regions of the Russian Federation was used as a sample of real data. For these data only Silhouette shows reliable clustering at the level p < 0.05. Calculations also showed that index values for real data are generally closer to values for random walks than for white noise, but it have significant differences from both. Since three-dimensional feature space is used, the quality of clustering was also evaluated visually. Visually, one can distinguish clusters of points located close to each other, also distinguished as clusters by the applied hierarchical clustering algorithm.

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.