Все выпуски
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Долгосрочная макромодель мировой динамики на основе эмпирических данных
Компьютерные исследования и моделирование, 2013, т. 5, № 5, с. 883-891В работе обсуждаются методические основы и проблемы моделирования мировой динамики. Излагаются подходы к построению новой имитационной модели глобального развития и первичные результаты моделирования. В основу построения модели положен эмпирический подход, основанный на анализе статистики основных социально-экономических показателей. На основании этого анализа выделены основные переменные. Для этих переменных составлены динамические уравнения (в непрерывно-дифференциальной форме). Связи между переменными подбирались исходя из динамики соответствующих показателей в прошлом и на основании экспертных оценок, при этом использовались эконометрические методы, основанные на регрессионном анализе. Были проведены расчеты по полученной системе динамических уравнений, результаты представлены в виде пучка траекторий для тех показателей, которые непосредственно наблюдаемы и по которым имеется статистика. Таким образом, имеется возможность оценить разброс траекторий и понять прогнозные возможности представленной модели.
The long-term empirical macro model of world dynamics
Computer Research and Modeling, 2013, v. 5, no. 5, pp. 883-891Просмотров за год: 4. Цитирований: 3 (РИНЦ).The work discusses the methodological basis and problems of modeling of world dynamics. Outlines approaches to the construction of a new simulation model of global development and the results of the simulation. The basis of the model building is laid empirical approach which based on the statistical analysis of the main socio-economic indicators. On the basis of this analysis identified the main variables. Dynamic equations (in continuous differential form) were written for these variables. Dependencies between variables were selected based on the dynamics of indicators in the past and on the basis of expert assessments, while econometric techniques were used, based on regression analysis. Calculations have been performed for the resulting dynamic equations system, the results are presented in the form of a trajectories beam for those indicators that are directly observable, and for which statistics are available. Thus, it is possible to assess the scatter of the trajectories and understand the predictive capability of this model.
-
Nonlinear modeling of oscillatory viscoelastic fluid with variable viscosity: a comparative analysis of dual solutions
Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 409-431The viscoelastic fluid flow model across a porous medium has captivated the interest of many contemporary researchers due to its industrial and technical uses, such as food processing, paper and textile coating, packed bed reactors, the cooling effect of transpiration and the dispersion of pollutants through aquifers. This article focuses on the influence of variable viscosity and viscoelasticity on the magnetohydrodynamic oscillatory flow of second-order fluid through thermally radiating wavy walls. A mathematical model for this fluid flow, including governing equations and boundary conditions, is developed using the usual Boussinesq approximation. The governing equations are transformed into a system of nonlinear ordinary differential equations using non-similarity transformations. The numerical results obtained by applying finite-difference code based on the Lobatto IIIa formula generated by bvp4c solver are compared to the semi-analytical solutions for the velocity, temperature and concentration profiles obtained using the homotopy perturbation method (HPM). The effect of flow parameters on velocity, temperature, concentration profiles, skin friction coefficient, heat and mass transfer rate, and skin friction coefficient is examined and illustrated graphically. The physical parameters governing the fluid flow profoundly affected the resultant flow profiles except in a few cases. By using the slope linear regression method, the importance of considering the viscosity variation parameter and its interaction with the Lorentz force in determining the velocity behavior of the viscoelastic fluid model is highlighted. The percentage increase in the velocity profile of the viscoelastic model has been calculated for different ranges of viscosity variation parameters. Finally, the results are validated numerically for the skin friction coefficient and Nusselt number profiles.
Ключевые слова: viscoelastic fluid model, variable viscosity, Lorentz force, porous channel, oscillatory flow, HPM, heat transfer.
Nonlinear modeling of oscillatory viscoelastic fluid with variable viscosity: a comparative analysis of dual solutions
Computer Research and Modeling, 2024, v. 16, no. 2, pp. 409-431The viscoelastic fluid flow model across a porous medium has captivated the interest of many contemporary researchers due to its industrial and technical uses, such as food processing, paper and textile coating, packed bed reactors, the cooling effect of transpiration and the dispersion of pollutants through aquifers. This article focuses on the influence of variable viscosity and viscoelasticity on the magnetohydrodynamic oscillatory flow of second-order fluid through thermally radiating wavy walls. A mathematical model for this fluid flow, including governing equations and boundary conditions, is developed using the usual Boussinesq approximation. The governing equations are transformed into a system of nonlinear ordinary differential equations using non-similarity transformations. The numerical results obtained by applying finite-difference code based on the Lobatto IIIa formula generated by bvp4c solver are compared to the semi-analytical solutions for the velocity, temperature and concentration profiles obtained using the homotopy perturbation method (HPM). The effect of flow parameters on velocity, temperature, concentration profiles, skin friction coefficient, heat and mass transfer rate, and skin friction coefficient is examined and illustrated graphically. The physical parameters governing the fluid flow profoundly affected the resultant flow profiles except in a few cases. By using the slope linear regression method, the importance of considering the viscosity variation parameter and its interaction with the Lorentz force in determining the velocity behavior of the viscoelastic fluid model is highlighted. The percentage increase in the velocity profile of the viscoelastic model has been calculated for different ranges of viscosity variation parameters. Finally, the results are validated numerically for the skin friction coefficient and Nusselt number profiles.
-
Методологический подход к моделированию и прогнозированию воздействия пространственной неоднородности процессов распространения COVID-19 на экономическое развитие регионов России
Компьютерные исследования и моделирование, 2021, т. 13, № 3, с. 629-648Статья посвящена исследованию социально-экономических последствий от вирусных эпидемий в условиях неоднородности экономического развития территориальных систем. Актуальность исследования обусловлена необходимостью поиска оперативных механизмов государственного управления и стабилизации неблагоприятной эпидемио-логической ситуации с учетом пространственной неоднородности распространения COVID-19, сопровождающейся концентрацией инфекции в крупных мегаполисах и на территориях с высокой экономической активностью.
Целью работы является разработка комплексного подхода к исследованию пространственной неоднородности распространения коронавирусной инфекции с точки зрения экономических последствий пандемии в регионах России. В работе особое внимание уделяется моделированию последствий ухудшающейся эпидемиологической ситуации на динамике экономического развития региональных систем, определению полюсов роста распространения коронавирусной инфекции, пространственных кластеров и зон их влияния с оценкой межтерриториальных взаимосвязей. Особенностью разработанного подхода является пространственная кластеризация региональных систем по уровню заболеваемости COVID-19, проведенная с использованием глобального и локальных индексов пространственной автокорреляции, различных матриц пространственных весов и матрицы взаимовлияния Л.Анселина на основе статистической информации Росстата. В результате проведенного исследования были выявлены пространственный кластер, отличающийся высоким уровнем инфицирования COVID-19 с сильной зоной влияния и устойчивыми межрегиональными взаимосвязями с окружающими регионами, а также сформировавшиеся полюса роста, которые являются потенциальными полюсами дальнейшего распространения коронавирусной инфекции. Проведенный в работе регрессионный анализ с использованием панельных данных позволил сформировать модель для сценарного прогнозирования последствий от распространения коронавирусной инфекции и принятия управленческих решений органами государственной власти.
В работе выявлено, что увеличение числа заболевших коронавирусной инфекцией влияет на сокращение среднесписочной численности работников, снижение средней начисленной заработной платы. Предложенный подход к моделированию последствий COVID-19 может быть расширен за счет использования полученных результатов исследования при проектировании агент-ориентированной моделей, которые позволят оценить средне- и долгосрочные социально-экономические последствия пандемии с точки зрения особенностей поведения различных групп населения. Проведение компьютерных экспериментов позволит воспроизвести социально-демографическая структуру населения и оценить различные ограничительные меры в регионах России и сформировать пространственные приоритеты поддержки населения и бизнеса в условиях пандемии. На основе предлагаемого методологического подхода может быть разработана агент-ориентированная модель в виде программного комплекса, предназначенного для системы поддержки принятия решений оперативным штабам, центрам мониторинга эпидемиологической ситуации, органам государственного управления на федеральном и региональном уровнях.
Ключевые слова: пространственная неоднородность, пространственная автокорреляция, кластеризация, локальный индекс Морана, межрегиональные взаимосвязи, коронавирусная инфекция, пространственно-временное моделирование, панельные данные, региональные системы.
Methodological approach to modeling and forecasting the impact of the spatial heterogeneity of the COVID-19 spread on the economic development of Russian regions
Computer Research and Modeling, 2021, v. 13, no. 3, pp. 629-648The article deals with the development of a methodological approach to forecasting and modeling the socioeconomic consequences of viral epidemics in conditions of heterogeneous economic development of territorial systems. The relevance of the research stems from the need for rapid mechanisms of public management and stabilization of adverse epidemiological situation, taking into account the spatial heterogeneity of the spread of COVID-19, accompanied by a concentration of infection in large metropolitan areas and territories with high economic activity. The aim of the work is to substantiate a methodology to assess the spatial heterogeneity of the spread of coronavirus infection, find poles of its growth, emerging spatial clusters and zones of their influence with the assessment of inter-territorial relationships, as well as simulate the effects of worsening epidemiological situation on the dynamics of economic development of regional systems. The peculiarity of the developed approach is the spatial clustering of regional systems by the level of COVID-19 incidence, conducted using global and local spatial autocorrelation indices, various spatial weight matrices, and L.Anselin mutual influence matrix based on the statistical information of the Russian Federal State Statistics Service. The study revealed a spatial cluster characterized by high levels of infection with COVID-19 with a strong zone of influence and stable interregional relationships with surrounding regions, as well as formed growth poles which are potential poles of further spread of coronavirus infection. Regression analysis using panel data not only confirmed the impact of COVID-19 incidence on the average number of employees in enterprises, the level of average monthly nominal wages, but also allowed to form a model for scenario prediction of the consequences of the spread of coronavirus infection. The results of this study can be used to form mechanisms to contain the coronavirus infection and stabilize socio-economic at macroeconomic and regional level and restore the economy of territorial systems, depending on the depth of the spread of infection and the level of economic damage caused.
-
Моделирование реологических характеристик водных суспензий на основе наноразмерных частиц диоксида кремния
Компьютерные исследования и моделирование, 2024, т. 16, № 5, с. 1217-1252Реологическое поведение водных суспензий на основе наноразмерных частиц диоксида кремния сильно зависит от динамической вязкости, которая непосредственно влияет на применение наножидкостей. Целью данной работы являются разработка и валидация моделей для прогнозирования динамической вязкости от независимых входных параметров: концентрации диоксида кремния SiO2, кислотности рН, а также скорости сдвига $\gamma$. Проведен анализ влияния состава суспензии на ее динамическую вязкость. Выявлены статистически однородные по составу группы суспензий, в рамках которых возможна взаимозаменяемость составов. Показано, что при малых скоростях сдвига реологические свойства суспензий существенно отличаются от свойств, полученных на более высоких скоростях. Установлены значимые положительные корреляции динамической вязкости суспензии с концентрацией SiO2 и кислотностью рН, отрицательные — со скоростью сдвига $\gamma$. Построены регрессионные модели с регуляризацией зависимости динамической вязкости $\eta$ от концентраций SiO2, NaOH, H3PO4, ПАВ (поверхностно-активное вещество), ЭДА (этилендиамин), скорости сдвига $\gamma$. Для более точного прогнозирования динамической вязкости были обучены модели с применением алгоритмов нейросетевых технологий и машинного обучения (многослойного перцептрона MLP, сети радиальной базисной функции RBF, метода опорных векторов SVM, метода случайного леса RF). Эффективность построенных моделей оценивалась с использованием различных статистических метрик, включая среднюю абсолютную ошибку аппроксимации (MAE), среднюю квадратическую ошибку (MSE), коэффициент детерминации $R^2$, средний процент абсолютного относительного отклонения (AARD%). Модель RF показала себя как лучшая модель на обучающей и тестовой выборках. Определен вклад каждой компоненты в построенную модель, показано, что наибольшее влияние на динамическую вязкость оказывает концентрация SiO2, далее кислотность рН и скорость сдвига $\gamma$. Точность предлагаемых моделей сравнивается с точностью ранее опубликованных в литературе моделей. Результаты подтверждают, что разработанные модели можно рассматривать как практический инструмент для изучения поведения наножидкостей, в которых используются водные суспензии на основе наноразмерных частиц диоксида кремния.
Ключевые слова: наножидкость, концентрация SiO$_2$, кислотность рН, динамическая вязкость, регрессия, нейронные сети, машинное обучение.
Modeling of rheological characteristics of aqueous suspensions based on nanoscale silicon dioxide particles
Computer Research and Modeling, 2024, v. 16, no. 5, pp. 1217-1252The rheological behavior of aqueous suspensions based on nanoscale silicon dioxide particles strongly depends on the dynamic viscosity, which affects directly the use of nanofluids. The purpose of this work is to develop and validate models for predicting dynamic viscosity from independent input parameters: silicon dioxide concentration SiO2, pH acidity, and shear rate $\gamma$. The influence of the suspension composition on its dynamic viscosity is analyzed. Groups of suspensions with statistically homogeneous composition have been identified, within which the interchangeability of compositions is possible. It is shown that at low shear rates, the rheological properties of suspensions differ significantly from those obtained at higher speeds. Significant positive correlations of the dynamic viscosity of the suspension with SiO2 concentration and pH acidity were established, and negative correlations with the shear rate $\gamma$. Regression models with regularization of the dependence of the dynamic viscosity $\eta$ on the concentrations of SiO2, NaOH, H3PO4, surfactant (surfactant), EDA (ethylenediamine), shear rate γ were constructed. For more accurate prediction of dynamic viscosity, the models using algorithms of neural network technologies and machine learning (MLP multilayer perceptron, RBF radial basis function network, SVM support vector method, RF random forest method) were trained. The effectiveness of the constructed models was evaluated using various statistical metrics, including the average absolute approximation error (MAE), the average quadratic error (MSE), the coefficient of determination $R^2$, and the average percentage of absolute relative deviation (AARD%). The RF model proved to be the best model in the training and test samples. The contribution of each component to the constructed model is determined. It is shown that the concentration of SiO2 has the greatest influence on the dynamic viscosity, followed by pH acidity and shear rate γ. The accuracy of the proposed models is compared to the accuracy of models previously published. The results confirm that the developed models can be considered as a practical tool for studying the behavior of nanofluids, which use aqueous suspensions based on nanoscale particles of silicon dioxide.
-
Охрана биоресурсов в морском прибрежном пространстве: математическая модель
Компьютерные исследования и моделирование, 2015, т. 7, № 5, с. 1109-1125Охрана водных биоресурсов в морском прибрежном пространстве имеет существенные особенности (большое количество маломерных промысловых судов, динамизм обстановки, использование береговых средств охраны), в силу чего выделяется в отдельный класс прикладных задач. Представлена математическая модель охраны, предназначенная для определения состава средств обнаружения нарушителей и средств реализации обстановки в интересах обеспечения функции сдерживания незаконной деятельности. Решена тактическая теоретико-игровая задача: найден оптимальный рубеж патрулирования (стоянки) средств реализации (катеров охраны) и оптимальное удаление мест промысла нарушителей от берега. С использованием методов теории планирования эксперимента получены линейные регрессионные модели, позволяющие оценить вклад основных факторов, влияющих на результаты моделирования.
В интересах повышения устойчивости и адекватности модели предложено использовать механизм ранжирования средств охраны, основанный на границах и рангах Парето и позволяющий учесть принципы охраны и дополнительные характеристики средств охраны. Для учета изменчивости обстановки предложены несколько сценариев, по которым целесообразно выполнять расчеты.
Ключевые слова: морское прибрежное пространство, водные биоресурсы, математическая модель, оптимизационные задачи, механизм ранжирования, сценарный подход.
Protection of biological resources in the coastal area: the mathematical model
Computer Research and Modeling, 2015, v. 7, no. 5, pp. 1109-1125Просмотров за год: 1. Цитирований: 1 (РИНЦ).Protection of aquatic biological resources in the coastal area has significant features (a large number of small fishing vessels, the dynamism of the situation, the use of coastal protection), by virtue of which stands in a class of applications. A mathematical model of protection designed for the determination of detection equipment and means of violators of the situation in order to ensure the function of deterrence of illegal activities. Resolves a tactical game-theoretic problem - find the optimal line patrol (parking) means of implementation (guard boats) and optimal removal of seats from the shore fishing violators. Using the methods of the theory of experimental design, linear regression models to assess the contribution of the main factors affecting the results of the simulation.
In order to enhance the sustainability and adequacy of the model is proposed to use the mechanism of rankings means of protection, based on the borders and the rank and Pareto allows to take into account the principles of protection and further means of protection. To account for the variability of the situation offered several scenarios in which it is advisable to perform calculations.
-
Оценивание параметров моделей временных рядов с марковскими переключениями режимов
Компьютерные исследования и моделирование, 2018, т. 10, № 6, с. 903-918В работе рассматривается задача оценивания параметров временных рядов, описываемых регрессионными моделями с марковскими переключениями двух режимов в случайные моменты времени и независимыми гауссовскими шумами. Для решения предлагается вариант EM-алгоритма, основанный на итерационной процедуре, в ходе которой происходит чередование оценивания параметров регрессии при заданной последовательности переключений режимов и оценивания последовательности переключений при заданных параметрах моделей регрессии. В отличие от известных методов оценивания параметров регрессий с марковскими переключениями режимов, которые основаны на вычислении апостериорных вероятностей дискретных состояний последовательности переключений, в работе находятся оптимальные по критерию максимума апостериорной вероятности оценки процесса переключений. В результате предлагаемый алгоритм оказывается более простым и требует меньшее количество расчетов. Компьютерное моделирование позволяет выявить факторы, влияющие на точность оценивания. К таким факторам относятся число наблюдений, количество неизвестных параметров регрессии, степень их различия в разных режимах работы, а также величина отношения сигнала к шуму, которую в моделях регрессии можно связать с величиной коэффициента детерминации. Предложенный алгоритм применяется для задачи оценивания параметров в моделях регрессии для доходности индекса РТС в зависимости от доходностей индекса S&P 500 и акций «Газпрома» за период с 2013 года по 2018 год. Проводится сравнение оценок параметров, найденных с помощью предлагаемого алгоритма, с оценками, которые формируются с использованием эконометрического пакета EViews, и с оценками обычного метода наименьших квадратов без учета переключений режимов. Учет переключений позволяет получить более точное представление о структуре статистической зависимости исследуемых переменных. В моделях с переключениями рост отношения сигнала к шуму приводит к тому, что уменьшаются различия в оценках, вырабатываемых предлагаемым алгоритмом и с помощью программы EViews.
Ключевые слова: оценивание параметров, модели регрессии, модели с марковскими переключениями, функция правдоподобия, метод максимума правдоподобия, дисперсия шума, отношение сигнала к шуму.
Estimation of models parameters for time series with Markov switching regimes
Computer Research and Modeling, 2018, v. 10, no. 6, pp. 903-918Просмотров за год: 36.The paper considers the problem of estimating the parameters of time series described by regression models with Markov switching of two regimes at random instants of time with independent Gaussian noise. For the solution, we propose a variant of the EM algorithm based on the iterative procedure, during which an estimation of the regression parameters is performed for a given sequence of regime switching and an evaluation of the switching sequence for the given parameters of the regression models. In contrast to the well-known methods of estimating regression parameters in the models with Markov switching, which are based on the calculation of a posteriori probabilities of discrete states of the switching sequence, in the paper the estimates are calculated of the switching sequence, which are optimal by the criterion of the maximum of a posteriori probability. As a result, the proposed algorithm turns out to be simpler and requires less calculations. Computer modeling allows to reveal the factors influencing accuracy of estimation. Such factors include the number of observations, the number of unknown regression parameters, the degree of their difference in different modes of operation, and the signal-to-noise ratio which is associated with the coefficient of determination in regression models. The proposed algorithm is applied to the problem of estimating parameters in regression models for the rate of daily return of the RTS index, depending on the returns of the S&P 500 index and Gazprom shares for the period from 2013 to 2018. Comparison of the estimates of the parameters found using the proposed algorithm is carried out with the estimates that are formed using the EViews econometric package and with estimates of the ordinary least squares method without taking into account regimes switching. The account of regimes switching allows to receive more exact representation about structure of a statistical dependence of investigated variables. In switching models, the increase in the signal-to-noise ratio leads to the fact that the differences in the estimates produced by the proposed algorithm and using the EViews program are reduced.
-
Случайный лес факторов риска как прогностический инструмент неблагоприятных событий в клинической медицине
Компьютерные исследования и моделирование, 2025, т. 17, № 5, с. 987-1004Целью исследования являются разработка ансамблевого метода машинного обучения, обеспечивающего построение интерпретируемых прогностических моделей, и его апробация на примере прогнозирования внутригоспитальной летальности (ВГЛ) у больных инфарктом миокарда с подъемом сегмента ST (ИМпST).
Проведено ретроспективное когортное исследование по данным 5446 электронных историй болезни пациентов с ИМпST, которым выполнялось чрескожное коронарное вмешательство (ЧКВ). Было выделено две группы лиц, первую изк оторых составили 335 (6,2%) больных, умерших в стационаре, вторую — 5111 (93,8%) — с благоприятным исходом лечения. Пул потенциальных предикторов был сформирован с помощью методов математической статистики. С помощью методов мультиметрической категоризации (минимизация p-value, максимизация площади под ROC-кривой-AUC и результаты анализа shap-value), деревьев решений и многофакторной логистической регрессии (МЛР) предикторы были преобразованы в факторы риска ВГЛ. Для разработки прогностических моделей ВГЛ использовали МЛР, случайный лес факторов риска (СЛФР), стохастический градиентный бустинг (XGboost), случай- ный лес, методы Adaptive boosting, Gradient Boosting, Light Gradient-Boosting Machine, Categorical Boosting (CatBoost), Explainable Boosting Machine и Stacking.
Авторами разработан метод СЛФР, который обобщает результаты прогноза модифицированных деревьев решений, выделяет факторы риска и ранжирует их по интенсивности влияния на вероятность развития неблагоприятного события. СЛФР позволяет разрабатывать модели с высоким прогностическим потенциалом (AUC = 0,908), сопоста- вимым с моделями CatBoost и Stacking (AUC: 0,904 и 0,908 соответственно). Метод СЛФР может рассматриваться в качестве важного инструмента для клинического обоснования результатов прогноза и стать основой для разработки высокоточных интерпретируемых моделей.
Ключевые слова: ансамблевые методы машинного обучения, факторы риска, категоризация непрерывных переменных, аддитивное объяснение Шепли, интерпретируемые модели машинного обучения.
Random forest of risk factors as a predictive tool for adverse events in clinical medicine
Computer Research and Modeling, 2025, v. 17, no. 5, pp. 987-1004The aim of study was to develop an ensemble machine learning method for constructing interpretable predictive models and to validate it using the example of predicting in-hospital mortality (IHM) in patients with ST-segment elevation myocardial infarction (STEMI).
A retrospective cohort study was conducted using data from 5446 electronic medical records of STEMI patients who underwent percutaneous coronary intervention (PCI). Patients were divided into two groups: 335 (6.2%) patients who died during hospitalization and 5111 (93.8%) patients with a favourable in-hospital outcome. A pool of potential predictors was formed using statistical methods. Through multimetric categorization (minimizing p-values, maximizing the area under the ROC curve (AUC), and SHAP value analysis), decision trees, and multivariable logistic regression (MLR), predictors were transformed into risk factors for IHM. Predictive models for IHM were developed using MLR, Random Forest Risk Factors (RandFRF), Stochastic Gradient Boosting (XGboost), Random Forest (RF), Adaptive boosting, Gradient Boosting, Light Gradient-Boosting Machine, Categorical Boosting (CatBoost), Explainable Boosting Machine and Stacking methods.
Authors developed the RandFRF method, which integrates the predictive outcomes of modified decision trees, identifies risk factors and ranks them based on their contribution to the risk of adverse outcomes. RandFRF enables the development of predictive models with high discriminative performance (AUC 0.908), comparable to models based on CatBoost and Stacking (AUC 0.904 and 0.908, respectively). In turn, risk factors provide clinicians with information on the patient’s risk group classification and the extent of their impact on the probability of IHM. The risk factors identified by RandFRF can serve not only as rationale for the prediction results but also as a basis for developing more accurate models.
-
Разработка и исследование алгоритмов машинного обучения для решения задачи классификации в публикациях Twitter
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 185-195Посты в социальных сетях способны как предсказывать движение финансового рынка, так и в некоторых случаях даже определять его направление. Анализ постов в Twitter способствует прогнозированию цен на криптовалюту. Специфика рассматриваемого сообщества заключается в особенной лексике. Так, в постах используются сленговые выражения, аббревиатуры и сокращения, наличие которых затрудняет векторизацию текстовых данных, в следствие чего рассматриваются методы предобработки такие, как лемматизация Stanza и применение регулярных выражений. В этой статье описываются простейшие модели машинного обучения, которые могут работать, несмотря на такие проблемы, как нехватка данных и короткие сроки прогнозирования. Решается задача бинарной текстовой классификации, в условиях которой слово рассматривается как элемент бинарного вектора единицы данных. Базисные слова определяются на основе частотного анализа упоминаний того или иного слова. Разметка составляется на основе свечей Binance с варьируемыми параметрами для более точного описания тренда изменения цены. В работе вводятся метрики, отражающие распределение слов в зависимости от их принадлежности к положительному или отрицательному классам. Для решения задачи классификации использовались dense-модель с подобранными при помощи Keras Tuner параметрами, логистическая регрессия, классификатор случайного леса, наивный байесовский классификатор, способный работать с малочисленной выборкой, что весьма актуально для нашей задачи, и метод k-ближайших соседей. Было проведено сравнение построенных моделей на основе метрики точности предсказанных меток. В ходе исследования было выяснено, что наилучшим подходом является использование моделей, которые предсказывают ценовые движения одной монеты. Наши модели имеют дело с постами, содержащими упоминания проекта LUNA, которого на данный момент уже не существует. Данный подход к решению бинарной классификации текстовых данных широко применяется для предсказания цены актива, тренда ее движения, что часто используется в автоматизированной торговле.
Ключевые слова: криптовалюты, Twitter, машинное обучение, обработка естественного языка, векторизация, dense модель, логистическая регрессия, случайный лес, KNN, наивный байесовский классификатор.
Development of and research on machine learning algorithms for solving the classification problem in Twitter publications
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 185-195Posts on social networks can both predict the movement of the financial market, and in some cases even determine its direction. The analysis of posts on Twitter contributes to the prediction of cryptocurrency prices. The specificity of the community is represented in a special vocabulary. Thus, slang expressions and abbreviations are used in posts, the presence of which makes it difficult to vectorize text data, as a result of which preprocessing methods such as Stanza lemmatization and the use of regular expressions are considered. This paper describes created simplest machine learning models, which may work despite such problems as lack of data and short prediction timeframe. A word is considered as an element of a binary vector of a data unit in the course of the problem of binary classification solving. Basic words are determined according to the frequency analysis of mentions of a word. The markup is based on Binance candlesticks with variable parameters for a more accurate description of the trend of price changes. The paper introduces metrics that reflect the distribution of words depending on their belonging to a positive or negative classes. To solve the classification problem, we used a dense model with parameters selected by Keras Tuner, logistic regression, a random forest classifier, a naive Bayesian classifier capable of working with a small sample, which is very important for our task, and the k-nearest neighbors method. The constructed models were compared based on the accuracy metric of the predicted labels. During the investigation we recognized that the best approach is to use models which predict price movements of a single coin. Our model deals with posts that mention LUNA project, which no longer exist. This approach to solving binary classification of text data is widely used to predict the price of an asset, the trend of its movement, which is often used in automated trading.
-
Модели производственных функций для российской экономики
Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 293-312В статье проведён сравнительный анализ применимости нескольких вариантов моделей производственной функции для анализа современной экономики России. Посредством регрессионного анализа оценено влияние таких факторов, как цены на нефть на мировом рынке, инновационные процессы, гипотеза о постоянной отдаче от факторов производства. Расчёты производились как для экономики в целом, так и для отдельных её отраслей. Показано, что рассматриваемые модели экономики России в целом и ряда её отраслей применительно к реальным данным демонстрируют значимую возрастающую отдачу по труду. Обсуждаются ограничения применимости моделей.
Ключевые слова: производственные функции, функции Кобба–Дугласа, отдача от факторов производства, регрессионный анализ, Россия.
Models of production functions for the Russian economy
Computer Research and Modeling, 2013, v. 5, no. 2, pp. 293-312Просмотров за год: 21. Цитирований: 65 (РИНЦ).A comparative analysis of the applicability of several variants of the production function models for the analysis of modern Russian economy is presented in a paper. Through regression analysis, the effect of such factors as the oil prices on the world market, the innovation, the hypothesis of constant returns to factors of production is estimated. Calculations were made both for the economy as a whole and for separate industries. It is shown that the models of the economy of Russia as a whole and some of its industries in relation to real data have significant increasing returns to labor. Limits of applicability for the models are discussed.
-
Использование пространственных моделей в массовой оценке стоимости объектов недвижимости
Компьютерные исследования и моделирование, 2012, т. 4, № 3, с. 639-650Автором проведен анализ основных на текущий момент подходов к массовой оценке стоимости объектов недвижимости (российских и зарубежных), указаны их плюсы и минусы, а также представлен подход, основанный на применении пространственных регрессионных моделей, показывающий лучшие результаты по сравнению с обычными регрессионными моделями и применимый для российского рынка недвижимости.
Ключевые слова: массовая оценка, пространственные регрессионные модели.
Spatial models in mass appraisal of real estate
Computer Research and Modeling, 2012, v. 4, no. 3, pp. 639-650The author has analyzed main approaches to the mass appraisal of real property (Russian and foreign), pros and cons are pointed out. An approach based on spatial regression models which shows results better than conventional regression models and applicable to Russian real estate market is presented in the article.
Keywords: mass appraisal, spatial models.Просмотров за год: 3. Цитирований: 3 (РИНЦ).
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"





