Текущий выпуск Номер 3, 2026 Том 18

Все выпуски

2026 Том 18
- Номер 3 (специальный выпуск)
- Номер 2
- Номер 1
2025 Том 17
2024 Том 16
- Номер 7 (специальный выпуск)
- Номер 6
- Номер 5
- Номер 4
- Номер 3
- Номер 2
- Номер 1 (специальный выпуск)
2023 Том 15
- Номер 6
- Номер 5
- Номер 4 (специальный выпуск)
- Номер 3
- Номер 2 (специальный выпуск)
- Номер 1
2022 Том 14
- Номер 6
- Номер 5
- Номер 4 (специальный выпуск)
- Номер 3
- Номер 2 (специальный выпуск)
- Номер 1
2021 Том 13
- Номер 6
- Номер 5
- Номер 4
- Номер 3
- Номер 2 (специальный выпуск)
- Номер 1
2020 Том 12
2019 Том 11
2018 Том 10
- Номер 6
- Номер 5 (специальный выпуск)
- Номер 4
- Номер 3 (специальный выпуск)
- Номер 2
- Номер 1
2017 Том 9
2016 Том 8
2015 Том 7
- Номер 6
- Номер 5
- Номер 4
- Номер 3 (специальный выпуск)
- Номер 2
- Номер 1
2014 Том 6
- Номер 6 (специальный выпуск)
- Номер 5
- Номер 4
- Номер 3
- Номер 2
- Номер 1
2013 Том 5
- Номер 6 (специальный выпуск)
- Номер 5
- Номер 4
- Номер 3
- Номер 2
- Номер 1
2012 Том 4
2011 Том 3
2010 Том 2
2009 Том 1

Результаты поиска по 'classification':

Найдено статей: 58

Левич А.П., Булгаков Н.Г., Рисник Д.В., Бикбулатов Э.С., Бикбулатова Е.М., Гончаров И.А., Ершов Ю.В., Конюхов И.В., Корнева Л.Г., Лазарева В.И., Литвинов А.С., Максимов В.Н., Мамихин С.В., Осипов В.А., Отюкова Н.Г., Поддубный С.А., Пырина И.Л., Соколова Е.А., Степанова И.Э., Фурсова П.В., Цельмович О.Л.
Поиск связей между биологическими и физикохимическими характеристиками экосистемы Рыбинского водохранилища. Часть 3. Расчет границ классов качества
Компьютерные исследования и моделирование, 2013, т. 5, № 3, с. 451-471

Апробирован метод расчета границ классов качества вод для целей экологической диагностики и нормирования по данным Рыбинского водохранилища. В целях биоиндикации использованы показатели интенсивности флуоресценции фитопланктона и показатели содержания пигментов фитопланктона. Коэффициент существенности Чеснокова оказался наиболее предпочтительной мерой связи для анализа влияния факторов среды на индикаторы. Выявлены существенные для экологического состояния факторы окружающей среды. Проведено сравнение полученных границ классов качества, разделяющих «допустимые» и «недопустимые» значения факторов с границами из других классификаторов качества вод.

Ключевые слова: биоиндикация, экологическая диагностика, экологическое нормирование, флуоресценция, фитопланктон, пигменты, хлорофилл, границы классов качества, Рыбинское водохранилище.

Levich A.P., Bulgakov N.G., Risnik D.V., Bikbulatov E.S., Bikbulatova E.M., Goncharov I.A., Ershov Y.V., Konuhov I.V., Korneva L.G., Lazareva V.I., Litvinov A.S., Maksimov V.N., Mamihin S.V., Osipov V.A., Otyukova N.G., Poddubnii S.A., Pirina I.L., Sokolova E.A., Stepanova I.E., Fursova P.V., Celmovich O.L.
Searching for connections between biological and physico-chemical characteristics of Rybinsk reservoir ecosystem. Part 3. Calculation of the boundaries of water quality classes
Computer Research and Modeling, 2013, v. 5, no. 3, pp. 451-471

Approbation of calculation of borders of water quality classes for the purpose of ecological diagnosis and standardization by data of the Rybinsk reservoir is carried out. For bioindication indicators of phytoplankton fluorescence and the contents of pigments of phytoplankton are used. Chesnokov's importance coefficient proved to be the most preferred measure of connection for analyzing the effects of environmental factors on indicators. The factors important for environmental condition are identified. Comparison of borders between quality classes “valid” and “invalid” of factors values and boundaries of the classifications of water quality.

Keywords: bioindication, ecological diagnosis, ecological standardization, fluorescence, phytoplankton, pigments, chlorophyll, borders of factors' norms, Rybinsk reservoir.
Просмотров за год: 4. Цитирований: 4 (РИНЦ).
Шамиев М.О., Трофимов А.Г.
Изучение пространственно-временных предвестников неустойчивости плотин с использованием модели CNN–BiGRU
Компьютерные исследования и моделирование, 2026, т. 18, № 2, с. 377-397

Оценка безопасности плотин все в большей степени опирается на непрерывный мониторинг гидрометеорологических параметров; однако выявление ранних стадий неустойчивости остается сложной задачей вследствие сложных пространственно-временных взаимодействий и сильного дисбаланса наблюдений аварийных состояний. В настоящей работе предлагается фреймворк глубокого обучения на основе архитектуры сверточной двунаправленной рекуррентной нейронной сети с управляемыми вентилями (CNN–BiGRU) для выявления пространственно-временных предвестников неустойчивости плотин по многомерным гидрометеорологическим временным рядам. Сверточный компонент модели извлекает локальные временные паттерны, связанные с краткосрочными флуктуациями, тогда как двунаправленная рекуррентная структура позволяет моделировать долгосрочные зависимости и эволюцию динамики, предшествующие критическим состояниям.

Предложенная модель была протестирована на реальном наборе данных мониторинга плотины, включающем измерения уровня воды, метеорологические параметры и производные динамические индикаторы. Для учета дисбаланса классов применяется стоимостно-ориентированная стратегия обучения с использованием весов классов без применения синтетического увеличения выборки. Экспериментальные результаты демонстрируют высокие показатели качества классификации: точность (accuracy) — 0,961, прецизионность — 0,901, полнота — 0,757 и F1-мера — 0,823. Дополнительно модель достигает значений ROC AUC = 0,907 и PR AUC = 0,819, что свидетельствует о высокой способности к разделению классов в условиях сильного дисбаланса данных.

Анализ значимости признаков показывает, что краткосрочная и среднесрочная изменчивость уровня воды, включая скользящее стандартное отклонение, волатильность и многоуровневые градиенты, играет ключевую роль в формировании предаварийного поведения системы, обеспечивая физически интерпретируемое понимание динамики отклика плотины. Полученные результаты подтверждают, что фреймворк CNN–BiGRU эффективно выявляет значимые пространственно-временные предвестники неустойчивости и может служить надежным инструментом поддержки принятия решений в задачах мониторинга безопасности плотин в реальных эксплуатационных условиях.

Ключевые слова: безопасность плотин, системы раннего предупреждения, гидрометеорологические временные ряды, глубокое обучение, CNN–BiGRU, классификация несбалансированных данных, пространственно-временное моделирование, динамика уровня воды, прогнозирование риска аварий.

Shamiev M.O., Trofimov A.G.
Learning spatio-temporal precursors of dam instability using a CNN–BiGRU framework
Computer Research and Modeling, 2026, v. 18, no. 2, pp. 377-397

Dam safety assessment increasingly relies on continuous monitoring of hydrometeorological variables; however, identifying early-stage instability remains challenging due to complex spatio-temporal interactions and highly imbalanced failure observations. This study proposes a deep learning framework based on a Convolutional Bidirectional Gated Recurrent Unit (CNN–BiGRU) architecture to learn spatio-temporal precursors of dam instability from multivariate hydrometeorological time series. The convolutional component extracts localized temporal patterns associated with short-term fluctuations, while the bidirectional recurrent structure captures long-range dependencies and evolving dynamics preceding critical states.

The proposed model is evaluated on a real-world dam monitoring dataset comprising multiple water-level, meteorological, and derived dynamic indicators. To address class imbalance, a cost-sensitive training strategy using class weighting is adopted without synthetic oversampling. Experimental results demonstrate strong predictive performance, achieving an accuracy of 0.961, precision of 0.901, recall of 0.757, and an F1-score of 0.823. The model further attains a ROC-AUC of 0.907 and a PR-AUC of 0.819, indicating robust discrimination capability under imbalanced conditions.

Feature importance analysis reveals that short- and medium-term water level variability, including rolling standard deviation, volatility, and multi-scale gradients, play a dominant role in characterizing pre-instability behavior, providing physically interpretable insights into dam response dynamics. The findings suggest that the CNN–BiGRU framework effectively captures meaningful spatio-temporal precursors and offers a reliable data-driven tool for supporting dam safety monitoring and decision-making under real operational conditions.

Keywords: dam safety monitoring, early warning systems, hydrometeorological time series, deep learning, CNN–BiGRU, imbalanced classification, spatio-temporal modeling, water level dynamics, failure risk prediction.
Миньков Л.Л., Пикущак Е.В., Дик И.Г.
Исследование влияния инжектирования воды на сепарационные характеристики гидроциклона
Компьютерные исследования и моделирование, 2012, т. 4, № 4, с. 803-810

В данной работе на основе численного моделирования исследуются особенности закрученного турбулентного течения монодисперсной суспензии в гидроциклоне с инжектором. Для описания турбулентного поля течения суспензии используется модель рейнольдсовых напряжений и модель смеси для описания параметров частиц в двумерном осесимметричном приближении. Особое внимание уделяется выяснению механизмов воздействия вида инжекции на перестройку гидродинамических полей и в конечном итоге на механизмы классификации. Показано, что тангенциальный способ инжекции сильнее влияет на сепарационную кривую по сравнению с радиальным способом.

Ключевые слова: гидроциклон, инжекция, монодисперсная суспензия, вычислительная гидродинамика.

Minkov L.L., Pikushchak E.V., Dueck J.G.
Investigation of water injection influence on hydrocyclone separation performance
Computer Research and Modeling, 2012, v. 4, no. 4, pp. 803-810

In this paper particularities of the swirling turbulent flow of monodisperse suspension in the hydrocyclone with injector are investigated on the base of the numerical simulation. The 2D axisymmetric approximation of Reynolds Stresses Model and model of mixture is used to describe the swirling turbulent flow field of suspension and particles parameters in the hydrocyclone. Special attention is paid to the clarification of mechanisms of injection influence on the reorganization of hydrodynamic field and finally on classification mechanisms. It is shown that tangential injection method stronger effects separation curve compared to the radial one.

Keywords: hydrocyclone, injection, monodisperse suspension, computational fluid dynamics.
Сабиров А.И., Катасёв А.С., Дагаева М.В.
Нейросетевая модель распознавания знаков дорожного движения в интеллектуальных транспортных системах
Компьютерные исследования и моделирование, 2021, т. 13, № 2, с. 429-435

В данной статье проводится анализ проблемы распознавания знаков дорожного движения в интеллектуальных транспортных системах. Рассмотрены основные понятия компьютерного зрения и задачи распознавания образов. Самым эффективным и популярным подходом к решению задач анализа и распознавания изображений на данный момент является нейросетевой, а среди возможных нейронных сетей лучше всего показала себя искусственная нейронная сеть сверточной архитектуры. Для решения задачи классификации при распознавании дорожных знаков использованы такие функции активации, как Relu и SoftMax. В работе предложена технология распознавания дорожных знаков. Выбор подхода для решения поставленной задачи на основе сверточной нейронной сети обусловлен возможностью эффективно решать задачу выделения существенных признаков и классификации изображений. Проведена подготовка исходных данных для нейросетевой модели, сформирована обучающая выборка. В качестве платформы для разработки интеллектуальной нейросетевой модели распознавания использован облачный сервис Google Colaboratory с подключенными библиотеками для глубокого обучения TensorFlow и Keras. Разработана и протестирована интеллектуальная модель распознавания знаков дорожного движения. Использованная сверточная нейронная сеть включала четыре каскада свертки и подвыборки. После сверточной части идет полносвязная часть сети, которая отвечает за классификацию. Для этого используются два полносвязных слоя. Первый слой включает 512 нейронов с функцией активации Relu. Затем идет слой Dropout, который используется для уменьшения эффекта переобучения сети. Выходной полносвязный слой включает четыре нейрона, что соответствует решаемой задаче распознавания четырех видов знаков дорожного движения. Оценка эффективности нейросетевой модели распознавания дорожных знаков методом трехблочной кроссалидации показала, что ее ошибка минимальна, следовательно, в большинстве случаев новые образы будут распознаваться корректно. Кроме того, у модели отсутствуют ошибки первого рода, а ошибка второго рода имеет низкое значение и лишь при сильно зашумленном изображении на входе.

Ключевые слова: сверточная нейронная сеть, анализ данных, распознавание дорожных знаков, интеллектуальные транспортные системы.

Sabirov A.I., Katasev A.S., Dagaeva M.V.
A neural network model for traffic signs recognition in intelligent transport systems
Computer Research and Modeling, 2021, v. 13, no. 2, pp. 429-435

This work analyzes the problem of traffic signs recognition in intelligent transport systems. The basic concepts of computer vision and image recognition tasks are considered. The most effective approach for solving the problem of analyzing and recognizing images now is the neural network method. Among all kinds of neural networks, the convolutional neural network has proven itself best. Activation functions such as Relu and SoftMax are used to solve the classification problem when recognizing traffic signs. This article proposes a technology for recognizing traffic signs. The choice of an approach for solving the problem based on a convolutional neural network due to the ability to effectively solve the problem of identifying essential features and classification. The initial data for the neural network model were prepared and a training sample was formed. The Google Colaboratory cloud service with the external libraries for deep learning TensorFlow and Keras was used as a platform for the intelligent system development. The convolutional part of the network is designed to highlight characteristic features in the image. The first layer includes 512 neurons with the Relu activation function. Then there is the Dropout layer, which is used to reduce the effect of overfitting the network. The output fully connected layer includes four neurons, which corresponds to the problem of recognizing four types of traffic signs. An intelligent traffic sign recognition system has been developed and tested. The used convolutional neural network included four stages of convolution and subsampling. Evaluation of the efficiency of the traffic sign recognition system using the three-block cross-validation method showed that the error of the neural network model is minimal, therefore, in most cases, new images will be recognized correctly. In addition, the model has no errors of the first kind, and the error of the second kind has a low value and only when the input image is very noisy.

Keywords: convolutional neural network, data analysis, road sign recognition, intelligent transportation systems.
Калитин К.Ю., Невзоров А.А., Спасов А.А., Муха О.Ю.
Распознавание эффектов и механизма действия препаратов на основе анализа внутричерепной ЭЭГ с помощью методов глубокого обучения
Компьютерные исследования и моделирование, 2024, т. 16, № 3, с. 755-772

Прогнозирование новых свойств лекарственных средств является основной задачей в рамках решения проблем полифармакологии, репозиционирования, а также изучения биологически активных веществ на доклиническом этапе. Идентификация фармакологических эффектов и взаимодействий «препарат – мишень» с использованием машинного обучения (включая методы глубокого обучения) набирает популярность в последние годы.

Цель работы состояла в разработке метода распознавания психотропных эффектов и механизма действия (взаимодействий препарата с мишенью) на основании анализа биоэлектрической активности мозга с применением технологий искусственного интеллекта.

Выполнялась регистрация электроэнцефалографических (ЭЭГ) сигналов крыс (4 канала, частота дискретизации — 500 Гц) после введения психотропных препаратов (габапентин, диазепам, карбамазепин, прегабалин, эсликарбазепин, феназепам, ареколин, коразол, пикротоксин, пилокарпин, хлоралгидрат). Сигналы (эпохи продолжительностью 2 с) преобразовывались в изображения $(2000 \times 4)$ и затем поступали на вход автоэнкодера. Выходные данные слоя «бутылочного горлышка» классифицировались и кластеризовались (с применением алгоритма t-SNE), а затем вычислялись расстояния между кластерами в пространстве параметров. В качестве альтернативны использовался подход, основанный на извлечении признаков с размерной редукцией при помощи метода главных компонент и классификацией методом опорных векторов с ядерной функцией (kSVM). Модели валидировались путем 5-кратной кроссвалидации.

Точность классификации для 11 препаратов, полученная в ходе кросс-валидации, достигала $0,580 \pm 0,021$, что значительно превышает точность случайного классификатора, которая составляла $0,091 \pm 0,045$ $(p < 0,0001)$, и точность kSVM, равную $0,441 \pm 0,035$ $(p < 0,05)$. Получены t-SNE-карты параметров «бутылочного горлышка» сигналов интракраниальной ЭЭГ. Определена относительная близость кластеров сигналов в параметрическом пространстве.

В настоящем исследовании представлен оригинальный метод биопотенциал-опосредованного прогнозирования эффектов и механизма действия (взаимодействия лекарственного средства с мишенью). Метод использует сверточные нейронные сети в сочетании с модифицированным алгоритмом избирательной редукции параметров. ЭЭГ-сигналы, зарегистрированные после введения препаратов, были представлены в едином пространстве параметров в сжатой форме. Полученные данные указывают на возможность распознавания паттернов нейронального отклика в ответ на введение различных психотропных препаратов с помощью предложенного нейросетевого классификатора и кластеризации.

Ключевые слова: глубокое обучение, машинное обучение, ЭЭГ, сверточная нейронная сеть, классификация, кластеризация, прогнозирование взаимодействия препарата с мишенью.

Kalitin K.Y., Nevzorov A.A., Spasov A.A., Mukha O.Y.
Deep learning analysis of intracranial EEG for recognizing drug effects and mechanisms of action
Computer Research and Modeling, 2024, v. 16, no. 3, pp. 755-772

Predicting novel drug properties is fundamental to polypharmacology, repositioning, and the study of biologically active substances during the preclinical phase. The use of machine learning, including deep learning methods, for the identification of drug – target interactions has gained increasing popularity in recent years.

The objective of this study was to develop a method for recognizing psychotropic effects and drug mechanisms of action (drug – target interactions) based on an analysis of the bioelectrical activity of the brain using artificial intelligence technologies.

Intracranial electroencephalographic (EEG) signals from rats were recorded (4 channels at a sampling frequency of 500 Hz) after the administration of psychotropic drugs (gabapentin, diazepam, carbamazepine, pregabalin, eslicarbazepine, phenazepam, arecoline, pentylenetetrazole, picrotoxin, pilocarpine, chloral hydrate). The signals were divided into 2-second epochs, then converted into $2000\times 4$ images and input into an autoencoder. The output of the bottleneck layer was subjected to classification and clustering using t-SNE, and then the distances between resulting clusters were calculated. As an alternative, an approach based on feature extraction with dimensionality reduction using principal component analysis and kernel support vector machine (kSVM) classification was used. Models were validated using 5-fold cross-validation.

The classification accuracy obtained for 11 drugs during cross-validation was $0.580 \pm 0.021$, which is significantly higher than the accuracy of the random classifier $(0.091 \pm 0.045, p < 0.0001)$ and the kSVM $(0.441 \pm 0.035, p < 0.05)$. t-SNE maps were generated from the bottleneck parameters of intracranial EEG signals. The relative proximity of the signal clusters in the parametric space was assessed.

The present study introduces an original method for biopotential-mediated prediction of effects and mechanism of action (drug – target interaction). This method employs convolutional neural networks in conjunction with a modified selective parameter reduction algorithm. Post-treatment EEGs were compressed into a unified parameter space. Using a neural network classifier and clustering, we were able to recognize the patterns of neuronal response to the administration of various psychotropic drugs.

Keywords: deep learning, machine learning, EEG, convolutional neural network, classification, clustering, drug – target interaction prediction.
Степанян И.В.
Биоматематическая система методов описания нуклеиновых кислот
Компьютерные исследования и моделирование, 2020, т. 12, № 2, с. 417-434

Статья посвящена применению методов математического анализа, поиска паттернов и изучения состава нуклеотидов в последовательностях ДНК на геномном уровне. Изложены новые методы математической биологии, которые позволили обнаружить и отобразить скрытую упорядоченность генетических нуклеотидных последовательностей, находящихся в клетках живых организмов. Исследования основаны на работах по алгебраической биологии доктора физико-математических наук С. В. Петухова, которым впервые были введены и обоснованы новые алгебры и гиперкомплексные числовые системы, описывающие генетические явления. В данной работе описана новая фаза развития матричных методов в генетике для исследования свойств нуклеотидных последовательностей (и их физико-химических параметров), построенная на принципах конечной геометрии. Целью исследования является демонстрация возможностей новых алгоритмов и обсуждение обнаруженных свойств генетических молекул ДНК и РНК. Исследование включает три этапа: параметризация, масштабирование и визуализация. Параметризация — определение учитываемых параметров, которые основаны на структурных и физико-химических свойствах нуклеотидов как элементарных составных частей генома. Масштабирование играет роль «фокусировки» и позволяет исследовать генетические структуры в различных масштабах. Визуализация включает выбор осей координатной системы и способа визуального отображения. Представленные в работе алгоритмы выдвигаются на роль расширенного инструментария для развития научно-исследовательского программного обеспечения анализа длинных нуклеотидных последовательностей с возможностью отображения геномов в параметрических пространствах различной размерности. Одним из значимых результатов исследования является то, что были получены новые биологически интерпретируемые критерии классификации геномов различных живых организмов для выявления межвидовых взаимосвязей. Новая концепция позволяет визуально и численно оценить вариативность физико-химических параметров нуклеотидных последовательностей. Эта концепция также позволяет обосновать связь параметров молекул ДНК и РНК с фрактальными геометрическими мозаиками, обнаруживает упорядоченность и симметрии полинуклеотидов и их помехоустойчивость. Полученные результаты стали обоснованием для введения новых научных терминов: «генометрия» как методология вычислительных стратегий и «генометрика» как конкретные параметры того или иного генома или нуклеотидной последовательности. В связи с результатами исследования затронуты вопросы биосемиотики и уровни иерархичности организации живой материи.

Ключевые слова: генетические алгоритмы, вариативность, многомерный анализ данных, физико-химические параметры нуклеиновых кислот, конечная геометрия.

Stepanyan I.V.
Biomathematical system of the nucleic acids description
Computer Research and Modeling, 2020, v. 12, no. 2, pp. 417-434

The article is devoted to the application of various methods of mathematical analysis, search for patterns and studying the composition of nucleotides in DNA sequences at the genomic level. New methods of mathematical biology that made it possible to detect and visualize the hidden ordering of genetic nucleotide sequences located in the chromosomes of cells of living organisms described. The research was based on the work on algebraic biology of the doctor of physical and mathematical sciences S. V. Petukhov, who first introduced and justified new algebras and hypercomplex numerical systems describing genetic phenomena. This paper describes a new phase in the development of matrix methods in genetics for studying the properties of nucleotide sequences (and their physicochemical parameters), built on the principles of finite geometry. The aim of the study is to demonstrate the capabilities of new algorithms and discuss the discovered properties of genetic DNA and RNA molecules. The study includes three stages: parameterization, scaling, and visualization. Parametrization is the determination of the parameters taken into account, which are based on the structural and physicochemical properties of nucleotides as elementary components of the genome. Scaling plays the role of “focusing” and allows you to explore genetic structures at various scales. Visualization includes the selection of the axes of the coordinate system and the method of visual display. The algorithms presented in this work are put forward as a new toolkit for the development of research software for the analysis of long nucleotide sequences with the ability to display genomes in parametric spaces of various dimensions. One of the significant results of the study is that new criteria were obtained for the classification of the genomes of various living organisms to identify interspecific relationships. The new concept allows visually and numerically assessing the variability of the physicochemical parameters of nucleotide sequences. This concept also allows one to substantiate the relationship between the parameters of DNA and RNA molecules with fractal geometric mosaics, reveals the ordering and symmetry of polynucleotides, as well as their noise immunity. The results obtained justified the introduction of new terms: “genometry” as a methodology of computational strategies and “genometrica” as specific parameters of a particular genome or nucleotide sequence. In connection with the results obtained, biosemiotics and hierarchical levels of organization of living matter are raised.

Keywords: genetic algorithms, variability, multivariate data analysis, chemical parameters of nucleic acids, finite geometry.
Макаров И.С., Баганцова Е.Р., Яшин П.А., Ковалёва М.Д., Захарова Е.М.
Разработка и исследование жесткого алгоритма анализа публикаций в Twitter и их влияния на движение рынка криптовалют
Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 157-170

Посты в социальных сетях являются важным индикатором, отображающим положение активов на финансовом рынке. В статье описывается жесткое решение задачи классификации для определения влияния активности в социальных сетях на движение финансового рынка. Отбираются аккаунты авторитетных в сообществе крипто-трейдеров-инфлюенсеров. В качестве данных используются специальные пакеты сообщений, которые состоят из текстовых постов, взятых из Twitter. Приведены способы предобработки текста, заключающиеся в лемматизации Stanza и применении регулярных выражений, для очищения зашумленных текстов, особенностью которых является многочисленное употребление сленговых слов и сокращений. Решается задача бинарной классификации, где слово рассматривается как элемент вектора единицы данных. Для более точного описания криптовалютной активности ищутся наилучшие параметры разметки для обработки свечей Binance. Методы выявления признаков, необходимых для точного описания текстовых данных и последующего процесса установления зависимости, представлены в виде машинного обучения и статистического анализа. В качестве первого используется отбор признаков на основе критерия информативности, который применяется при разбиении решающего дерева на поддеревья. Такой подход реализован в модели случайного леса и актуален для задачи выбора значимых для «стрижки деревьев» признаков. Второй же основан на жестком составлении бинарного вектора в ходе грубой проверки наличия либо отсутствия слова в пакете и подсчете суммы элементов этого вектора. Затем принимается решение в зависимости от преодоления этой суммой порогового значения, базирующегося на уровне, предварительно подобранном с помощью анализа частотного распределения упоминаний слова. Алгоритм, используемый для решения проблемы, был назван бенчмарком и проанализирован в качестве инструмента. Подобные алгоритмы часто используются в автоматизированных торговых стратегиях. В процессе исследования также описаны наблюдения влияния часто встречающихся в тексте слов, которые используются в качестве базиса размерностью 2 и 3 при векторизации.

Ключевые слова: анализ текста, обработка естественного языка, активность в Twitter, ча- стотный анализ, отбор признаков, задача классификации, финансовые рынки, бенчмарк, случайный лес, решающие деревья.

Makarov I.S., Bagantsova E.R., Iashin P.A., Kovaleva M.D., Zakharova E.M.
Development of and research into a rigid algorithm for analyzing Twitter publications and its influence on the movements of the cryptocurrency market
Computer Research and Modeling, 2023, v. 15, no. 1, pp. 157-170

Social media is a crucial indicator of the position of assets in the financial market. The paper describes the rigid solution for the classification problem to determine the influence of social media activity on financial market movements. Reputable crypto traders influencers are selected. Twitter posts packages are used as data. The methods of text, which are characterized by the numerous use of slang words and abbreviations, and preprocessing consist in lemmatization of Stanza and the use of regular expressions. A word is considered as an element of a vector of a data unit in the course of solving the problem of binary classification. The best markup parameters for processing Binance candles are searched for. Methods of feature selection, which is necessary for a precise description of text data and the subsequent process of establishing dependence, are represented by machine learning and statistical analysis. First, the feature selection is used based on the information criterion. This approach is implemented in a random forest model and is relevant for the task of feature selection for splitting nodes in a decision tree. The second one is based on the rigid compilation of a binary vector during a rough check of the presence or absence of a word in the package and counting the sum of the elements of this vector. Then a decision is made depending on the superiority of this sum over the threshold value that is predetermined previously by analyzing the frequency distribution of mentions of the word. The algorithm used to solve the problem was named benchmark and analyzed as a tool. Similar algorithms are often used in automated trading strategies. In the course of the study, observations of the influence of frequently occurring words, which are used as a basis of dimension 2 and 3 in vectorization, are described as well.

Keywords: text analysis, natural language processing, Twitter activity, frequency analysis, feature selection, classification problem, financial markets, decision tree, random forest, benchmark.
Бернадотт А.К., Мазурин А.Д.
Оптимизация словаря команд на основе статистического критерия близости в задаче распознавания невербальной речи
Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 675-690

В исследовании мы сосредоточились на задаче классификации невербальной речи для разработки интерфейса «мозг–компьютер» (ИМК) на основе электроэнцефалографии (ЭЭГ), который будет способен помочь людям с ограниченными возможностями и расширить возможности человека в повседневной жизни. Ранее наши исследования показали, что беззвучная речь для некоторых слов приводит к почти идентичным распределениям ЭЭГ-данных. Это явление негативно влияет на точность классификации нейросетевой модели. В этой статье предлагается метод обработки данных, который различает статисти- чески удаленные и неразделимые классы данных. Применение предложенного подхода позволяет достичь цели максимального увеличения смысловой нагрузки словаря, используемого в ИМК.

Кроме того, мы предлагаем статистический прогностический критерий точности бинарной классификации слов в словаре. Такой критерий направлен на оценку нижней и верхней границ поведения классификаторов только путем измерения количественных статистических свойств данных (в частности, с использованием метода Колмогорова – Смирнова). Показано, что более высокие уровни точности классификации могут быть достигнуты за счет применения предложенного прогностического критерия, позволяющего сформировать оптимизированный словарь с точки зрения семантической нагрузки для ИМК на основе ЭЭГ. Кроме того, использование такого обучающего набора данных для задач классификации по словарю обеспечивает статистическую удаленность классов за счет учета семантических и фонетических свойств соответствующих слов и улучшает поведение классификации моделей распознавания беззвучной речи.

Ключевые слова: интерфейс «мозг–компьютер», ЭЭГ, классификация невербальной речи, графовый алгоритм выбора словаря, ИМК, оптимизация глубокого обучения, распознавание невербальной речи, статистический критерий близости.

Bernadotte A., Mazurin A.D.
Optimization of the brain command dictionary based on the statistical proximity criterion in silent speech recognition task
Computer Research and Modeling, 2023, v. 15, no. 3, pp. 675-690

In our research, we focus on the problem of classification for silent speech recognition to develop a brain– computer interface (BCI) based on electroencephalographic (EEG) data, which will be capable of assisting people with mental and physical disabilities and expanding human capabilities in everyday life. Our previous research has shown that the silent pronouncing of some words results in almost identical distributions of electroencephalographic signal data. Such a phenomenon has a suppressive impact on the quality of neural network model behavior. This paper proposes a data processing technique that distinguishes between statistically remote and inseparable classes in the dataset. Applying the proposed approach helps us reach the goal of maximizing the semantic load of the dictionary used in BCI.

Furthermore, we propose the existence of a statistical predictive criterion for the accuracy of binary classification of the words in a dictionary. Such a criterion aims to estimate the lower and the upper bounds of classifiers’ behavior only by measuring quantitative statistical properties of the data (in particular, using the Kolmogorov – Smirnov method). We show that higher levels of classification accuracy can be achieved by means of applying the proposed predictive criterion, making it possible to form an optimized dictionary in terms of semantic load for the EEG-based BCIs. Furthermore, using such a dictionary as a training dataset for classification problems grants the statistical remoteness of the classes by taking into account the semantic and phonetic properties of the corresponding words and improves the classification behavior of silent speech recognition models.

Keywords: brain–computer interface, EEG, silent speech classification, graph dictionary selection algorithm, BCI, deep learning optimization, silent speech recognition, statistical proximity criterion.
Темлякова Е.А., Сорокин А.А.
Определение промоторных и непромоторных последовательностей E.coli по профилям их электростатического потенциала
Компьютерные исследования и моделирование, 2015, т. 7, № 2, с. 347-359

В рамках данной работыбы ла продемонстрирована возможность использования характеристик профилей электростатического потенциала вдоль последовательностей ДНК для определения их функционального класса. Построенымо дели, позволяющие разделять промоторные и непромоторные последовательности (случайные бернуллиевские, кодирующие и псевдопромоторы) с точностью порядка 83–85%. Определены наиболее значимые участки для такого разделения, по-видимому играющие важную роль при ДНК-полимеразном узнавании.

Ключевые слова: электростатические свойства ДНК, поиск промоторов, PLS–DA, VIP-анализ.

Temlyakova E.A., Sorokin A.A.
Detection of promoter and non-promoter E.coli sequences by analysis of their electrostatic profiles
Computer Research and Modeling, 2015, v. 7, no. 2, pp. 347-359

The article is devoted to the idea of using physical properties of DNA instead of sequence along for the aspect of accurate search and annotation of various prokaryotic genomic regions. Particulary, the possibility to use electrostatic potential distribution around DNA sequence as a classifier for identification of a few functional DNA regions was demonstrated. A number of classification models was built providing discrimination of promoters and non-promoter regions (random sequences, coding regions and promoter-like sequences) with accuracy value about 83–85%. The most valueable regions for the discrimination were determined and expected to play a certain role in the process of DNA-recognition by RNA-polymerase.

Keywords: electrostatics of DNA, promoter location, PLS–DA, VIP-analysis.
Просмотров за год: 3.
Козырь П.С., Савельев А.И.
Анализ эффективности методов машинного обучения в задаче распознавания жестов на основе данных электромиографических сигналов
Компьютерные исследования и моделирование, 2021, т. 13, № 1, с. 175-194

При разработке систем человеко-машинных интерфейсов актуальной является задача распознавания жестов. Для выявления наиболее эффективного метода распознавания жестов был проведен анализ различных методов машинного обучения, используемых для классификации движений на основе электромиографических сигналов мышц. Были рассмотрены такие методы, как наивный байесовский классификатор (НБК), дерево решений, случайный лес, градиентный бустинг, метод опорных векторов, метод $k$-ближайших соседей, а также ансамбли методов (НБК и дерево решений, НБК и градиентный бустинг, градиентный бустинг и дерево решений). В качестве метода получения информации о жестах была выбрана электромиография. Такое решение не требует расположения руки в поле зрения камеры и может быть использовано для распознавания движений пальцев рук. Для проверки эффективности выбранных методов распознавания жестов было разработано устройство регистрации электромиографического сигнала мышц предплечья, которое включает в себя три электрода и ЭМГ-датчик, соединенный с микрокон- троллером и блоком питания. В качестве жестов были выбраны: сжатие кулака, знак «большой палец», знак «Виктория», сжатие указательного пальца и взмах рукой справа налево. Оценка эффективности методов классификации проводилась на основе значений доли правильных ответов, точности, полноты, а также среднего значения времени работы классификатора. Данные параметры были рассчитаны для трех вариантов расположения электромиографических электродов на предплечье. По результатам тести- рования, наиболее эффективными методами являются метод $k$-ближайших соседей, случайный лес и ансамбль НБК и градиентного бустинга, средняя точность которого для трех положений электродов составила 81,55 %. Также было определено положение электродов, при котором методы машинного обучения достигают максимального значения точности распознавания. При таком положении один из дифференциальных электродов располагается на месте пересечения глубокого сгибателя пальцев и длинного сгибателя большого пальца, второй — над поверхностным сгибателем пальцев

Ключевые слова: машинное обучение, распознавание жестов, человеко-машинный интерфейс, электромиография, ансамбль методов, градиентный бустинг, метод $k$-ближайших соседей, дерево решений.

Kozyr P.S., Saveliev A.I.
Analysis of the effectiveness of machine learning methods in the problem of gesture recognition based on the data of electromyographic signals
Computer Research and Modeling, 2021, v. 13, no. 1, pp. 175-194

Gesture recognition is an urgent challenge in developing systems of human-machine interfaces. We analyzed machine learning methods for gesture classification based on electromyographic muscle signals to identify the most effective one. Methods such as the naive Bayesian classifier (NBC), logistic regression, decision tree, random forest, gradient boosting, support vector machine (SVM), $k$-nearest neighbor algorithm, and ensembles (NBC and decision tree, NBC and gradient boosting, gradient boosting and decision tree) were considered. Electromyography (EMG) was chosen as a method of obtaining information about gestures. This solution does not require the location of the hand in the field of view of the camera and can be used to recognize finger movements. To test the effectiveness of the selected methods of gesture recognition, a device was developed for recording the EMG signal, which includes three electrodes and an EMG sensor connected to the microcontroller and the power supply. The following gestures were chosen: clenched fist, “thumb up”, “Victory”, squeezing an index finger and waving a hand from right to left. Accuracy, precision, recall and execution time were used to evaluate the effectiveness of classifiers. These parameters were calculated for three options for the location of EMG electrodes on the forearm. According to the test results, the most effective methods are $k$-nearest neighbors’ algorithm, random forest and the ensemble of NBC and gradient boosting, the average accuracy of ensemble for three electrode positions was 81.55%. The position of the electrodes was also determined at which machine learning methods achieve the maximum accuracy. In this position, one of the differential electrodes is located at the intersection of the flexor digitorum profundus and flexor pollicis longus, the second — above the flexor digitorum superficialis.

Keywords: machine learning, gesture recognition, human-machine interface, electromyography, ensemble learning, gradient boosting, $k$-nearest neighbors’ algorithm, decision tree.

Страницы: « первая предыдущая следующая последняя »

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал входит в систему Российского индекса научного цитирования.

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"