Все выпуски
- 2026 Том 18
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Прямые мультипликативные методы для разреженных матриц. Линейное программирование
Компьютерные исследования и моделирование, 2017, т. 9, № 2, с. 143-165Мультипликативные методы для разреженных матриц являются наиболее приспособленными для снижения трудоемкости операций решения систем линейных уравнений, выполняемых на каждой итерации симплекс-метода. Матрицы ограничений в этих задачах слабо заполнены ненулевыми элементами, что позволяет получать мультипликаторы, главные столбцы которых также разрежены, а операция умножения вектора на мультипликатор по трудоемкости пропорциональна числу ненулевых элементов этого мультипликатора. Кроме того, при переходе к смежному базису мультипликативное представление достаточно легко корректируется. Для повышения эффективности таких методов требуется уменьшение заполненности мультипликативного представления ненулевыми элементами. Однако на каждой итерации алгоритма к последовательности мультипликаторов добавляется еще один. А трудоемкость умножения, которая линейно зависит от длины последовательности, растет. Поэтому требуется выполнять время от времени перевычисление обратной матрицы, получая ее из единичной. Однако в целом проблема не решается. Кроме того, набор мультипликаторов представляет собой последовательность структур, причем размер этой последовательности неудобно велик и точно неизвестен. Мультипликативные методы не учитывают фактора высокой степени разреженности исходных матриц и ограничения-равенства, требуют определения первоначального базисного допустимого решения задачи и, как следствие, не допускают сокращения размерности задачи линейного программирования и регулярной процедуры сжатия — уменьшения размерности мультипликаторов и исключения ненулевых элементов из всех главных столбцов мультипликаторов, полученных на предыдущих итерациях. Таким образом, разработка численных методов решения задач линейного программирования, позволяющих преодолеть или существенно ослабить недостатки схем реализации симплекс-метода, относится к актуальным проблемам вычислительной математики.
В данной работе рассмотрен подход к построению численно устойчивых прямых мультипликативных методов решения задач линейного программирования, учитывающих разреженность матриц, представленных в упакованном виде. Преимущество подхода состоит в уменьшении размерности и минимизации заполнения главных строк мультипликаторов без потери точности результатов, причем изменения в позиции очередной обрабатываемой строки матрицы не вносятся, что позволяет использовать статические форматы хранения данных.
В качестве прямого продолжения данной работы в основу построения прямого мультипликативного алгоритма задания направления спуска в ньютоновских методах безусловной оптимизации предлагается положить модификацию прямого мультипликативного метода линейного программирования путем интеграции одной из существующих техник построения существенно положительно-определенной матрицы вторых производных.
Ключевые слова: численно устойчивые прямые мультипликативные методы, линейное программирование, формат хранения разреженных матриц, параллельное выполнение матричных операций без распаковывания, минимизация заполнения главных строк мультипликаторов, разреженные матрицы.
Direct multiplicative methods for sparse matrices. Linear programming
Computer Research and Modeling, 2017, v. 9, no. 2, pp. 143-165Просмотров за год: 10. Цитирований: 2 (РИНЦ).Multiplicative methods for sparse matrices are best suited to reduce the complexity of operations solving systems of linear equations performed on each iteration of the simplex method. The matrix of constraints in these problems of sparsely populated nonzero elements, which allows to obtain the multipliers, the main columns which are also sparse, and the operation of multiplication of a vector by a multiplier according to the complexity proportional to the number of nonzero elements of this multiplier. In addition, the transition to the adjacent basis multiplier representation quite easily corrected. To improve the efficiency of such methods requires a decrease in occupancy multiplicative representation of the nonzero elements. However, at each iteration of the algorithm to the sequence of multipliers added another. As the complexity of multiplication grows and linearly depends on the length of the sequence. So you want to run from time to time the recalculation of inverse matrix, getting it from the unit. Overall, however, the problem is not solved. In addition, the set of multipliers is a sequence of structures, and the size of this sequence is inconvenient is large and not precisely known. Multiplicative methods do not take into account the factors of the high degree of sparseness of the original matrices and constraints of equality, require the determination of initial basic feasible solution of the problem and, consequently, do not allow to reduce the dimensionality of a linear programming problem and the regular procedure of compression — dimensionality reduction of multipliers and exceptions of the nonzero elements from all the main columns of multipliers obtained in previous iterations. Thus, the development of numerical methods for the solution of linear programming problems, which allows to overcome or substantially reduce the shortcomings of the schemes implementation of the simplex method, refers to the current problems of computational mathematics.
In this paper, the approach to the construction of numerically stable direct multiplier methods for solving problems in linear programming, taking into account sparseness of matrices, presented in packaged form. The advantage of the approach is to reduce dimensionality and minimize filling of the main rows of multipliers without compromising accuracy of the results and changes in the position of the next processed row of the matrix are made that allows you to use static data storage formats.
As a direct continuation of this work is the basis for constructing a direct multiplicative algorithm set the direction of descent in the Newton methods for unconstrained optimization is proposed to put a modification of the direct multiplier method, linear programming by integrating one of the existing design techniques significantly positive definite matrix of the second derivatives.
-
Двухстадийные однократные ROW-методы с комплексными коэффициентами для автономных систем ОДУ
Компьютерные исследования и моделирование, 2010, т. 2, № 1, с. 19-32Для автономных систем ОДУ рассмотрено простейшее подмножество двухстадийных схем Розенброка с комплексными коэффициентами, численная реализация которых требует одного LU-разложения и одного вычисления Якобиана за шаг интегрирования.
Проведено теоретическое исследование точности и устойчивости таких методов. Получены новые A-устойчивые методы 3-го порядка точности с различными свойствами и возможностью простой оценки главного терма локальной погрешности, что необходимо для автоматического выбора шага. Проведено тестирование новых методов.
Two-stage single ROW methods with complex coefficients for autonomous systems of ODE
Computer Research and Modeling, 2010, v. 2, no. 1, pp. 19-32Цитирований: 1 (РИНЦ).The basic subset of two-stage Rosenbrock schemes with complex coefficients for numerical solution of autonomous systems of ordinary differential equations (ODE) has been considered. Numerical realization of such schemes requires one LU-decomposition, two computations of right side function and one computation of Jacoby matrix of the system per one step. The full theoretical investigation of accuracy and stability of such schemes have been done. New A-stable methods of the 3-rd order of accuracy with different properties have been constructed. There are high order L-decremented schemes as well as schemes with simple estimation of the main term of truncation error which is necessary for automatic evaluation of time step. Testing of new methods has been performed.
-
Моделирование нестационарной структуры потока около спускаемого аппарата в условиях марсианской атмосферы
Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 701-714В статье представлены результаты численного моделирования вихревого пространственного нестационарного движения среды, возникающего около боковой и донной поверхностей десантного модуля при его спуске в атмосфере Марса. Численное исследование проведено для высокоскоростного режима обтекания при различных углах атаки. Математическое моделирование осуществлено на основе модели Навье – Стокса и модели равновесных химических реакций для газового состава марсианской атмосферы. Результаты моделирования показали, что при рассматриваемых условиях движения спускаемого аппарата около его боковой и донной поверхностей реализуется нестационарное течение, имеющее ярко выраженный вихревой характер. Численные расчеты указывают на то, что в зависимости от угла атаки нестационарность и вихревой характер потока могут проявляться как на всей боковой и донной поверхностях аппарата, так и, частично, на их подветренной стороне. Для различных углов атаки приводятся картины вихревой структуры потока около поверхности спускаемого аппарата и в его ближнем следе, а также картины полей температуры и показателя адиабаты. Нестационарный характер обтекания подтверждается представленными временными зависимостями газодинамических параметров потока в различных точках поверхности аппарата. Проведенные параметрические расчеты позволили построить зависимости аэродинамических характеристик спускаемого аппарата от угла атаки. Математическое моделирование осуществляется на основе являющегося методом конечных объемов консервативного численного метода потоков, основанного на конечно-разностной записи законов сохранения аддитивных характеристик среды с использованием upwind-аппроксимаций потоковых переменных. Для моделирования возникающей при обтекании сложной вихревой структуры потока около спускаемого аппарата используются неравномерные вычислительные сетки, включающие до 30 миллионов конечных объемов с экспоненциальным сгущением к поверхности, что позволило выявить мелкомасштабные вихревые образования. Численные исследования проведены на базе разработанного комплекса программ, основанного на параллельных алгоритмах используемого численного метода и реализованного на современных многопроцессорных вычислительных системах. Приведенные в статье результаты численного моделирования получены при использовании до двух тысяч вычислительных ядер многопроцессорного комплекса.
Ключевые слова: математическое моделирование, параллельные алгоритмы, спускаемый аппарат, аэродинамические характеристики, вихревой поток, ближний след.
Simulation of unsteady structure of flow over descent module in the Martian atmosphere conditions
Computer Research and Modeling, 2022, v. 14, no. 4, pp. 701-714The article presents the results of numerical modeling of the vortex spatial non-stationary motion of the medium arising near the lateral and bottom surfaces of the descent module during its movement in the atmosphere of Mars. The numerical study was performed for the high-speed streamline regime at various angles of attack. Mathematical modeling was carried out on the basis of the Navier – Stokes model and the model of equilibrium chemical reactions for the Martian atmosphere gas. The simulation results showed that under the considered conditions of the descent module motion, a non-stationary flow with a pronounced vortex character is realized near its lateral and bottom surfaces. Numerical calculations indicate that, depending on the angle of attack, the nonstationarity and vortex nature of the flow can manifest itself both on the entire lateral and bottom surfaces of the module, and, partially, on their leeward side. For various angles of attack, pictures of the vortex structure of the flow near the surface of the descent vehicle and in its near wake are presented, as well as pictures of the gas-dynamic parameters fields. The non-stationary nature of the flow is confirmed by the presented time dependences of the gas-dynamic parameters of the flow at various points on the module surface. The carried out parametric calculations made it possible to determine the dependence of the aerodynamic characteristics of the descent module on the angle of attack. Mathematical modeling is carried out on the basis of the conservative numerical method of fluxes, which is a finitevolume method based on a finite-difference writing of the conservation laws of additive characteristics of the medium using «upwind» approximations of stream variables. To simulate the complex vortex structure of the flow over descent module, the nonuniform computational grids are used, including up to 30 million finite volumes with exponential thickening to the surface, which made it possible to reveal small-scale vortex formations. Numerical investigations were carried out on the basis of the developed software package based on parallel algorithms of the used numerical method and implemented on modern multiprocessor computer systems. The results of numerical simulation presented in the article were obtained using up to two thousand computing cores of a multiprocessor complex.
-
Моделирование LES-подходом в ПК FlowVision турбулентного перемешивания разнотемпературных потоков в T-образном трубопроводе
Компьютерные исследования и моделирование, 2023, т. 15, № 4, с. 827-843В работе представлены результаты численного моделирования в программном комплексе FlowVision турбулентного перемешивания потоков воды разнойтемпер атуры в Т-образной трубе. В статье детально описан экспериментальный стенд, специально спроектированный с целью получения простых для большинства программных комплексов вычислительной гидродинамики граничных условий. По результатам испытаний получены значения осредненных во времени температур и скоростей в контрольных датчиках и плоскостях. В статье представлена используемая при расчете система дифференциальных уравнений в частных производных, описывающая процесс тепломассопереноса в жидкости с использованием модели турбулентности Смагоринского. Указаны граничные условия, посредством которых задаются случайные пульсации скорости на входе в расчетную область. Моделирование выполнено на различных расчетных сетках, для которых оси глобальной системы координат совпадают с направлениями потоков горячей и холодной воды. Для ПК FlowVision показана возможность построения расчетной сетки в процессе моделирования на основании изменения параметров течения. Оценено влияние подобного алгоритма построения расчетной сетки на результаты расчетов. Приведены результаты расчетов на диагональной сетке с использованием скошенной схемы (направление координатных линий не совпадает с направлением осей труб тройника). Показана высокая эффективность скошенной схемы при моделировании потоков, генеральные направления которых не совпадают с гранями расчетных ячеек. Проведено сравнение результатов моделирования на различных расчетных сетках. По результатам численного моделирования в ПК FlowVision получены распределения осредненных по времени скорости и температуры воды в контрольных сечениях и датчиках. Представлено сравнение численных результатов, полученных в ПК FlowVision, с экспериментальными данными и расчетами, выполненными с использованием других вычислительных программ. Результаты моделирования турбулентного перемешивания потока воды разной температуры в ПК FlowVision ближе к экспериментальным данным в сравнении с расчетами в CFX ANSYS. Показано, что применение LES-модели турбулентности на сравнительно небольших расчетных сетках в ПК FlowVision позволяет получать результаты с погрешностью в пределах 5 %.
Ключевые слова: FlowVision, численное моделирование, гидродинамика, турбулентное перемешивание потоков, теплоперенос, Т-образная труба.
Simulation of multi-temperature flows turbulent mixing in a T-junctions by the LES approach in FlowVision software package
Computer Research and Modeling, 2023, v. 15, no. 4, pp. 827-843The paper presents the results of numerical simulation of different-temperature water flows turbulent mixing in a T-junctions in the FlowVision software package. The article describes in detail an experimental stand specially designed to obtain boundary conditions that are simple for most computational fluid dynamics software systems. Values of timeaveraged temperatures and velocities in the control sensors and planes were obtained according to the test results. The article presents the system of partial differential equations used in the calculation describing the process of heat and mass transfer in a liquid using the Smagorinsky turbulence model. Boundary conditions are specified that allow setting the random velocity pulsations at the entrance to the computational domain. Distributions of time-averaged water velocity and temperature in control sections and sensors are obtained. The simulation is performed on various computational grids, for which the axes of the global coordinate system coincide with the directions of hot and cold water flows. The possibility for FlowVision PC to construct a computational grid in the simulation process based on changes in flow parameters is shown. The influence of such an algorithm for constructing a computational grid on the results of calculations is estimated. The results of calculations on a diagonal grid using a beveled scheme are given (the direction of the coordinate lines does not coincide with the direction of the tee pipes). The high efficiency of the beveled scheme is shown when modeling flows whose general direction does not coincide with the faces of the calculated cells. A comparison of simulation results on various computational grids is carried out. The numerical results obtained in the FlowVision PC are compared with experimental data and calculations performed using other computing programs. The results of modeling turbulent mixing of water flow of different temperatures in the FlowVision PC are closer to experimental data in comparison with calculations in CFX ANSYS. It is shown that the application of the LES turbulence model on relatively small computational grids in the FlowVision PC allows obtaining results with an error within 5%.
-
Численная идентификация модели дегидрирования в грид-системе на базе BOINC
Компьютерные исследования и моделирование, 2013, т. 5, № 1, с. 37-45В работе рассматривается обратная задача определения по экспериментальным данным параметров модели выделения водорода из порошка гидрида металла. Методом слепого поиска в пространстве параметров установлено, что задача имеет многочисленные физически разумные решения. Решения задачи получены с помощью высокопроизводительного численного моделирования в грид–системе на базе платформы BOINC.
Ключевые слова: обратная задача, оценка параметров, математическое моделирование, вычислительные методы в физике, грид-системы, BOINC.
Numerical identification of the dehydriding model in a BOINC-based grid system
Computer Research and Modeling, 2013, v. 5, no. 1, pp. 37-45Цитирований: 6 (РИНЦ).In the paper we consider the inverse problem of evaluating kinetic parameters of the model of dehydriding of metal powder using experimental data. The «blind search» in the space of parameters revealed multiple physically reasonable solutions. The solutions were obtained using high–performance computational modeling based on BOINC–grid.
-
Модель мантийной конвекции в зоне полного цикла субдукции
Компьютерные исследования и моделирование, 2024, т. 16, № 6, с. 1385-1398Разработана численная 2D-модель погружения холодной океанической плиты в толщу верхней мантии Земли, где этапу начального погружения плиты предшествует установление режима термогравитационной конвекции мантийного вещества. Модельным приближением мантии выступает двумерный образ несжимаемой ньютоновской квазижидкости в декартовой системе координат, где вследствие высокой вязкости среды уравнения мантийной конвекции принимаются в стоксовском приближении. Полагается, что вместе с плитой в верхние слои мантии поступает просочившаяся сюда морская вода. С глубиной рост давления и температуры приводит к определенным потерям ее легких фракций и флюидов, потерям воды и газов водосодержащих минералов плиты, перестройке их кристаллической решетки и, как следствие, фазовым превращениям. Эти потери обусловливают рост плотности плиты и неравномерность распределения вдоль плиты напряжений (начальные участки плиты оказываются менее плотными), что в последствии вместе с воздействием на плиту мантийных течений вызывает ее фрагментацию. Рассматривается состояние мантийной конвекции, когда плита и ее отдельные фрагменты опустились на подошву верхней мантии. Разработаны вычислительные схемы решения уравнений модели. Расчеты мантийной конвекции выполнены в терминах приближения Стокса для завихренности и функции тока, а для расчетов состояния и погружения плиты использован SPH. Выполнен ряд вычислительных экспериментов. Показано, что вследствие воздействия на плиту мантийной конвекции и с развитием вдоль плиты неоднородного поля напряжений происходит ее фрагментация. Следуя уравнениям модели, оценивается время финальной стадии субдукции, т. е. времени выхода всей океанической плиты на дно верхней мантии. В геодинамике этот процесс определяется коллизией плит, следует непосредственно за субдукцией и рассматривается обычно в качестве конечного этапа цикла Уилсона (т. е. цикла развития складчатых поясов).
Ключевые слова: мантийная конвекция, субдукция, слэб, термогравитационный режим, вычислительная схема, гидродинамика сглаженных частиц.
Model of mantle convection in a zone of a complete subduction cycle
Computer Research and Modeling, 2024, v. 16, no. 6, pp. 1385-1398A 2D numerical model of the immersion of a cold oceanic plate into the thickness of the Earth’s upper mantle has been developed, where the stage of the initial immersion of the plate is preceded by the establishment of a regime of thermogravitational convection of the mantle substance. The model approximation of the mantle is a two-dimensional image of an incompressible Newtonian quasi-liquid in a Cartesian coordinate system, where, due to the high viscosity of the medium, the equations of mantle convection are accepted in the Stokes approximation. It is assumed that seawater that has leaked here enters the first horizons of the mantle together with the plate. With depth, the increase in pressure and temperature leads to certain losses of its light fractions and fluids, losses of water and gases of water-containing minerals of the plate, restructuring of their crystal lattice and, as a consequence, phase transformations. These losses cause an increase in the plate density and an uneven distribution of stresses along the plate (the initial sections of the plate are denser), which subsequently, together with the effect of mantle currents on the plate, causes its fragmentation. The state of mantle convection is considered when the plate and its individual fragments have descended to the bottom of the upper mantle. Computational schemes for solving the model equations have been developed. Mantle convection calculations are performed in terms of the Stokes approximation for vorticity and the stream function, and SPH is used to calculate the state and subsidence of the plate. A number of computational experiments have been performed. It is shown that fragmentation of the plate occurs due to the effect of mantle convection on the plate and the development of inhomogeneous stress fields along the plate. Following the equations of the model, the time of the final stage of subduction is estimated, i.e. the time of the entire oceanic plate reaching the bottom of the upper mantle. In geodynamics, this process is determined by the collision of plates that immediately follows subduction and is usually considered as the final stage of the Wilson cycle (i. e., the cycle of development of folded belts).
-
Development of advanced intrusion detection approach using machine and ensemble learning for industrial internet of things networks
Компьютерные исследования и моделирование, 2025, т. 17, № 5, с. 799-827The Industrial Internet of Things (IIoT) networks plays a significant role in enhancing industrial automation systems by connecting industrial devices for real time data monitoring and predictive maintenance. However, this connectivity introduces new vulnerabilities which demand the development of advanced intrusion detection systems. The nuclear facilities are considered one of the closest examples of critical infrastructures that suffer from high vulnerability through the connectivity of IIoT networks. This paper develops a robust intrusion detection approach using machine and ensemble learning algorithms specifically determined for IIoT networks. This approach can achieve optimal performance with low time complexity suitable for real-time IIoT networks. For each algorithm, Grid Search is determined to fine-tune the hyperparameters for optimizing the performance while ensuring time computational efficiency. The proposed approach is investigated on recent IIoT intrusion detection datasets, WUSTL-IIOT-2021 and Edge-IIoT-2022 to cover a wider range of attacks with high precision and minimum false alarms. The study provides the effectiveness of ten machine and ensemble learning models on selected features of the datasets. Synthetic Minority Over-sampling Technique (SMOTE)-based multi-class balancing is used to manipulate dataset imbalances. The ensemble voting classifier is used to combine the best models with the best hyperparameters for raising their advantages to improve the performance with the least time complexity. The machine and ensemble learning algorithms are evaluated based on accuracy, precision, recall, F1 Score, and time complexity. This evaluation can discriminate the most suitable candidates for further optimization. The proposed approach is called the XCL approach that is based on Extreme Gradient Boosting (XGBoost), CatBoost (Categorical Boosting), and Light Gradient- Boosting Machine (LightGBM). It achieves high accuracy, lower false positive rate, and efficient time complexity. The results refer to the importance of ensemble strategies, algorithm selection, and hyperparameter optimization in enhancing the performance to detect the different intrusions across the IIoT datasets over the other models. The developed approach produced a higher accuracy of 99.99% on the WUSTL-IIOT-2021 dataset and 100% on the Edge-IIoTset dataset. Our experimental evaluations have been extended to the CIC-IDS-2017 dataset. These additional evaluations not only highlight the applicability of the XCL approach on a wide spectrum of intrusion detection scenarios but also confirm its scalability and effectiveness in real-world complex network environments.
Ключевые слова: machine learning, intrusion detection systems, cybersecurity, industrial internet of things, ensemble learning.
Development of advanced intrusion detection approach using machine and ensemble learning for industrial internet of things networks
Computer Research and Modeling, 2025, v. 17, no. 5, pp. 799-827The Industrial Internet of Things (IIoT) networks plays a significant role in enhancing industrial automation systems by connecting industrial devices for real time data monitoring and predictive maintenance. However, this connectivity introduces new vulnerabilities which demand the development of advanced intrusion detection systems. The nuclear facilities are considered one of the closest examples of critical infrastructures that suffer from high vulnerability through the connectivity of IIoT networks. This paper develops a robust intrusion detection approach using machine and ensemble learning algorithms specifically determined for IIoT networks. This approach can achieve optimal performance with low time complexity suitable for real-time IIoT networks. For each algorithm, Grid Search is determined to fine-tune the hyperparameters for optimizing the performance while ensuring time computational efficiency. The proposed approach is investigated on recent IIoT intrusion detection datasets, WUSTL-IIOT-2021 and Edge-IIoT-2022 to cover a wider range of attacks with high precision and minimum false alarms. The study provides the effectiveness of ten machine and ensemble learning models on selected features of the datasets. Synthetic Minority Over-sampling Technique (SMOTE)-based multi-class balancing is used to manipulate dataset imbalances. The ensemble voting classifier is used to combine the best models with the best hyperparameters for raising their advantages to improve the performance with the least time complexity. The machine and ensemble learning algorithms are evaluated based on accuracy, precision, recall, F1 Score, and time complexity. This evaluation can discriminate the most suitable candidates for further optimization. The proposed approach is called the XCL approach that is based on Extreme Gradient Boosting (XGBoost), CatBoost (Categorical Boosting), and Light Gradient- Boosting Machine (LightGBM). It achieves high accuracy, lower false positive rate, and efficient time complexity. The results refer to the importance of ensemble strategies, algorithm selection, and hyperparameter optimization in enhancing the performance to detect the different intrusions across the IIoT datasets over the other models. The developed approach produced a higher accuracy of 99.99% on the WUSTL-IIOT-2021 dataset and 100% on the Edge-IIoTset dataset. Our experimental evaluations have been extended to the CIC-IDS-2017 dataset. These additional evaluations not only highlight the applicability of the XCL approach on a wide spectrum of intrusion detection scenarios but also confirm its scalability and effectiveness in real-world complex network environments.
-
Ресурсно-адаптивный подход к разметке текстовых данных в структурированном виде с использованием малых языковых моделей
Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 41-59В данной работе проведено экспериментальное исследование применения автоматической разметки текстовых данных в формате «вопрос – ответ» (QA-пары) в условиях ограниченных вычислительных ресурсов и требований к защите данных. В отличие от традиционных подходов, основанных на жестких правилах или использовании внешних API, предложено применять малые языковые модели с небольшим количеством параметров, способные функционировать локально без GPU на стандартных CPU-системах. Для тестирования были выбраны две модели: Gemma-3-4b и Qwen-2.5-3b (квантованные 4-битные версии), а в качестве исходного материала использован корпус документов с четкой структурой и формально-строгим стилем изложения. Разработана система автоматической аннотации, реализующая полный цикл генерации QA-датасета: автоматическое разбиение исходного документа на логически связные фрагменты, формирование пар «вопрос – ответ» моделью Gemma-3-4b, предварительная проверка их корректности с использованием Qwen-2.5-3b с опорой на доказательный фрагмент из контекста и экспертной оценкой качества. Экспорт полученных результатов предоставляется в формате JSONL. Оценка производительности охватывает всю систему генерации QA-пар, включая обработку фрагментов локальной языковой моделью, модули предобработки и постобработки текста. Производительность измеряется по времени генерации одной QA-пары, общей пропускной способности системы, использованию оперативной памяти и загрузке процессора, что позволяет объективно оценить вычислительную эффективность предлагаемого подхода при запуске на CPU. Эксперимент на расширенной выборке из 12 документов показал, что автоматическая аннотация демонстрирует устойчивую производительность при обработке документов различных типов, тогда как ручная разметка характеризуется существенно большими временными затратами и высокой вариативностью. В зависимости от типа документа ускорение аннотации по сравнению с ручным процессом составляет от 8 до 14 раз. Анализ качества показал, что большинство сгенерированных QA-пар обладают высокой семантической согласованностью с исходным контекстом, при этом лишь ограниченная доля данных требует экспертной корректировки или исключения. Хотя полная ручная валидация корпуса (золотой стандарт) в рамках работы не проводилась, сочетание автоматической оценки и выборочной экспертной проверки позволяет рассматривать полученный уровень качества как приемлемый для задач предварительной автоматизированной аннотации. В целом результаты подтверждают практическую применимость малых языковых моделей для построения автономных и воспроизводимых систем автоматической разметки текстов в условиях ограниченных вычислительных ресурсов и создают основу для дальнейших исследований в области эффективной подготовки обучающих корпусов для задач обработки естественного языка.
Ключевые слова: языковые модели, разметка данных, вопрос – ответ, оценка качества, локальные вычисления, ограниченные вычислительные ресурсы.
Resource-adaptive approach to structured text data annotation using small language models
Computer Research and Modeling, 2026, v. 18, no. 1, pp. 41-59This paper presents an experimental study of the application of automatic annotation of text data in the question – answer format (QA pairs) under conditions of limited computing resources and data protection requirements. Unlike traditional approaches based on rigid rules or the use of external APIs, we propose using small language models with a small number of parameters that can function locally without a GPU on standard CPU systems. Two models were selected for testing — Gemma-3-4b and Qwen-2.5-3b (quantized 4-bit versions) — and a corpus of documents with a clear structure and a formally rigorous style of presentation was used as source material. An automatic annotation system was developed that implements the full cycle of QA dataset generation: automatic division of the source document into logically connected fragments, formation of “question – answer” pairs using the Gemma-3-4b model, preliminary verification of their correctness using Qwen-2.5-3b based on evidence span from the context and expert quality assessment. The results are exported in JSONL format. Performance evaluation covers the entire QA pair generation system, including fragment processing by the local language model, text preprocessing and postprocessing modules. Performance is measured by the time it takes to generate a single QA pair, the total throughput of the system, RAM usage, and CPU load, which allows for an objective assessment of the computational efficiency of the proposed approach when running on a CPU. An experiment on an extended sample of 12 documents showed that automatic annotation demonstrates stable performance when processing different types of documents, while manual annotation is characterized by significantly higher time costs and high variability. Depending on the type of document, the acceleration of annotation compared to the manual process ranges from 8 to 14 times. Quality analysis showed that most of the generated QA pairs have high semantic consistency with the original context, with only a limited proportion of data requiring expert correction or exception. Although full manual validation of the corpus (the “gold standard”) was not performed as part of this work, the combination of automatic evaluation and selective expert review allows us to consider the resulting quality level acceptable for preliminary automated annotation tasks. Overall, the results confirm the practical applicability of small language models for building autonomous and reproducible automatic text annotation systems under limited computational resources and provide a basis for further research in the field of effective training corpus preparation for natural language processing tasks.
-
Гибридные вычислительные системы на основе GPU для задач биоинформатики
Компьютерные исследования и моделирование, 2010, т. 2, № 2, с. 163-167Статья посвящена преимуществам применения гибридных вычислительных систем на основе графических процессоров NVIDIA для решения задач моделирования молекулярной динамики, квантовой химии, секвенирования, приведены примеры приложений.
GPU-accelerated hybrid systems for high-performance computing in bio-informatics
Computer Research and Modeling, 2010, v. 2, no. 2, pp. 163-167Просмотров за год: 2. Цитирований: 6 (РИНЦ).Modern GPUs are massively-parallel processors, offering substantial amount of computational power in energy-efficient package. We discuss the benefits of utilizing this computing power for modeling problems in bio-informatics, such as molecular dynamics, quantum chemistry and sequence analysis.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"





