Все выпуски
- 2026 Том 18
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Ресурсно-адаптивный подход к разметке текстовых данных в структурированном виде с использованием малых языковых моделей
Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 41-59В данной работе проведено экспериментальное исследование применения автоматической разметки текстовых данных в формате «вопрос – ответ» (QA-пары) в условиях ограниченных вычислительных ресурсов и требований к защите данных. В отличие от традиционных подходов, основанных на жестких правилах или использовании внешних API, предложено применять малые языковые модели с небольшим количеством параметров, способные функционировать локально без GPU на стандартных CPU-системах. Для тестирования были выбраны две модели: Gemma-3-4b и Qwen-2.5-3b (квантованные 4-битные версии), а в качестве исходного материала использован корпус документов с четкой структурой и формально-строгим стилем изложения. Разработана система автоматической аннотации, реализующая полный цикл генерации QA-датасета: автоматическое разбиение исходного документа на логически связные фрагменты, формирование пар «вопрос – ответ» моделью Gemma-3-4b, предварительная проверка их корректности с использованием Qwen-2.5-3b с опорой на доказательный фрагмент из контекста и экспертной оценкой качества. Экспорт полученных результатов предоставляется в формате JSONL. Оценка производительности охватывает всю систему генерации QA-пар, включая обработку фрагментов локальной языковой моделью, модули предобработки и постобработки текста. Производительность измеряется по времени генерации одной QA-пары, общей пропускной способности системы, использованию оперативной памяти и загрузке процессора, что позволяет объективно оценить вычислительную эффективность предлагаемого подхода при запуске на CPU. Эксперимент на расширенной выборке из 12 документов показал, что автоматическая аннотация демонстрирует устойчивую производительность при обработке документов различных типов, тогда как ручная разметка характеризуется существенно большими временными затратами и высокой вариативностью. В зависимости от типа документа ускорение аннотации по сравнению с ручным процессом составляет от 8 до 14 раз. Анализ качества показал, что большинство сгенерированных QA-пар обладают высокой семантической согласованностью с исходным контекстом, при этом лишь ограниченная доля данных требует экспертной корректировки или исключения. Хотя полная ручная валидация корпуса (золотой стандарт) в рамках работы не проводилась, сочетание автоматической оценки и выборочной экспертной проверки позволяет рассматривать полученный уровень качества как приемлемый для задач предварительной автоматизированной аннотации. В целом результаты подтверждают практическую применимость малых языковых моделей для построения автономных и воспроизводимых систем автоматической разметки текстов в условиях ограниченных вычислительных ресурсов и создают основу для дальнейших исследований в области эффективной подготовки обучающих корпусов для задач обработки естественного языка.
Ключевые слова: языковые модели, разметка данных, вопрос – ответ, оценка качества, локальные вычисления, ограниченные вычислительные ресурсы.
Resource-adaptive approach to structured text data annotation using small language models
Computer Research and Modeling, 2026, v. 18, no. 1, pp. 41-59This paper presents an experimental study of the application of automatic annotation of text data in the question – answer format (QA pairs) under conditions of limited computing resources and data protection requirements. Unlike traditional approaches based on rigid rules or the use of external APIs, we propose using small language models with a small number of parameters that can function locally without a GPU on standard CPU systems. Two models were selected for testing — Gemma-3-4b and Qwen-2.5-3b (quantized 4-bit versions) — and a corpus of documents with a clear structure and a formally rigorous style of presentation was used as source material. An automatic annotation system was developed that implements the full cycle of QA dataset generation: automatic division of the source document into logically connected fragments, formation of “question – answer” pairs using the Gemma-3-4b model, preliminary verification of their correctness using Qwen-2.5-3b based on evidence span from the context and expert quality assessment. The results are exported in JSONL format. Performance evaluation covers the entire QA pair generation system, including fragment processing by the local language model, text preprocessing and postprocessing modules. Performance is measured by the time it takes to generate a single QA pair, the total throughput of the system, RAM usage, and CPU load, which allows for an objective assessment of the computational efficiency of the proposed approach when running on a CPU. An experiment on an extended sample of 12 documents showed that automatic annotation demonstrates stable performance when processing different types of documents, while manual annotation is characterized by significantly higher time costs and high variability. Depending on the type of document, the acceleration of annotation compared to the manual process ranges from 8 to 14 times. Quality analysis showed that most of the generated QA pairs have high semantic consistency with the original context, with only a limited proportion of data requiring expert correction or exception. Although full manual validation of the corpus (the “gold standard”) was not performed as part of this work, the combination of automatic evaluation and selective expert review allows us to consider the resulting quality level acceptable for preliminary automated annotation tasks. Overall, the results confirm the practical applicability of small language models for building autonomous and reproducible automatic text annotation systems under limited computational resources and provide a basis for further research in the field of effective training corpus preparation for natural language processing tasks.
-
Моделирование некоторых сценариев в системе «власть – общество», включающих миграцию населения и изменение количества регионов
Компьютерные исследования и моделирование, 2024, т. 16, № 6, с. 1499-1512В работе исследуется дискретная модификация модели А.П. Михайлова «власть – общество», ранее предложенная автором. Эта модификация основана на стохастическом клеточном автомате, то есть имеет микродинамику, принципиально отличную от базовой непрерывной, основанной на дифференциальных уравнениях модели. При этом макродинамика дискретной модификации, как показано в предыдущих работах, совпадает с макродинамикой исходной модели. Этот важный результат, однако, вызывает вопрос, в чем смысл использования дискретной модели. Ее главной особенностью является гибкость, позволяющая добавлять в рассмотрение самые разные факторы, учет которых в непрерывной модели либо приводит к существенному росту вычислительной сложности, либо в принципе невозможен.
В данной работе рассматриваются несколько примеров подобного расширения области применимости модели, при помощи которого решается ряд прикладных задач.
Одна из модификаций модели учитывает экономические связи между регионами и муниципалитетами, что не могло быть исследовано в базовой модели. Вычислительные эксперименты подтвердили улучшение социально-экономических показателей системы при наличии таких связей.
Вторая модификация включает в себя возможность внутренней миграции в системе. С ее помощью был получен ряд результатов, связанных с социально-экономическим развитием более благополучного региона, притягивающего мигрантов.
Кроме этого, была исследована динамика системы при изменении количества регионов и муниципалитетов в системе. Показано негативное влияние этого процесса на социально-экономические показатели системы и найдено возможное управление, имеющее целью преодоление этого негативного влияния.
Результатами данного исследования, таким образом, явились как решение отдельных прикладных задач, так и демонстрация на их примере более широких возможностей дискретной модели по сравнению с базовой непрерывной.
Ключевые слова: система «власть – общество», клеточные автоматы, вычислительный эксперимент, имитационное моделирование, экономика, регионы.
Modeling some scenarios in the “power – society” system concerning migration and changing the number of regions
Computer Research and Modeling, 2024, v. 16, no. 6, pp. 1499-1512The paper considers an earlier proposed by the author discrete modification of the A. P. Mikhailov “power – society” model. The modification is based on a stochastic cellular automaton, it’s microdynamics being completely different from the c continuous model based on differential equations. However, the macrodynamics of the discrete modification is shown in previous works to be equivalent to one of the continuous model. This is important, but at the same time raises the question why use the discrete model. The answer lies in its flexibility, which allows adding a variety of factors, the consideration of which in a continuous model either leads to a significant increase in computational complexity or is simply impossible.
This paper considers several examples of such applicability expansion of the model, with the help of which a number of applied problems are solved.
One of the modifications of the model takes into account economic ties between regions and municipalities, which could not be studied in the basic model. Computational experiments confirmed the improvement of the socio-economic indicators of the system under the influence of the ties.
The second modification allows internal migration in the system. Using it we studied the socio-economic development of a more prosperous region that attracts migrants.
Next we studied the dynamics of the system while the number of regions and municipalities changes. The negative impact of this process on the socio-economic indicators of the system was shown and possible control was found to overcome this negative impact.
The results of this study, therefore, include both the solution of some applied problems and the demonstration of the broader applicability of the discrete model compared with the continuous one.
-
Исследование моделей турбулентности для расчета сильно закрученного потока в резко расширяющемся канале
Компьютерные исследования и моделирование, 2021, т. 13, № 4, с. 793-805В настоящей работе проводится сравнение принципиально различных моделей турбулентности для расчета сильно закрученного потока в резко расширяющейся трубе. Данная задача имеет большое значе- ние не только в практике, но и в теоретическом плане, потому что в таком течении возникает очень сложная анизотропная турбулентность с зонами рециркуляции и изучение протекающих процессов позволяет найти ответ на многие вопросы по турбулентности. Рассматриваемое течение хорошо изучено экспериментально. Поэтому она является очень сложной и интересной тестовой задачей для моделей турбулентности. В работе сравниваются численные результаты однопараметрической модели νt-92, метода рейнольдсовых напряжений SSG/LRR-RSM-w2012 и новой двухжидкостной модели. Эти модели очень сильно отличаются между собой, потому что в однопараметрической модели νt-92 используется гипотеза Буссинеска, в модели SSG/LRR-RSM-w2012 для каждого напряжения записывается свое уравнение, а для новой двухжидкостной модели основой является совершенно иной подход к турбулентности. Особенностью подхода к турбулентности для новой двухжидкостной модели заключается в том, что он позволяет получить замкнутую систему уравнений. Сравнение этих моделей проводится не только по соответствию их результатов экспериментальным данным, но и по вычислительным ресурсам, расходуе- мым на численные реализации этих моделей. Поэтому в работе для всех моделей использована одинаковая методика для численного расчета турбулентного закрученного потока при числе Рейнольдса $Re = 3 \cdot 10^4$ и параметре закрутки $S_w=0.6$. В работе показано, что новая двухжидкостная модель является эффективной для исследования турбулентных течений, так как имеет хорошую точность в описании сложных анизотропных турбулентных потоков и достаточно проста для численной реализации.
Ключевые слова: закрученные потоки, осредненные по Рейнольдсу уравнения Навье–Стокса, модель SSG/LRR-RSM-w2012, модель νt-92, новая двухжидкостная модель, прогонка, SIMPLE.
Study of turbulence models for calculating a strongly swirling flow in an abrupt expanding channel
Computer Research and Modeling, 2021, v. 13, no. 4, pp. 793-805In this paper, compared fundamentally different turbulence models for calculating a strongly swirling flow in an abrupt expanding pipe. This task is not only of great importance in practice, but also in theoretical terms. Because in such a flow a very complex anisotropic turbulence with recirculation zones arises and the study of the ongoing processes allows us to find an answer to many questions about turbulence. The flow under consideration has been well studied experimentally. Therefore, it is a very complex and interesting test problem for turbulence models. In the paper compared the numerical results of the one-parameter vt-92 model, the SSG/LRR-RSMw2012 Reynolds stress method and the new two-fluid model. These models are very different from each other. Because the Boussinesq hypothesis is used in the one-parameter vt-92 model, in the SSG/LRR-RSM-w2012 model, its own equation is written for each stress, and for the new two-fluid model, the basis is a completely different approach to turbulence. A feature of the approach to turbulence for the new two-fluid model is that it allows one to obtain a closed system of equations. Comparison of these models is carried out not only by the correspondence of their results with experimental data, but also by the computational resources expended on the numerical implementation of these models. Therefore, in this work, for all models, the same technique was used to numerically calculate the turbulent swirling flow at the Reynolds number $Re=3\cdot 10^4$ and the swirl parameter $S_w=0.6$. In the paper showed that the new two-fluid model is effective for the study of turbulent flows, because has good accuracy in describing complex anisotropic turbulent flows and is simple enough for numerical implementation.
-
Извлечение нечетких знаний при разработке экспертных прогнозных диагностических систем
Компьютерные исследования и моделирование, 2022, т. 14, № 6, с. 1395-1408Экспертные системы имитируют профессиональный опыт и мыслительный процесс специалиста при решении задач в различных предметных областях, в том числе в прогнозной диагностике в медицине и технике. При решении подобных задач применяются нечеткие модели принятия решений, что позволяет использовать профессиональные экспертные знания при формировании прогноза, исключая анализ данных непосредственных экспериментов. При построении нечетких моделей принятия решений используются типовые нечеткие ситуации, анализ которых позволяет сделать вывод специалистам о возникновении в будущем времени нештатных ситуаций. При разработке базы знаний экспертной системы прибегают к опросу экспертов: инженеры по знаниям используют мнение экспертов для оценки соответствия между типовой текущей ситуацией и риском возникновения чрезвычайной ситуации в будущем. В большинстве работ рассматриваются методы извлечения знаний с точки зрения психологических, лингвистических аспектов. Множественные исследования по священы проблемам контактного, процедурного или когнитивного слоев процесса извлечения знаний. Однако в процессе извлечения знаний следует отметить значительную трудоемкость процесса взаимодействия инженеров по знаниям с экспертами при определении типовых нечетких ситуаций и оценок рисков нештатных ситуаций. Причиной трудоемкости является то, что число вопросов, на которые должен ответить эксперт, очень велико. В статье обосновывается метод, который позволяет инженеру по знаниям сократить количество вопросов, задаваемых эксперту, а следовательно, снизить трудоемкость разработки базы знаний. Метод предполагает наличие отношения предпочтения, определяемое на множестве нечетких ситуаций, что позволяет частично автоматизировать формирование оценок частоты наступленияне четких ситуаций и тем самым сократить трудоемкость созданий базы знаний. Для подтверждения проверки и целесообразности предложенного метода проведены модельные эксперименты, результаты которых приведены в статье. На основе предложенного метода разработаны и внедрены в эксплуатацию несколько экспертных систем для прогнозирования групп риска патологий беременных и новорожденных.
Ключевые слова: экспертная система, извлечение знаний, лингвистическая переменная, степень принадлежности, нечеткое правило.
Fuzzy knowledge extraction in the development of expert predictive diagnostic systems
Computer Research and Modeling, 2022, v. 14, no. 6, pp. 1395-1408Expert systems imitate professional experience and thinking process of a specialist to solve problems in various subject areas. An example of the problem that it is expedient to solve with the help of the expert system is the problem of forming a diagnosis that arises in technology, medicine, and other fields. When solving the diagnostic problem, it is necessary to anticipate the occurrence of critical or emergency situations in the future. They are situations, which require timely intervention of specialists to prevent critical aftermath. Fuzzy sets theory provides one of the approaches to solve ill-structured problems, diagnosis-making problems belong to which. The theory of fuzzy sets provides means for the formation of linguistic variables, which are helpful to describe the modeled process. Linguistic variables are elements of fuzzy logical rules that simulate the reasoning of professionals in the subject area. To develop fuzzy rules it is necessary to resort to a survey of experts. Knowledge engineers use experts’ opinion to evaluate correspondence between a typical current situation and the risk of emergency in the future. The result of knowledge extraction is a description of linguistic variables that includes a combination of signs. Experts are involved in the survey to create descriptions of linguistic variables and present a set of simulated situations.When building such systems, the main problem of the survey is laboriousness of the process of interaction of knowledge engineers with experts. The main reason is the multiplicity of questions the expert must answer. The paper represents reasoning of the method, which allows knowledge engineer to reduce the number of questions posed to the expert. The paper describes the experiments carried out to test the applicability of the proposed method. An expert system for predicting risk groups for neonatal pathologies and pregnancy pathologies using the proposed knowledge extraction method confirms the feasibility of the proposed approach.
-
Особенности движения кинков ДНК при асинхронном включении/выключении постоянного и периодического полей
Компьютерные исследования и моделирование, 2018, т. 10, № 4, с. 545-558Исследование влияния внешних полей на живые системы — одно их наиболее интересных и быстро развивающихся направлений современной биофизики. Однако механизмы такого воздействия до сих пор не совсем ясны. Один из подходов к изучению этого вопроса связывают с моделированием взаимодействия внешних полей с внутренней подвижностью биологических объектов. В настоящей работе этот подход применяется для исследования влияния внешних полей на движение локальных конформационных возмущений — кинков в молекуле ДНК. Понимая и учитывая, что в целом такая задача тесно связана с задачей о механизмах регуляции процессов жизнедеятельности клеток и клеточных систем, мы поставили задачу — исследовать физические механизмы, регулирующие движение кинков, а также ответить на вопрос, могут ли постоянные и периодические поля выступать в роли регуляторов этого движения. В работе рассматривается самый общий случай, когда постоянные и периодические поля включаются и выключаются асинхронно. Детально исследованы три варианта асинхронного включения/выключения. В первом варианте интервалы (или диапазоны) действия постоянного и периодического полей не перекрываются, во втором — перекрываются, а третьем — интервалы вложены друг в друга. Расчеты выполнялись для последовательности плазмиды pTTQ18. Движение кинков моделировалось уравнением МакЛафлина–Скотта, а коэффициенты этого уравнения рассчитывались в квазиоднородном приближении. Численные эксперименты показали, что постоянные и периодические поля оказывают существенное влияние на характер движения кинка и регулируют его. Так, включение постоянного поля приводит к быстрому увеличению скорости кинка и установлению стационарной скорости движения, а включение периодического поля приводит к установившимся колебаниям кинка с частотой внешнего периодического поля. Показано, что поведение кинка зависит от взаимного расположения диапазонов действия внешних полей. Причем, как оказалось, события, происходящие в одном диапазоне, могут оказывать влияние на события в другом временном диапазоне даже в том случае, когда диапазоны расположены достаточно далеко друг от друга. Показано, что перекрывание диапазонов действия постоянного и периодического полей приводит к значительному увеличению пути, проходимому кинком до полной остановки. Максимальный рост пути наблюдается в случае вложенных друг в друга диапазонов. В заключении обсуждается вопрос о том, как полученные модельные результаты могут быть связаны с важнейшей задачей биологии — задачей о механизмах регуляции процессов жизнедеятельности клеток и клеточных систем.
Ключевые слова: уравнение МакЛафлина–Скотта, кинки ДНК, действие внешних полей, асинхронное включение/выключение.
Features of the DNA kink motion in the asynchronous switching on and off of the constant and periodic fields
Computer Research and Modeling, 2018, v. 10, no. 4, pp. 545-558Просмотров за год: 29. Цитирований: 1 (РИНЦ).Investigation of the influence of external fields on living systems is one of the most interesting and rapidly developing areas of modern biophysics. However, the mechanisms of such an impact are still not entirely clear. One approach to the study of this issue is associated with modeling the interaction of external fields with internal mobility of biological objects. In this paper, this approach is used to study the effect of external fields on the motion of local conformational distortions — kinks, in the DNA molecule. Realizing and taking into account that on the whole this task is closely connected with the problem of the mechanisms of regulation of vital processes of cells and cellular systems, we set the problem — to investigate the physical mechanisms regulating the motion of kinks and also to answer the question whether permanent and periodic fields can play the role of regulators of this movement. The paper considers the most general case, when constant and periodic fields are switching on and off asynchronously. Three variants of asynchronous switching on/off are studied in detail. In the first variant, the time intervals (or diapasons) of the actions of the constant and periodic fields do not overlap, in the second — overlap, and in the third — the intervals are putting in each other. The calculations were performed for the sequence of plasmid pTTQ18. The kink motion was modeled by the McLaughlin–Scott equation, and the coefficients of the equation were calculated in a quasi-homogeneous approximation. Numerical experiments showed that constant and periodic fields exert a significant influence on the character of the kink motion and regulate it. So the switching on of a constant field leads to a rapid increase of the kink velocity and to the establishment of a stationary velocity of motion, and the switching on of a periodic field leads to the steady oscillations of the kink with the frequency of the external periodic field. It is shown that the behavior of the kink depends on the mutual arrangement of the diapasons of the action of the external fields. As it turned out, events occurring in one of the two diapasons can affect the events in the other diapason, even when the diapasons are sufficiently far apart. It is shown that the overlapping of the diapasons of action of the constant and periodic fields leads to a significant increase in the path traversed by the kink to a complete stop. Maximal growth of the path is observed when one diapason is putting in each other. In conclusion, the question of how the obtained model results could be related to the most important task of biology — the problem of the mechanisms of regulation of the processes of vital activity of cells and cellular systems is discussed.
-
Технология формирования каталога информационного фонда
Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 661-673В статье рассматривается подход совершенствования технологий обработки информации на основе логико-семантической сети (ЛСС) «Вопрос–ответ–реакция», направленный на формирование и поддержку каталожной службы, обеспечивающей эффективный поиск ответов на вопросы [Большой энциклопедический словарь, 1998; Касавин, 2009]. В основу такой каталожной службы положены семантические связи, отражающие логику изложения авторской мысли в рамках данной публикации, темы, предметной области. Структурирование и поддержка этих связей позволят работать с полем смыслов, обеспечив новые возможности для исследования корпуса документов электронных библиотек (ЭБ) [Касавин, 2009]. Формирование каталога информационного фонда (ИФ) включает: формирование лексического словаря ИФ; построение дерева классификации ИФ по нескольким основаниям; классификация ИФ по вопросно-ответным темам; формирование поисковых запросов, адекватных дереву классификации вопросно-ответных тем (таблица соответствия «запрос → ответ ↔ {вопрос–ответ–реакция}»); автоматизированный поиск запросов по тематическим поисковым машинам; анализ ответов на запросы; поддержка каталога ЛСС на этапе эксплуатации (пополнение и уточнение каталога). Технология рассматривается для двух ситуаций: 1) ИФ уже сформирован; 2) ИФ отсутствует, его необходимо создать.
Ключевые слова: информационный фонд, Большие Данные, информационный поиск, пертинентность, навигация, информационно-поисковая система, семантические связи, логико-семантическая сеть «вопрос–ответ–реакция».
Cataloging technology of information fund
Computer Research and Modeling, 2015, v. 7, no. 3, pp. 661-673Просмотров за год: 3.The article discusses the approach to the improvement of information processing technology on the basis of logical-semantic network (LSN) Question–Answer–Reaction aimed at formation and support of the catalog service providing efficient search of answers to questions.
The basis of such a catalog service are semantic links, reflecting the logic of presentation of the author's thoughts within the framework this publication, theme, subject area. Structuring and support of these links will allow working with a field of meanings, providing new opportunities for the study the corps of digital libraries documents. Cataloging of the information fund includes: formation of lexical dictionary; formation of the classification tree for several bases; information fund classification for question–answer topics; formation of the search queries that are adequate classification trees the question–answer; automated search queries on thematic search engines; analysis of the responses to queries; LSN catalog support during the operational phase (updating and refinement of the catalog). The technology is considered for two situations: 1) information fund has already been formed; 2) information fund is missing, you must create it.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"





