Текущий выпуск Номер 1, 2026 Том 18

Все выпуски

Результаты поиска по 'GPU':
Найдено статей: 11
  1. От редакции
    Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 5-8
    Editor’s note
    Computer Research and Modeling, 2026, v. 18, no. 1, pp. 5-8
  2. Кузьмин И.М., Тонков Л.Е., Копысов С.П.
    Алгоритмическое и программное обеспечение решения задач взаимодействия конструкции с жидкостью/газом на гибридных вычислительных системах
    Компьютерные исследования и моделирование, 2013, т. 5, № 2, с. 153-164

    Рассматривается создание прикладного программного интерфейса с выделением самостоятельного приложения для синхронизации и обмена данными, в котором реализуются отдельные подзадачи связывания для решения сопряженных задач взаимодействия конструкции с жидкостью или газом. Обсуждаются алгоритмы связывания подзадач и деформирования расчетных сеток. На численных примерах показывается возможность решения ряда задач на кластерах с графическими процессорами.

    Kuz'min I.M., Tonkov L.E., Kopysov S.P.
    Algorithms and Software for Solving Coupled Fluid-Structure Interaction Problems on Hybrid HPC Platform
    Computer Research and Modeling, 2013, v. 5, no. 2, pp. 153-164

    In this paper, we propose a new software for simulation of fluid-structure interaction. The software is designed for solving coupled problems and provides an interface for synchronization synchronisation and data exchange between existing fluid and structural solvers. Algorithms of coupling solvers and mesh deformation are discussed. The software can be used on hybrid CPU/GPU platforms.

    Просмотров за год: 1. Цитирований: 11 (РИНЦ).
  3. Антипова С.А., Журкин А.М.
    Ресурсно-адаптивный подход к разметке текстовых данных в структурированном виде с использованием малых языковых моделей
    Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 41-59

    В данной работе проведено экспериментальное исследование применения автоматической разметки текстовых данных в формате «вопрос – ответ» (QA-пары) в условиях ограниченных вычислительных ресурсов и требований к защите данных. В отличие от традиционных подходов, основанных на жестких правилах или использовании внешних API, предложено применять малые языковые модели с небольшим количеством параметров, способные функционировать локально без GPU на стандартных CPU-системах. Для тестирования были выбраны две модели: Gemma-3-4b и Qwen-2.5-3b (квантованные 4-битные версии), а в качестве исходного материала использован корпус документов с четкой структурой и формально-строгим стилем изложения. Разработана система автоматической аннотации, реализующая полный цикл генерации QA-датасета: автоматическое разбиение исходного документа на логически связные фрагменты, формирование пар «вопрос – ответ» моделью Gemma-3-4b, предварительная проверка их корректности с использованием Qwen-2.5-3b с опорой на доказательный фрагмент из контекста и экспертной оценкой качества. Экспорт полученных результатов предоставляется в формате JSONL. Оценка производительности охватывает всю систему генерации QA-пар, включая обработку фрагментов локальной языковой моделью, модули предобработки и постобработки текста. Производительность измеряется по времени генерации одной QA-пары, общей пропускной способности системы, использованию оперативной памяти и загрузке процессора, что позволяет объективно оценить вычислительную эффективность предлагаемого подхода при запуске на CPU. Эксперимент на расширенной выборке из 12 документов показал, что автоматическая аннотация демонстрирует устойчивую производительность при обработке документов различных типов, тогда как ручная разметка характеризуется существенно большими временными затратами и высокой вариативностью. В зависимости от типа документа ускорение аннотации по сравнению с ручным процессом составляет от 8 до 14 раз. Анализ качества показал, что большинство сгенерированных QA-пар обладают высокой семантической согласованностью с исходным контекстом, при этом лишь ограниченная доля данных требует экспертной корректировки или исключения. Хотя полная ручная валидация корпуса (золотой стандарт) в рамках работы не проводилась, сочетание автоматической оценки и выборочной экспертной проверки позволяет рассматривать полученный уровень качества как приемлемый для задач предварительной автоматизированной аннотации. В целом результаты подтверждают практическую применимость малых языковых моделей для построения автономных и воспроизводимых систем автоматической разметки текстов в условиях ограниченных вычислительных ресурсов и создают основу для дальнейших исследований в области эффективной подготовки обучающих корпусов для задач обработки естественного языка.

    Antipova S.A., Zhurkin A.M.
    Resource-adaptive approach to structured text data annotation using small language models
    Computer Research and Modeling, 2026, v. 18, no. 1, pp. 41-59

    This paper presents an experimental study of the application of automatic annotation of text data in the question – answer format (QA pairs) under conditions of limited computing resources and data protection requirements. Unlike traditional approaches based on rigid rules or the use of external APIs, we propose using small language models with a small number of parameters that can function locally without a GPU on standard CPU systems. Two models were selected for testing — Gemma-3-4b and Qwen-2.5-3b (quantized 4-bit versions) — and a corpus of documents with a clear structure and a formally rigorous style of presentation was used as source material. An automatic annotation system was developed that implements the full cycle of QA dataset generation: automatic division of the source document into logically connected fragments, formation of “question – answer” pairs using the Gemma-3-4b model, preliminary verification of their correctness using Qwen-2.5-3b based on evidence span from the context and expert quality assessment. The results are exported in JSONL format. Performance evaluation covers the entire QA pair generation system, including fragment processing by the local language model, text preprocessing and postprocessing modules. Performance is measured by the time it takes to generate a single QA pair, the total throughput of the system, RAM usage, and CPU load, which allows for an objective assessment of the computational efficiency of the proposed approach when running on a CPU. An experiment on an extended sample of 12 documents showed that automatic annotation demonstrates stable performance when processing different types of documents, while manual annotation is characterized by significantly higher time costs and high variability. Depending on the type of document, the acceleration of annotation compared to the manual process ranges from 8 to 14 times. Quality analysis showed that most of the generated QA pairs have high semantic consistency with the original context, with only a limited proportion of data requiring expert correction or exception. Although full manual validation of the corpus (the “gold standard”) was not performed as part of this work, the combination of automatic evaluation and selective expert review allows us to consider the resulting quality level acceptable for preliminary automated annotation tasks. Overall, the results confirm the practical applicability of small language models for building autonomous and reproducible automatic text annotation systems under limited computational resources and provide a basis for further research in the field of effective training corpus preparation for natural language processing tasks.

  4. Джораев А.Р.
    Гибридные вычислительные системы на основе GPU для задач биоинформатики
    Компьютерные исследования и моделирование, 2010, т. 2, № 2, с. 163-167

    Статья посвящена преимуществам применения гибридных вычислительных систем на основе графических процессоров NVIDIA для решения задач моделирования молекулярной динамики, квантовой химии, секвенирования, приведены примеры приложений.

    Dzhoraev A.R.
    GPU-accelerated hybrid systems for high-performance computing in bio-informatics
    Computer Research and Modeling, 2010, v. 2, no. 2, pp. 163-167

    Modern GPUs are massively-parallel processors, offering substantial amount of computational power in energy-efficient package. We discuss the benefits of utilizing this computing power for modeling problems in bio-informatics, such as molecular dynamics, quantum chemistry and sequence analysis.

    Просмотров за год: 2. Цитирований: 6 (РИНЦ).
  5. Казённов А.М.
    Основы технологии CUDA
    Компьютерные исследования и моделирование, 2010, т. 2, № 3, с. 295-308

    Рассказывается об истории развития технологии CUDA, о принципиальных её ограничениях. Статья предназначена для читателей, не знакомых с особенностями программирования графических процессоров, но желающих оценитьв озможности их использования для решения прикладных задач.

    Kazennov A.M.
    Basic concepts of CUDA technology
    Computer Research and Modeling, 2010, v. 2, no. 3, pp. 295-308

    The history of the development of CUDA technology and its fundamental limitations are discribed. The article is intended for those readers who are not familiar with graphics adapter programming features but want to evaluate the possibilities for GPU computing applications.

    Просмотров за год: 5. Цитирований: 4 (РИНЦ).
  6. Геллер О.В., Васильев М.О., Холодов Я.А.
    Построение высокопроизводительного вычислительного комплекса для моделирования задач газовой динамики
    Компьютерные исследования и моделирование, 2010, т. 2, № 3, с. 309-317

    Целью исследований является разработка программного комплекса для решения задач газовой динамики в многосвязных областях правильной геометрии на высокопроизводительной вычислительной системе. Сравниваются различные технологии реализации параллельных вычислений. Программный комплекс реализован на многопоточных параллельных системах, использующих для организации расчета как многоядерную архитектуру, так и массивно-параллельную. Проведено сравнение численных результатов на основе программного комплекса с известными решениями модельных задач. Проведено исследование производительности различных вычислительных платформ.

    Geller O.V., Vasilev M.O., Kholodov Y.A.
    Building a high-performance computing system for simulation of gas dynamics
    Computer Research and Modeling, 2010, v. 2, no. 3, pp. 309-317

    The aim of research is to develop software system for solving gas dynamic problem in multiply connected integration domains of regular shape by high-performance computing system. Comparison of the various technologies of parallel computing has been done. The program complex is implemented using multithreaded parallel systems to organize both multi-core and massively parallel calculation. The comparison of numerical results with known model problems solutions has been done. Research of performance of different computing platforms has been done.

    Просмотров за год: 5. Цитирований: 6 (РИНЦ).
  7. В данной статье исследуется эффективность применения технологии Retrieval-Augmented Generation (RAG) в сочетании с различными большими языковыми моделями (LLM) для поиска документов и получения информации в корпоративных информационных системах. Рассматриваются варианты использования LLM в корпоративных системах, архитектура RAG, характерные проблемы интеграции LLM в RAG-систему. Предлагается архитектура системы, включающая в себя векторный энкодер текстов и LLM. Энкодер используется для создания векторной базы данных, индексирующей библиотеку корпоративных документов. Запрос, передаваемый LLM, дополняется релевантным ему контекстом из библиотеки корпоративных документов, извлекаемым с использованием векторной базы данных и библиотеки FAISS. Большая языковая модель принимает запрос пользователя и формирует ответ на основе переданных в контексте запроса данных. Рассматриваются общая структура и алгоритм функционирования предлагаемого решения, реализующего архитектуру RAG. Обосновывается выбор LLM для исследования и проводится анализ результативности использования популярных LLM (ChatGPT, GigaChat, YandexGPT, Llama, Mistral, Qwen и др.) в качестве компонента для генерации ответов. На основе тестового набора вопросов методом экспертных оценок оцениваются точность, полнота, грамотность и лаконичность ответов, предоставляемых рассматриваемыми моделями. Анализируются характеристики отдельных моделей, полученные в результате исследования. Приводится информация о средней скорости отклика моделей. Отмечается существенное влияние объема доступной памяти графического адаптера на производительность локальных LLM. На основе интегрального показателя качества формируется общий рейтинг LLM. Полученные результаты подтверждают эффективность предложенной архитектуры RAG для поиска документов и получения информации в корпоративных информационных системах. Были определены возможные направления дальнейших исследований в этой области: дополнение контекста, передаваемого LLM, и переход к архитектуре на базе LLM-агентов. В заключении представлены рекомендации по выбору оптимальной конфигурации RAG и LLM для построения решений, обеспечивающих быстрый и точный доступ к информации в рамках корпоративных информационных систем.

    Antonov I.V., Bruttan I.V.
    Using RAG technology and large language models to search for documents and obtain information in corporate information systems
    Computer Research and Modeling, 2025, v. 17, no. 5, pp. 871-888

    This paper investigates the effectiveness of Retrieval-Augmented Generation (RAG) combined with various Large Language Models (LLMs) for document retrieval and information access in corporate information systems. We survey typical use-cases of LLMs in enterprise environments, outline the RAG architecture, and discuss the major challenges that arise when integrating LLMs into a RAG pipeline. A system architecture is proposed that couples a text-vector encoder with an LLM. The encoder builds a vector database that indexes a library of corporate documents. For every user query, relevant contextual fragments are retrieved from this library via the FAISS engine and appended to the prompt given to the LLM. The LLM then generates an answer grounded in the supplied context. The overall structure and workflow of the proposed RAG solution are described in detail. To justify the choice of the generative component, we benchmark a set of widely used LLMs — ChatGPT, GigaChat, YandexGPT, Llama, Mistral, Qwen, and others — when employed as the answer-generation module. Using an expert-annotated test set of queries, we evaluate the accuracy, completeness, linguistic quality, and conciseness of the responses. Model-specific characteristics and average response latencies are analysed; the study highlights the significant influence of available GPU memory on the throughput of local LLM deployments. An overall ranking of the models is derived from an aggregated quality metric. The results confirm that the proposed RAG architecture provides efficient document retrieval and information delivery in corporate environments. Future research directions include richer context augmentation techniques and a transition toward agent-based LLM architectures. The paper concludes with practical recommendations on selecting an optimal RAG–LLM configuration to ensure fast and precise access to enterprise knowledge assets.

  8. Жмуров А.А., Барсегов В.А., Трифонов С.В., Холодов Я.А., Холодов А.С.
    Эффективные генераторы псевдослучайных чисел при молекулярном моделировании на видеокартах
    Компьютерные исследования и моделирование, 2011, т. 3, № 3, с. 287-308

    Динамика Ланжевена, метод Монте-Карло и моделирование молекулярной динамики в неявном растворителе требуют больших массивов случайных чисел на каждом шаге расчета. Мы исследовали два подхода в реализации генераторов на графических процессорах. Первый реализует последовательный алгоритм генератора на каждом потоке в отдельности. Второй основан на возможности взаимодействия между потоками и реализует общий алгоритм на всех потоках в целом. Мы покажем использование этих подходов на примере алгоритмов Ran 2, Hybrid Taus и Lagged Fibonacci. Для проверки случайности полученных чисел мы использовали разработанные генераторы при моделировании динамики Ланжевена N независимых гармонических осцилляторов в термостате. Это позволило нам оценить статистические характеристики генераторов. Мы также исследовали производительность, использование памяти и ускорение, получаемое при переносе алгоритма с центрального на графический процессор.

    Zhmurov A.A., Barsegov V.A., Trifonov S.V., Kholodov Y.A., Kholodov A.S.
    Efficient Pseudorandom number generators for biomolecular simulations on graphics processors
    Computer Research and Modeling, 2011, v. 3, no. 3, pp. 287-308

    Langevin Dynamics, Monte Carlo, and all-atom Molecular Dynamics simulations in implicit solvent require a reliable source of pseudorandom numbers generated at each step of calculation. We present the two main approaches for implementation of pseudorandom number generators on a GPU. In the first approach, inherent in CPU-based calculations, one PRNG produces a stream of pseudorandom numbers in each thread of execution, whereas the second approach builds on the ability of different threads to communicate, thus, sharing random seeds across the entire device. We exemplify the use of these approaches through the development of Ran2, Hybrid Taus, and Lagged Fibonacci algorithms. As an application-based test of randomness, we carry out LD simulations of N independent harmonic oscillators coupled to a stochastic thermostat. This model allows us to assess statistical quality of pseudorandom numbers. We also profile performance of these generators in terms of the computational time, memory usage, and the speedup factor (CPU/GPU time).

    Просмотров за год: 11. Цитирований: 2 (РИНЦ).
  9. Богданов А.В., Ганкевич И.Г., Гайдучок В.Ю., Южанин Н.В.
    Запуск приложений на гибридном кластере
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 475-483

    Гибридный кластер подразумевает использование вычислительных ресурсов с различными архитектурами. Как правило, в таких системах используется CPU распространенной архитектуры (например, x86_64) и GPU (например, NVIDIA CUDA). Создание и эксплуатация подобного кластера требует определенного опыта: для того чтобы задействовать все вычислительные мощности такой системы и получить существенное ускорение на задачах, требуется учесть множество факторов. К таким факторам относятся как характеристики оборудования (например, особенности сетевой инфраструктуры, хранилища, архитектуры GPU), так и характеристики программного обеспечения (например, реализация MPI, библиотеки для работы с GPU). Таким образом для эффективных научных расчетов на подобных системах требуется помнить о характеристиках ускорителя (GPU), особенностях программного обеспечения, характеристиках задачи и о многих других факторах.

    В этой статье анализируются достоинства и недостатки гибридных вычислений. Будут приведены результаты запуска некоторых тестов и научных приложений, использующих GPGPU. Основное внимание уделено программных продуктах с открытым исходным кодом, которые поддерживают работу с GPGPU.

    Существует несколько подходов для организации гетерогенных вычислений. В данной статье мы рассмотрим приложения, использующие CUDA и OpenCL. CUDA довольно часто используется в подобных гибридных системах, в то время как переносимость OpenCL-приложений может сыграть решающую роль при выборе средства для разработки. Мы также уделим внимание системам с несколькими GPU, которые все чаще используются в рамках подобных кластеров. Вычисления проводились на гибридном кластере ресурсного центра «Вычислительный центр СПбГУ».

    Bogdanov A.V., Gankevich I.G., Gayduchok V.Yu., Yuzhanin N.V.
    Running applications on a hybrid cluster
    Computer Research and Modeling, 2015, v. 7, no. 3, pp. 475-483

    A hybrid cluster implies the use of computational devices with radically different architectures. Usually, these are conventional CPU architecture (e.g. x86_64) and GPU architecture (e. g. NVIDIA CUDA). Creating and exploiting such a cluster requires some experience: in order to harness all computational power of the described system and get substantial speedup for computational tasks many factors should be taken into account. These factors consist of hardware characteristics (e.g. network infrastructure, a type of data storage, GPU architecture) as well as software stack (e.g. MPI implementation, GPGPU libraries). So, in order to run scientific applications GPU capabilities, software features, task size and other factors should be considered.

    This report discusses opportunities and problems of hybrid computations. Some statistics from tests programs and applications runs will be demonstrated. The main focus of interest is open source applications (e. g. OpenFOAM) that support GPGPU (with some parts rewritten to use GPGPU directly or by replacing libraries).

    There are several approaches to organize heterogeneous computations for different GPU architectures out of which CUDA library and OpenCL framework are compared. CUDA library is becoming quite typical for hybrid systems with NVIDIA cards, but OpenCL offers portability opportunities which can be a determinant factor when choosing framework for development. We also put emphasis on multi-GPU systems that are often used to build hybrid clusters. Calculations were performed on a hybrid cluster of SPbU computing center.

    Просмотров за год: 4.
  10. Жмуров А.А., Алексеенко А.Е., Барсегов В.А., Кононова О.Г., Холодов Я.А.
    Фазовый переход от α-спиралей к β-листам в суперспиралях фибриллярных белков
    Компьютерные исследования и моделирование, 2013, т. 5, № 4, с. 705-725

    Изучен переход от α-структур к β-структурам под воздействием внешнего механического поля в молекуле фибрина, содержащей суперспирали, и разрешен ландшафт энергии. Проведено детальное теоретическое моделирование отдельных этапов процесса растяжения суперспирального фрагмента. На графиках зависимости силы (F) от растяжения молекулы (X) для тандема из двух симметричных суперспиралей фибрина (длина каждой ∼17 нм) видны три режима механического поведения: (1) линейный (упругий) режим, в котором суперспирали ведут себя как энтропийная пружина (F<100−125 пН и X<7−8 нм), (2) вязкий (пластичный) режим, в котором сила сопротивления молекулы не меняется с увеличением растяжения (F≈150 пН и X≈10−35 нм) и (3) нелинейный режим зависимости F от X (F>175−200 пН и X>40−50 нм). В линейном режиме суперспирали раскручиваются на угол в 2π радиан, но структурные изменения на уровне вторичной структуры не происходят. Вязкий режим сопровождается фазовым переходом от тройных α-спиралей к параллельным β-листам, в результате которого изменяется вторичная структура. Критическое растяжение α-спиралей составляет 0.25 нм на один виток, а характерное изменение энергии — 4.9 ккал/моль. Также были подсчитаны связанные с фазовым переходом изменения во внутренней энергии Δu, энтропии Δs и механической емкости cf из расчета на один виток α-спирали. Подобное динамическое поведение α-спиралей при растяжении белковых филаментов может являться универсальным механизмом регуляции фибриллярных α-спиральных белков в ответ на внешнее силовое воздействие, возникающее в результате действия биологических сил.

    Zhmurov A.A., Alekseenko A.E., Barsegov V.A., Kononova O.G., Kholodov Y.A.
    Phase transition from α-helices to β-sheets in supercoils of fibrillar proteins
    Computer Research and Modeling, 2013, v. 5, no. 4, pp. 705-725

    The transition from α-helices to β-strands under external mechanical force in fibrin molecule containing coiled-coils is studied and free energy landscape is resolved. The detailed theoretical modeling of each stage of coiled-coils fragment pulling process was performed. The plots of force (F) as a function of molecule expansion (X) for two symmetrical fibrin coiled-coils (each ∼17 nm in length) show three distinct modes of mechanical behaviour: (1) linear (elastic) mode when coiled-coils behave like entropic springs (F<100−125 pN and X<7−8 nm), (2) viscous (plastic) mode when molecule resistance force does not increase with increase in elongation length (F≈150 pN and X≈10−35 nm) and (3) nonlinear mode (F>175−200 pN and X>40−50 nm). In linear mode the coiled-coils unwind at 2π radian angle, but no structural transition occurs. Viscous mode is characterized by the phase transition from the triple α-spirals to three-stranded parallel β-sheet. The critical tension of α-helices is 0.25 nm per turn, and the characteristic energy change is equal to 4.9 kcal/mol. Changes in internal energy Δu, entropy Δs and force capacity cf per one helical turn for phase transition were also computed. The observed dynamic behavior of α-helices and phase transition from α-helices to β-sheets under tension might represent a universal mechanism of regulation of fibrillar protein structures subject to mechanical stresses due to biological forces.

    Просмотров за год: 6. Цитирований: 1 (РИНЦ).
Страницы: следующая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.