Все выпуски
- 2026 Том 18
- 2025 Том 17
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Ресурсно-адаптивный подход к разметке текстовых данных в структурированном виде с использованием малых языковых моделей
Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 41-59В данной работе проведено экспериментальное исследование применения автоматической разметки текстовых данных в формате «вопрос – ответ» (QA-пары) в условиях ограниченных вычислительных ресурсов и требований к защите данных. В отличие от традиционных подходов, основанных на жестких правилах или использовании внешних API, предложено применять малые языковые модели с небольшим количеством параметров, способные функционировать локально без GPU на стандартных CPU-системах. Для тестирования были выбраны две модели: Gemma-3-4b и Qwen-2.5-3b (квантованные 4-битные версии), а в качестве исходного материала использован корпус документов с четкой структурой и формально-строгим стилем изложения. Разработана система автоматической аннотации, реализующая полный цикл генерации QA-датасета: автоматическое разбиение исходного документа на логически связные фрагменты, формирование пар «вопрос – ответ» моделью Gemma-3-4b, предварительная проверка их корректности с использованием Qwen-2.5-3b с опорой на доказательный фрагмент из контекста и экспертной оценкой качества. Экспорт полученных результатов предоставляется в формате JSONL. Оценка производительности охватывает всю систему генерации QA-пар, включая обработку фрагментов локальной языковой моделью, модули предобработки и постобработки текста. Производительность измеряется по времени генерации одной QA-пары, общей пропускной способности системы, использованию оперативной памяти и загрузке процессора, что позволяет объективно оценить вычислительную эффективность предлагаемого подхода при запуске на CPU. Эксперимент на расширенной выборке из 12 документов показал, что автоматическая аннотация демонстрирует устойчивую производительность при обработке документов различных типов, тогда как ручная разметка характеризуется существенно большими временными затратами и высокой вариативностью. В зависимости от типа документа ускорение аннотации по сравнению с ручным процессом составляет от 8 до 14 раз. Анализ качества показал, что большинство сгенерированных QA-пар обладают высокой семантической согласованностью с исходным контекстом, при этом лишь ограниченная доля данных требует экспертной корректировки или исключения. Хотя полная ручная валидация корпуса (золотой стандарт) в рамках работы не проводилась, сочетание автоматической оценки и выборочной экспертной проверки позволяет рассматривать полученный уровень качества как приемлемый для задач предварительной автоматизированной аннотации. В целом результаты подтверждают практическую применимость малых языковых моделей для построения автономных и воспроизводимых систем автоматической разметки текстов в условиях ограниченных вычислительных ресурсов и создают основу для дальнейших исследований в области эффективной подготовки обучающих корпусов для задач обработки естественного языка.
-
Модель клеточных автоматов для описания смешанного потока легковых и грузовых автомобилей на многополосных магистралях
Компьютерные исследования и моделирование, 2026, т. 18, № 1, с. 61-80Целью настоящей статьи является разработка модели для реалистичного описания смешанного потока автомобилей двух типов (легковые и грузовые автомобили) на многополосных магистралях с учетом не только различия в технических характеристиках транспортных средств (габариты, максимальная скорость), но также различия в стратегиях вождения. Статья включает обзор литературы, в том числе публикаций последних лет, подтверждающий актуальность моделирования неоднородных транспортных потоков.
Новая модель учитывает, что грузовики имеют более низкую (по сравнению с легковыми автомобилями) максимальную скорость и медленнее стартуют с места. Они менее маневренные, поэтому перестраиваться им сложнее. Кроме того, движение грузовиков может регламентироваться некоторыми ограничивающими правилами, например запретом движения по левым полосам.
Модель основана на теории клеточных автоматов, что позволяет всесторонне описывать особенности отдельных компонент потока. На каждом шаге по времени состояние ячеек автомата обновляется в два этапа: перестроение и движение вперед. Алгоритмы обоих подшагов отличаются для легковых и грузовых транспортных средств. Каждому автомобилю присваивается ряд параметров: вид транспортного средства, длина, максимальная скорость, стратегия при смене полосы, стратегия при движении по полосе.
Модель реализована в виде комплекса программ, позволяющего моделировать движение на различных участках улично-дорожной сети — перекрестках, участках с сужением и расширением дороги, въездах и съездах с автомагистрали. В рамках данной работы для тестирования модели выбраны участок дороги с переменным числом полос и прямой многополосный участок с виртуальным детектором. Результаты представлены в виде локальных диаграмм «скорость – плотность» и «поток – плотность», а также пространственно-временных диаграмм скорости.
Для апробации модели решается ряд задач с различным процентным составом легковых и грузовых транспортных средств, что позволяет продемонстрировать падение пропускной способности элементов улично-дорожной сети при увеличении доли грузовиков в потоке. Моделируется равномерное распределение грузовиков по полосам и движение грузовиков только по правой полосе. Иллюстрируется положительный эффект от введения ограничений на движение грузовиков по левым полосам на многополосной магистрали.
-
Определение характеристик случайного процесса путем сравнения со значениями на основе моделей законов распределения
Компьютерные исследования и моделирование, 2025, т. 17, № 6, с. 1105-1118Эффективность систем связи и передачи данных (ССиПД), являющихся неотъемлемой составляющей современных систем практически в любой области науки и техники, во многом зависит от стабильности частоты формируемых сигналов. Формируемые в ССиПД сигналы могут рассматриваться как процессы, частота которых изменяется под действием совокупности внешних воздействий. Изменение частоты сигналов приводит к уменьшению отношения «сигнал/шум» (ОСШ) и, соответственно, ухудшению характеристик ССиПД, таких как вероятность битовой ошибки, пропускная способность. Описание таких изменений частоты сигналов наиболее удобно рассматривать как случайные процессы, аппарат которых находит широкое применение при построении математических моделей, описывающих функционирование систем и устройств в различных областях науки и техники. При этом во многих случаях характеристики случайного процесса, такие как закон распределения, математическое ожидание и дисперсия, могут являться неизвестными или известными с погрешностями, не позволяющими получить приемлемые по точности оценки параметров сигналов. В статье предлагается алгоритм решения задачи по определению характеристик случайного процесса (частоты сигнала) на основе набора отсчетов его частоты, позволяющих определить выборочное среднее, выборочную дисперсию и закон распределения отклонений частоты в генеральной совокупности. Основой данного алгоритма является сравнение измеренных на некотором временном интервале значений наблюдаемого случайного процесса с набором того же количества случайных значений, сформированных на основе модельных законов распределения. В качестве модельных законов распределения могут рассматриваться законы распределения, принятые на основе математических моделей этих систем и устройств или соответствующие аналогичным системам и устройствам. В качестве математического ожидания и дисперсии при формировании набора случайных значений для принятого модельного закона распределения принимаются выборочные среднее значение и дисперсия, полученные по результатам измерений наблюдаемого случайного процесса. Особенность алгоритма заключается в проведении сравнения упорядоченных по возрастанию или убыванию измеренных значений наблюдаемого случайного процесса и сформированных наборов значений в соответствии с принятыми моделями законов распределения. Приведены результаты математического моделирования, иллюстрирующие применение данного алгоритма.
-
Моделирование межпроцессорного взаимодействия при выполнении MPI-приложений в облаке
Компьютерные исследования и моделирование, 2017, т. 9, № 6, с. 955-963Просмотров за год: 10. Цитирований: 1 (РИНЦ).В Лаборатории информационных технологий (ЛИТ) Объединенного института ядерных исследований (ОИЯИ) планируется создание облачного центра параллельных вычислений, что позволит существенно повысить эффективность выполнения численных расчетов и ускорить получение новых физически значимых результатов за счет более рационального использования вычислительных ресурсов. Для оптимизации схемы параллельных вычислений в облачной среде эту схему необходимо протестировать при различных сочетаниях параметров оборудования (количества и частоты процессоров, уровней распараллеливания, пропускной способности коммуникационной сети и ее латентности). В качестве тестовой была выбрана весьма актуальная задача параллельных вычислений длинных джозефсоновских переходов (ДДП) с использованием технологии MPI. Проблемы оценки влияния вышеуказанных факторов вычислительной среды на скорость параллельных вычислений тестовой задачи было предложено решать методом имитационного моделирования, с использованием разработанной в ЛИТ моделирующей программы SyMSim.
Работы, выполненные по имитационному моделированию расчетов ДДП в облачной среде с учетом межпроцессорных соединений, позволяют пользователям без проведения серии тестовых запусков в реальной компьютерной обстановке подобрать оптимальное количество процессоров при известном типе сети, характеризуемой пропускной способностью и латентностью. Это может существенно сэкономить вычислительное время на счетных ресурсах, высвободив его для решения реальных задач. Основные параметры модели были получены по результатам вычислительного эксперимента, проведенного на специальном облачном полигоне для MPI-задач из 10 виртуальных машин, взаимодействующих между собой через Ethernet-сеть с пропускной способностью 10 Гбит/с. Вычислительные эксперименты показали, что чистое время вычислений спадает обратно пропорционально числу процессоров, но существенно зависит от пропускной способности сети. Сравнение результатов, полученных эмпирическим путем, с результатами имитационного моделирования показало, что имитационная модель корректно моделирует параллельные расчеты, выполненные с использованием технологии MPI, и подтвердило нашу рекомендацию, что для быстрого счета задач такого класса надо одновременно с увеличением числа процессоров увеличивать пропускную способность сети. По результатам моделирования удалось вывести эмпирическую аналитическую формулу, выражающую зависимость времени расчета от числа процессоров при фиксированной конфигурации системы. Полученная формула может применяться и для других подобных исследований, но требует дополнительных тестов по определению значений переменных.
-
Обоснование связи модели Бэкмана с вырождающимися функциями затрат с моделью стабильной динамики
Компьютерные исследования и моделирование, 2022, т. 14, № 2, с. 335-342С 50-х годов XX века транспортное моделирование крупных мегаполисов стало усиленно развиваться. Появились первые модели равновесного распределения потоков по путям. Наиболее популярной (и использующейся до сих пор) моделью была модель Бэкмана и др. 1955 г. В основу этой модели положены два принципа Вардропа. На современном теоретико-игровом языке можно кратко описать суть модели как поиск равновесия Нэша в популяционной игре загрузки, в которой потери игроков (водителей) рассчитываются исходя из выбранного пути и загрузках на этом пути, при фиксированных корреспонденциях. Загрузки (затраты) на пути рассчитываются как сумма затрат на различных участках дороги (ребрах графа транспортной сети). Затраты на ребре (время проезда по ребру) определяется величиной потока автомобилей на этом ребре. Поток на ребре, в свою очередь, определяется суммой потоков по всем путям, проходящим через заданное ребро. Таким образом, затраты на проезд по пути определяются не только выбором пути, но и тем, какие пути выбрали остальные водители. Таким образом, мы находимся в стандартной теоретико-игровой постановке. Специфика формирования функций затрат позволяет сводить поиск равновесия к решению задачи оптимизации (игра потенциальная). Эта задача оптимизации будет выпуклой, если функции затрат монотонно неубывающие. Собственно, различные предположения о функциях затрат формируют различные модели. Наиболее популярной моделью является модель с функцией затрат BPR. Такие функции используются при расчетах реальных городов повсеместно. Однако в начале XXI века Ю. Е. Нестеровым и А. де Пальмой было показано, что модели типа Бэкмана имеют серьезные недостатки. Эти недостатки можно исправить, используя модель, которую авторы назвали моделью стабильной динамики. Поиск равновесия в такой модели также сводится к задаче оптимизации. Точнее, даже задаче линейного программирования. В 2013 г. А. В. Гасниковым было обнаружено, что модель стабильной ди- намики может быть получена предельным переходом, связанным с поведением функции затрат, из модели Бэкмана. Однако обоснование упомянутого предельного перехода было сделано в нескольких важных (для практики), но все- таки частных случаях. В общем случае вопрос о возможности такого предельного перехода, насколько нам известно, остается открытым. Данная работа закрывает данный зазор. В статье в общем случае приводится обоснование возможности отмеченного предельного перехода (когда функция затрат на проезд по ребру как функция потока по ребру вырождается в функцию, равную постоянным затратам до достижения пропускной способности, и равна плюс бесконечности, при превышении пропускной способности).
-
Снижение частоты промахов в неинклюзивный кэш с инклюзивным справочником многоядерного процессора
Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 639-656Хотя эпоха экспоненциального роста производительности компьютерных микросхем закончилась, даже настольные процессоры общего назначения сегодня имеют 16 и больше ядер. Поскольку пропускная способность памяти DRAM растет не с такой скоростью, как вычислительная мощность ядер, разработчики процессоров должны искать пути уменьшения частоты обменов с памятью на одну инструкцию. Непосредственным путем к этому является снижение частоты промахов в кэш последнего уровня. Предполагая уже реализованной схему «неинклюзивный кэш с инклюзивным справочником» (NCID), три способа дальнейшего снижения частоты промахов были исследованы.
Первый способ — это достижение более равномерного использования банков и наборов кэша применением хэш-функций для интерливинга и индексирования. В экспериментах в тестах SPEC CPU2017 refrate, даже простейшие хэш-функции на основе XOR показали увеличение производительности на 3,2%, 9,1% и 8,2% в конфигурациях процессора с 16, 32 и 64 ядрами и банками общего кэша, сравнимое с результатами для более сложных функций на основе матриц, деления и CRC.
Вторая оптимизация нацелена на уменьшение дублирования на разных уровнях кэшей путем автоматического переключения на эксклюзивную схему, когда она выглядит оптимальной. Известная схема этого типа, FLEXclusion, была модифицирована для использования в NCID-кэшах и показала улучшение производительности в среднемна 3,8%, 5,4% и 7,9% для 16-, 32- и 64-ядерных конфигураций.
Третьей оптимизацией является увеличение фактической емкости кэша использованием компрессии. Частота сжатия недорогим и быстрыма лгоритмом B DI*-HL (Base-Delta-Immediate Modified, Half-Line), разработанным для NCID, была измерена, и соответствующее увеличение емкости кэша дало около 1% среднего повышения производительности.
Все три оптимизации могут сочетаться и продемонстрировали прирост производительности в 7,7%, 16% и 19% для конфигураций с 16, 32 и 64 ядрами и банками соответственно.
-
Задача вычисления траектории с равномерным распределением ответов
Компьютерные исследования и моделирование, 2014, т. 6, № 5, с. 803-828Рассматривается новая серия тестов, предназначенных для выявления способности человека к параллельным вычислениям. В отличие от задач, рассмотренных в предыдущих работах, в новых сериях ответы распределены статистически равномерно. Это упрощает анализ полученных результатов и уменьшает оценку статистической погрешности. Новые экспериментальные данные близки к результатам, полученным в предыдущих опытах.
Ключевые слова: инженерная психология, параллельные вычисления, тестирование, пропускная способность.Цитирований: 3 (РИНЦ).
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"





