Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Численное решение двумерного нелинейного уравнения теплопроводности с использованием радиальных базисных функций
Компьютерные исследования и моделирование, 2022, т. 14, № 1, с. 9-22Работа посвящена численному решению задачи о движении тепловой волны для вырождающегося нелинейного уравнения второго порядка параболического типа с источником. Нелинейность уравнения обусловлена степенной зависимостью коэффициента теплопроводности от температуры. Рассматривается задача для случая двух пространственных переменных при краевом условии, задающем закон движения фронта тепловой волны. Предложен новый алгоритм решения на основе разложения по радиальным базисным функциям и метода граничных элементов. Решение строится по шагам по времени с разностной аппроксимацией по времени. На каждом шаге решается краевая задача для уравнения Пуассона, соответствующего исходному уравнению для фиксированного момента времени. Решение такой задачи строится итерационно в виде суммы частного решения, удовлетворяющего неоднородному уравнению, и решения соответствующего однородного уравнения, удовлетворяющего граничным условиям. Однородное уравнение решается методом граничных элементов, частное решение ищется методом коллокаций с помощью разложения неоднородности по радиальным базисным функциям. Вычислительный алгоритм оптимизирован за счет распараллеливания вычислений. Алгоритм реализован в виде программы, написанной на языке программирования С++. Организация параллельных вычислений построена с использованием открытого стандарта OpenCL, что позволило запускать одну и ту же программу, выполняющую параллельные вычисления, как на центральных многоядерных процессорах, так и на графических процессорах. Для оценки эффективности предложенного метода решения и корректности разработанной вычислительной технологии были решены тестовые примеры. Результаты расчетов сравнивались как с известными точными решениями, так и с данными, полученными авторами ранее в других работах. Проведена оценка точности решений и времени проведения расчетов. Проведен анализ эффективности использования различных систем радиальных базисных функций для решения задач рассматриваемого типа. Определена наиболее подходящая система функций. Проведенный комплексный вычислительный эксперимент показал более высокую точность расчетов по предложенному новому алгоритму по сравнению с разработанным ранее.
-
Снижение частоты промахов в неинклюзивный кэш с инклюзивным справочником многоядерного процессора
Компьютерные исследования и моделирование, 2023, т. 15, № 3, с. 639-656Хотя эпоха экспоненциального роста производительности компьютерных микросхем закончилась, даже настольные процессоры общего назначения сегодня имеют 16 и больше ядер. Поскольку пропускная способность памяти DRAM растет не с такой скоростью, как вычислительная мощность ядер, разработчики процессоров должны искать пути уменьшения частоты обменов с памятью на одну инструкцию. Непосредственным путем к этому является снижение частоты промахов в кэш последнего уровня. Предполагая уже реализованной схему «неинклюзивный кэш с инклюзивным справочником» (NCID), три способа дальнейшего снижения частоты промахов были исследованы.
Первый способ — это достижение более равномерного использования банков и наборов кэша применением хэш-функций для интерливинга и индексирования. В экспериментах в тестах SPEC CPU2017 refrate, даже простейшие хэш-функции на основе XOR показали увеличение производительности на 3,2%, 9,1% и 8,2% в конфигурациях процессора с 16, 32 и 64 ядрами и банками общего кэша, сравнимое с результатами для более сложных функций на основе матриц, деления и CRC.
Вторая оптимизация нацелена на уменьшение дублирования на разных уровнях кэшей путем автоматического переключения на эксклюзивную схему, когда она выглядит оптимальной. Известная схема этого типа, FLEXclusion, была модифицирована для использования в NCID-кэшах и показала улучшение производительности в среднемна 3,8%, 5,4% и 7,9% для 16-, 32- и 64-ядерных конфигураций.
Третьей оптимизацией является увеличение фактической емкости кэша использованием компрессии. Частота сжатия недорогим и быстрыма лгоритмом B DI*-HL (Base-Delta-Immediate Modified, Half-Line), разработанным для NCID, была измерена, и соответствующее увеличение емкости кэша дало около 1% среднего повышения производительности.
Все три оптимизации могут сочетаться и продемонстрировали прирост производительности в 7,7%, 16% и 19% для конфигураций с 16, 32 и 64 ядрами и банками соответственно.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"