Текущий выпуск Номер 2, 2024 Том 16

Все выпуски

Результаты поиска по 'большие данные':
Найдено статей: 168
  1. Неверова Г.П., Фрисман Е.Я.
    Режимы динамики популяции с неперекрывающимися поколениями с учетом генетической и стадийной структур
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1165-1190

    В данной работе рассматривается простейшая модель динамики популяции с неперекрывающимися поколениями, в которой плотностно-зависимые факторы лимитируют интенсивность рождаемости. При этом репродуктивный потенциал определяется генетически, а процессы размножения приурочены к определенному годовому сезону. Исследуемая в работе эколого-генетическая модель представляет собой объединение экологической модели динамики лимитированной популяции с неперекрывающимися поколениями и микроэволюционной модели динамики ее генетической структуры для случая, когда адаптивное разнообразие репродуктивных возможностей в популяции определяется одним аутосомным диаллельным локусом с аллеломорфами $А$ и $а$. В ходе исследования данной модели показано, что генетический состав популяции (а именно, будет ли она полиморфной или мономорфной) определяется значениями репродуктивных потенциалов гетерозиготы и гомозигот. При этом режимы динамики численности популяции определяются величиной среднего репродуктивного потенциала зрелых особей и интенсивностью процессов саморегуляции. В частности, показано, что эволюционный рост среднего значения репродуктивного потенциала при плотностной регуляции рождаемости приводит к дестабилизации динамики численности возрастных групп. В то время как интенсивность процессов саморегуляции определяет характер возникающих колебаний, поскольку от количественной оценки именно этого фактора зависит сценарий потери устойчивости равновесных состояний. Показано, что закономерности возникновения и эволюции циклических режимов динамики в большой степени определяются особенностями жизненного цикла особей, составляющих популяцию. Именно жизненный цикл определяет наличие изолированных субпопуляций разных лет, что, в свою очередь, приводит к возможности независимой микроэволюции этих субпопуляций и возникновения сложных сценариев динамики как численности, так и генетической структуры. Закрепление разных адаптивных мутаций постепенно приведет к генетической (а возможно, и морфологической) дифференциации и к различиям в средних репродуктивных потенциалах субпопуляций и достижению ими разного равновесного уровня численности. Дальнейший эволюционный рост репродуктивных потенциалов экологически лимитированных субпопуляций приводит к колебаниям их численности, которые могут отличаться не только амплитудой, но и фазой. Обнаруженные в предложенной модели сценарии микроэволюции генетического состава популяции, связанные с колебаниями численности, вполне согласуются с результатами исследований популяции тихоокеанской горбуши, которая демонстрирует не только колебания численности, но и наличие генетически дифференцированных субпопуляций смежных поколений.

  2. В работе рассматривается метод исследования панельных данных, основанный на использовании агломеративной иерархической кластеризации — группировки объектов на основании сходства и разли- чия их признаков в иерархию вложенных друг в друга кластеров. Применялись 2 альтернативных способа вычисления евклидовых расстояний между объектами — расстояния между усредненными по интервалу наблюдений значениями и расстояния с использованием данных за все рассматриваемые годы. Сравнивались 3 альтернативных метода вычисления расстояний между кластерами. В первом случае таким расстоянием считается расстояние между ближайшими элементами из двух кластеров, во втором — среднее по парам элементов, в третьем — расстояние между наиболее удаленными элементами. Исследована эффективность использования двух индексов качества кластеризации — индекса Данна и Силуэта для выбора оптимального числа кластеров и оценки статистической значимости полученных решений. Способ оценивания статистической достоверности кластерной структуры заключался в сравнении качества кластеризации, на реальной выборке с качеством кластеризаций на искусственно сгенерированных выборках панельных данных с теми же самыми числом объектов, признаков и длиной рядов. Генерация производилась из фиксированного вероятностного распределения. Использовались способы симуляции, имитирующие гауссов белый шум и случайное блуждание. Расчеты с индексом Силуэт показали, что случайное блуждание характеризуется не только ложной регрессией, но и ложной кластеризацией. Кластеризация принималась достоверной для данного числа выделенных кластеров, если значение индекса на реальной выборке оказывалось больше значения 95%-ного квантиля для искусственных данных. В качестве выборки реальных данных использован набор временных рядов показателей, характеризующих производство в российских регионах. Для этих данных только Силуэт показывает достоверную кластеризацию на уровне $p < 0.05$. Расчеты также показали, что значения индексов для реальных данных в целом ближе к значениям для случайных блужданий, чем для белого шума, но имеют значимые отличия и от тех, и от других. Визуально можно выделить скопления близко расположенных друг от друга в трехмерном признаковом пространстве точек, выделяемые также в качестве кластеров применяемым алгоритмом иерархической кластеризации.

  3. Предложен метод отображения промежуточных представлений C-, C++-программ в пространство векторов (эмбеддингов) для оценки производительности программ на этапе компиляции, без необходимости исполнения. Использование эмбеддингов для данной цели позволяет не проводить сравнение графов исследуемых программ непосредственно, что вычислительно упрощает задачу сравнения программ. Метод основан на серии трансформаций исходного промежуточного представления (IR), таких как: инструментирование — добавление фиктивных инструкций в оптимизационном проходе компилятора в зависимости от разности смещений в текущей инструкции обращения к памяти относительно предыдущей, преобразование IR в многомерный вектор с помощью технологии IR2Vec с понижением размерности по алгоритму t-SNE (стохастическое вложение соседей с t-распределением). В качестве метрики производительности предлагается доля кэш-промахов 1-го уровня (D1 cache misses). Приводится эвристический критерий отличия программ с большей долей кэш-промахов от программ с меньшей долей по их образам. Также описан разработанный в ходе работы проход компилятора, генерирующий и добавляющий фиктивные инструкции IR согласно используемой модели памяти. Приведено описание разработанного программного комплекса, реализующего предложенный способ оценивания на базе компиляторной инфраструктуры LLVM. Проведен ряд вычислительных экспериментов на синтетических тестах из наборов программ с идентичными потоками управления, но различным порядком обращений к одномерному массиву, показано, что коэффициент корреляции между метрикой производительности и расстоянием до эмбеддинга худшей программы в наборе отрицателен вне зависимости от инициализации t-SNE, что позволяет сделать заключение о достоверности эвристического критерия. Также в статье рассмотрен способ генерации тестов. По результатам экспериментов, вариативность значений метрики производительности на исследуемых множествах предложена как метрика для улучшения генератора тестов.

  4. Решитько М.А., Усов А.Б., Угольницкий Г.А.
    Модель управления потреблением воды в регионах с малой водообеспеченностью
    Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1395-1410

    В статье рассматривается проблема рационального использования водных ресурсов на уровне региона. Приводится обзор существующих методов контроля качества и количества водных ресурсов на различных уровнях — от отдельных домохозяйств до мирового. В самой работе проблема рассматривается для регионов России с малой водообеспеченностью — количеством воды на человека в год. Особое внимание уделяется регионам, в которых данный показатель мал из-за природных особенностей региона, а не большого числа жителей. В таких регионах много ресурсов выделяется на различную водную инфраструктуру, в том числе водохранилища, переброску воды из соседних регионов. При этом основными потребителями воды являются промышленность и сельское хозяйство. В работе представлена динамическая двухуровневая модель, сопоставляющая потребление регионом воды и объем производства в регионе (валовый региональный продукт, ВРП). На верхнем уровне модели находится администрация региона (центр), назначающая плату за использование воды, а на нижнем — предприятия региона (агенты). Проведены аналитическое исследование и идентификация модели. Аналитическое исследование позволяет с помощью принципа максимума Понтрягина найти оптимальные управления агентов. Идентификация модели позволяет, используя статистические данные для региона, определить коэффициенты модели таким образом, чтобы она соответствовала данному региону. Для идентификации модели используются данные Росстата. Далее следует численное исследование модели для конкретных регионов с использованием алгоритма trust region reflective.

    Для ряда регионов РФ с низким уровнем водообеспеченности приведены результаты идентификации модели на основе данных Росстата, а также возможные значения ВРП и потребления воды в зависимости от выбранной стратегии центра. Для многих регионов расчеты показывают возможность существенного (>20%) сокращения потребления воды при некотором сокращении производства (≈10%).

    Приведенная в работе модель позволяет рассчитывать размер дополнительной платы за использование воды для достижения оптимального соотношения экономических и экологических последствий.

  5. Ирхин И.А., Булатов В.Г., Воронцов К.В.
    Аддитивная регуляризация тематических моделей с быстрой векторизацией текста
    Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1515-1528

    Задача вероятностного тематического моделирования заключается в том, чтобы по заданной коллекции текстовых документов найти две матрицы: матрицу условных вероятностей тем в документах и матрицу условных вероятностей слов в темах. Каждый документ представляется в виде мультимножества слов, то есть предполагается, что для выявления тематики документа не важен порядок слов в нем, а важна только их частота. При таком предположении задача сводится к вычислению низкорангового неотрицательного матричного разложения, наилучшего по критерию максимума правдоподобия. Данная задача имеет в общем случае бесконечное множество решений, то есть является некорректно поставленной. Для регуляризации ее решения к логарифму правдоподобия добавляется взвешенная сумма оптимизационных критериев, с помощью которых формализуются дополнительные требования к модели. При моделировании больших текстовых коллекций хранение первой матрицы представляется нецелесообразным, поскольку ее размер пропорционален числу документов в коллекции. В то же время тематические векторные представления документов необходимы для решения многих задач текстовой аналитики — информационного поиска, кластеризации, классификации, суммаризации текстов. На практике тематический вектор вычисляется для каждого документа по необходимости, что может потребовать десятков итераций по всем словам документа. В данной работе предлагается способ быстрого вычисления тематического вектора для произвольного текста, требующий лишь одной итерации, то есть однократного прохода по всем словам документа. Для этого в модель вводится дополнительное ограничение в виде уравнения, позволяющего вычислять первую матрицу через вторую за линейное время. Хотя формально данное ограничение не является оптимизационным критерием, фактически оно выполняет роль регуляризатора и может применяться в сочетании с другими критериями в рамках теории аддитивной регуляризации тематических моделей ARTM. Эксперименты на трех свободно доступных текстовых коллекциях показали, что предложенный метод улучшает качество модели по пяти оценкам качества, характеризующим разреженность, различность, информативность и когерентность тем. Для проведения экспериментов использовались библиотеки с открытымк одомB igARTM и TopicNet.

  6. Обработка больших массивов данных обычно происходит в несколько последовательно выполняемых этапов, таких как пред- и постобработка, после каждого из которых промежуточные данные записываются на диск; однако, для каждой задачи этап предварительной обработки может отличаться, и в таком случае непосредственная передача данных по вычислительному конвейеру от одного этапа (звена) к другому бу- дет более эффективным с точки зрения производительности решением. В более общем случае некоторые этапы можно разделить на параллельные части, сформировав таким образом распределенный вычислительный конвейер, каждое звено которого может иметь несколько входов и выходов. Такой принцип обработки данных применяется в задаче о классификации энергетических спектров морского волнения, которая основана на аппроксимациях, позволяющих извлекать параметры отдельных систем волн (тип волн, генеральное направление волн и т. п.). Система, построенная на этом принципе показывает более высокую производительность по сравнению с часто применяемой поэтапной обработкой данных.

    Просмотров за год: 3. Цитирований: 2 (РИНЦ).
  7. Абдуллатыпов А.В., Цыганков А.А.
    Моделирование пространственной структуры гидрогеназы HydSL пурпурной серной бактерии Thiocapsa roseopersicina BBS
    Компьютерные исследования и моделирование, 2013, т. 5, № 4, с. 737-747

    В данной работе представлены модели железоникелевой гидрогеназы HydSL пурпурной серной бактерии Thiocapsa roseopersicina BBS. Показано, что полученные модели обладают более высоким уровнем доверия по сравнению с опубликованными ранее; впервые получена полноразмерная модель HydSL-гидрогеназы. Показана свободная ориентация С-концевого фрагмента малой субъединицы относительно основной белковой глобулы. Показано, что у термостабильной гидрогеназы HydSL Allochromatium vinosum и у полученной нами модели примерно одинаковое количество межсубъединичных ионных пар и их больше, чем у термолабильной гидрогеназы HydAB Desulfovibrio vulgaris.

    Просмотров за год: 2. Цитирований: 5 (РИНЦ).
  8. Плюснина Т.Ю., Воронова Е.Н., Гольцев В.Н., Погосян С.И., Яковлева О.В., Ризниченко Г.Ю., Рубин А.Б.
    Редуцированная модель фотосистемы II для оценки характеристик фотосинтетического аппарата по данным индукции флуоресценции
    Компьютерные исследования и моделирование, 2012, т. 4, № 4, с. 943-958

    Рассматривается подход для анализа некоторых биологических систем большой размерности, для которых справедливы предположения о квазиравновесных стадиях. Подход позволяет редуцировать детальные модели большой размерности и получить упрощенные модели, имеющие аналитическое решение. Это дает возможность достаточно точно воспроизводить экспериментальные кривые. Рассматриваемый подход был применен к детальной модели первичных процессов фотосинтеза в реакционном центре фотосистемы II. Упрощенная модель фотосистемы II хорошо описывает экспериментальных кривые индукции флуоресценции для высших и низших растений, полученные при разных интенсивностях света. Выведенные соотношения между переменными и параметрами детальной и упрощенной моделей, позволили использовать полученные оценки параметров упрощенной модели для описания динамики различных состояний фотосистемы II детальной модели.

    Просмотров за год: 3. Цитирований: 2 (РИНЦ).
  9. Холодков К.И., Алёшин И.М.
    Точное вычисление апостериорной функции распределения вероятно- сти при помощи вычислительных систем
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 539-542

    Представленная работа описывает опыт создания и развёртывания веб-приложения и гридинфраструктуры для решения задач геофизики, требующих большого количества вычислительных ресурсов. В работе представлен обзор технологии и механизма платформы интеграции геофизических приложений с распределёнными вычислительными системами. Разработанная платформа предоставляет собой промежуточное программное обеспечение, предоставляющая удобный доступ к развёрнутым на ее основе геофизическим приложениям. Доступ к приложению осуществляется через веб-браузер. Интеграция новых приложений облегчается за счёт предоставляемого стандартного универсального интерфейса взаимодействия платформы и новым приложением.

    Для организации распределённой вычислительной системы применено ПО Gridway, экземпляр которого взаимодействует с виртуализированными вычислительными кластерами. Виртуализация вычислительных кластеров предоставляет новые возможности при утилизации вычислительных ресурсов по сравнению с традиционными схемами организации кластерного ПО.

    В качестве пилотной задачи использована обратная задача определение параметров анизотропии коры и верхней мантии по данным телесейсмических наблюдений. Для решения использован вероятностный подход к решению обратных задач, основанный на формализме апостериорной функции распределения (АПФР). При этом вычислительная задача сводится к табулированию многомерной функции. Результат вычислений представлен в удобном для анализа высокоуровневом виде, доступ и управление осуществляется при помощи СУБД. Приложение предоставляет инструменты анализу АПФР: расчет первых моментов, двумерные маргинальные распределения, двумерные сечения АПФР в точках ее максимума. При тестировании веб-приложения были выполнены вычислены как синтетических, так и для реальных данных.

    Просмотров за год: 3.
  10. Минкин А.С., Книжник А.А., Потапкин Б.В.
    Реализация алгоритмов межатомного взаимодействия с использованием технологии OpenCL
    Компьютерные исследования и моделирование, 2015, т. 7, № 3, с. 549-558

    Моделирование углеродных наноструктур методом классической молекулярной динамики требует больших объемов вычислений. Один из способов повышения производительности соответствующих алгоритмов состоит в их адаптации для работы с SIMD-подобными архитектурами, в частности, с графическими процессорами. В данной работе рассмотрены особенности алгоритмов вычисления многочастичного взаимодействия на основе классических потенциалов Терсоффа и погруженного атома с использованием технологии OpenCL. Стандарт OpenCL позволяет обеспечить универсальность и переносимость алгоритмов и может быть эффективно использован для гетерогенных вычислений. В данной работе сделана оценка производительности OpenCL алгоритмов вычисления межатомного взаимодействия для систем на базе центральных и графических процессоров. Показано, что использование атомарных операций эффективно для вычисления потенциала Терсоффа и неэффективно в случае потенциала погруженного атома. Оценка производительности показывает значительное ускорение GPU реализации алгоритмов вычисления потенциалов межатомного взаимодействия по сравнению с соответствующими однопоточными алгоритмами.

    Просмотров за год: 4. Цитирований: 1 (РИНЦ).
Страницы: « первая предыдущая следующая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.