Текущий выпуск Номер 2, 2024 Том 16

Все выпуски

Результаты поиска по 'тематическое моделирование':
Найдено статей: 38
  1. От редакции
    Компьютерные исследования и моделирование, 2023, т. 15, № 5, с. 1099-1101
  2. От редакции
    Компьютерные исследования и моделирование, 2023, т. 15, № 6, с. 1415-1418
  3. От редакции
    Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 245-248
  4. Воронцов К.В., Потапенко А.А.
    Регуляризация, робастность и разреженность вероятностных тематических моделей
    Компьютерные исследования и моделирование, 2012, т. 4, № 4, с. 693-706

    Предлагается обобщенное семейство вероятностных тематических моделей коллекций текстовых документов, в котором эвристики регуляризации, сэмплирования, частого обновления параметров, робастности относительно шума и фона могут включаться независимо друг от друга в любых сочетаниях, порождая как известные модели PLSA, LDA, CVB0, SWB, так и новые. Показано, что робастная тематическая модель на основе PLSA, разделяющая термины на тематические, шумовые и фоновые, не нуждается в регуляризации и обеспечивает разреженность искомых дискретных распределений тем в документах и терминов в темах.

    Просмотров за год: 25. Цитирований: 12 (РИНЦ).
  5. Калашников С.В., Кривощапов А.А., Митин А.Л., Николаев Н.В.
    Расчетные исследования аэродинамических характеристик тематической модели летательного аппарата схемы «летающее крыло» с помощью программного комплекса FlowVision
    Компьютерные исследования и моделирование, 2017, т. 9, № 1, с. 67-74

    Модернизация методики аэродинамического эксперимента на современном уровне подразумевает создание математических моделей аэродинамических труб (электронных АДТ), предназначенных для вычислительного сопровождения экспериментальных исследований. Применение электронных АДТ в перспективе способно обеспечить получение достоверных аэродинамических характеристик летательных аппаратов по результатам исследования их моделей в аэродинамических трубах, согласования результатов, полученных на разных экспериментальных установках, сравнения расчетов моделей в безграничном потоке с учетом влияния подвесных устройств и границ потока в рабочей части экспериментальной установки.

    Решение данной задачи требует создания научного задела, что, в свою очередь, подразумевает выполнение экспериментальных методических исследований и обширного комплекса расчетных исследований на основе численного решения осредненных по Рейнольдсу уравнений Навье–Стокса с применением суперкомпьютерных технологий. При этом на различных этапах расчетных исследований необходимо моделировать не только летательный аппарат, но и комплексную геометрию рабочей части аэродинамической трубы и подвесных устройств, что требует дополнительных методических расчетов. Также определенные трудности может представлять моделирование ламинарно-турбулентного перехода на поверхности модели, который в большинстве случаев имеет место в условиях эксперимента.

    В данной работе представлены результаты расчетов аэродинамических характеристик тематической модели летательного аппарата схемы «летающее крыло» в безграничном потоке при разных углах атаки, полученные в рамках первого этапа работы по созданию математической модели рабочей части аэродинамической трубы Т-102 ЦАГИ. Расчеты выполнялись с использованием двухпараметрической k–ε модели турбулентности со специальными пристеночными функциями, приспособленными для расчета отрывных течений. В рамках данной работы исследовались основные продольные аэродинамические характеристики, было выполнено сравнение с результатами экспериментальных исследований в аэродинамической трубе Т-102 ЦАГИ с учетом погрешностей.

    Просмотров за год: 10. Цитирований: 1 (РИНЦ).
  6. Галочкина Т.В., Вольперт В.А.
    Математическое моделирование распространения тромбина в процессе свертывания крови
    Компьютерные исследования и моделирование, 2017, т. 9, № 3, с. 469-486

    В случае повреждения сосуда или контакта плазмы крови с чужеродной поверхностью запускается цепь химических реакций (каскад свертывания), ведущая к формированию кровяного сгустка (тромба), основу которого составляют волокна фибрина. Ключевым компонентом каскада свертывания крови является фермент тромбин, катализирующий образование фибрина из фибриногена. Распределение концентрации тромбина определяет пространственно-временную динамику формирования кровяного сгустка. Контактный путь активации системы свертывания запускает реакцию образования тромбина в ответ на контакт с отрицательно заряженной поверхностью. Если концентрация тромбина, произведенного на этом этапе, достаточно велика, дальнейшее образование тромбина идет за счет положительных обратных связей каскада свертывания. В результате тромбин распространяется в плазме, что приводит к расщеплению фибриногена и формированию тромба. Профиль концентрации и скорость распространения тромбина в плазме постоянны и не зависят от того, как было активировано свертывание.

    Подобное поведение системы свертывания хорошо описывается решениями типа бегущей волны в системе уравнений «реакция – диффузия» на концентрации факторов крови, принимающих участие в каскаде свертывания. В настоящей работе проводится подробный анализма тематической модели, описывающей основные реакции каскада свертывания. Формулируются необходимые и достаточные условия существования решений системы типа бегущей волны. Для рассмотренной модели существование таких решений является эквивалентным существованию волновых решений упрощенной модели, полученной с помощью квазистационарного приближения и состоящей из одного уравнения, описывающего динамику концентрации тромбина.

    Упрощенная модель также позволяет нам получить аналитические оценки скорости распространения волны тромбина в рассматриваемых моделях. Скорость бегущей волны для одного уравнения была оценена с использованием метода узкой зоны реакции и с помощью кусочно-линейного приближения. Полученные формулы дают хорошее приближение скорости распространения волны тромбина как в упрощенной, так и в исходной модели.

    Просмотров за год: 10. Цитирований: 1 (РИНЦ).
  7. Игнатьев Н.А., Тулиев У.Ю.
    Семантическая структуризация текстовых документов на основе паттернов сущностей естественного языка
    Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1185-1197

    Рассматривается технология создания паттернов из слов (понятий) естественного языка по текстовым данным в модели «мешок слов». Паттерны применяются для снижения размерности исходного пространства в описании документов и поиска семантически связанных слов по темам. Процесс снижения размерности реализуется через формирование по паттернам латентных признаков. Исследуется многообразие структур отношений документов для разбиения их на темы в латентном пространстве.

    Считается, что заданное множество документов (объектов) разделено на два непересекающихся класса, для анализа которых необходимо использовать общий словарь. Принадлежность слов к общему словарю изначально неизвестна. Объекты классов рассматриваются в ситуации оппозиции друг к другу. Количественные параметры оппозиционности определяются через значения устойчивости каждого признака и обобщенные оценки объектов по непересекающимся наборам признаков.

    Для вычисления устойчивости используются разбиения значений признаков на непересекающиеся интервалы, оптимальные границы которых определяются по специальному критерию. Максимум устойчивости достигается при условии, что в границах каждого интервала содержатся значения одного из двух классов.

    Состав признаков в наборах (паттернах из слов) формируется из упорядоченной по значениям устойчивости последовательности. Процесс формирования паттернов и латентных признаков на их основе реализуется по правилам иерархической агломеративной группировки.

    Набор латентных признаков используется для кластерного анализа документов по метрическим алгоритмам группировки. В процессе анализа применяется коэффициент контентной аутентичности на основе данных о принадлежности документов к классам. Коэффициент является численной характеристикой доминирования представителей классов в группах.

    Для разбиения документов на темы предложено использовать объединение групп по отношению их центров. В качестве закономерностей по каждой теме рассматривается упорядоченная по частоте встречаемости последовательность слов из общего словаря.

    Приводятся результаты вычислительного эксперимента на коллекциях авторефератов научных диссертаций. Сформированы последовательности слов из общего словаря по четырем темам.

  8. Ирхин И.А., Булатов В.Г., Воронцов К.В.
    Аддитивная регуляризация тематических моделей с быстрой векторизацией текста
    Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1515-1528

    Задача вероятностного тематического моделирования заключается в том, чтобы по заданной коллекции текстовых документов найти две матрицы: матрицу условных вероятностей тем в документах и матрицу условных вероятностей слов в темах. Каждый документ представляется в виде мультимножества слов, то есть предполагается, что для выявления тематики документа не важен порядок слов в нем, а важна только их частота. При таком предположении задача сводится к вычислению низкорангового неотрицательного матричного разложения, наилучшего по критерию максимума правдоподобия. Данная задача имеет в общем случае бесконечное множество решений, то есть является некорректно поставленной. Для регуляризации ее решения к логарифму правдоподобия добавляется взвешенная сумма оптимизационных критериев, с помощью которых формализуются дополнительные требования к модели. При моделировании больших текстовых коллекций хранение первой матрицы представляется нецелесообразным, поскольку ее размер пропорционален числу документов в коллекции. В то же время тематические векторные представления документов необходимы для решения многих задач текстовой аналитики — информационного поиска, кластеризации, классификации, суммаризации текстов. На практике тематический вектор вычисляется для каждого документа по необходимости, что может потребовать десятков итераций по всем словам документа. В данной работе предлагается способ быстрого вычисления тематического вектора для произвольного текста, требующий лишь одной итерации, то есть однократного прохода по всем словам документа. Для этого в модель вводится дополнительное ограничение в виде уравнения, позволяющего вычислять первую матрицу через вторую за линейное время. Хотя формально данное ограничение не является оптимизационным критерием, фактически оно выполняет роль регуляризатора и может применяться в сочетании с другими критериями в рамках теории аддитивной регуляризации тематических моделей ARTM. Эксперименты на трех свободно доступных текстовых коллекциях показали, что предложенный метод улучшает качество модели по пяти оценкам качества, характеризующим разреженность, различность, информативность и когерентность тем. Для проведения экспериментов использовались библиотеки с открытымк одомB igARTM и TopicNet.

Страницы: « первая предыдущая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.