Текущий выпуск Номер 3, 2024 Том 16

Все выпуски

Результаты поиска по 'regularization':
Найдено статей: 74
  1. Чувилин К.В.
    Использование синтаксических деревьев для автоматизации коррекции документов в формате LaTeX
    Компьютерные исследования и моделирование, 2012, т. 4, № 4, с. 871-883

    Рассматривается задача автоматизации коррекции документов в формате LaTeX. Каждый документ представляется в виде синтаксического дерева. С помощью модифицированного алгоритма Zhang-Shasha строится отображение вершин дерева изначального документа в вершины дерева отредактированного документа, соответствующее минимальному редактирующему расстоянию. Отображения вершины в вершину составляют обучающую выборку, по которой генерируются правила замены для автоматической коррекции. Для каждого правила собирается статистика его применимости к отредактированным документам. На ее основе производится оценка качества правил и их улучшение.

    Chuvilin K.V.
    The use of syntax trees in order to automate the correction of LaTeX documents
    Computer Research and Modeling, 2012, v. 4, no. 4, pp. 871-883

    The problem is to automate the correction of LaTeX documents. Each document is represented as a parse tree. The modified Zhang-Shasha algorithm is used to construct a mapping of tree vertices of the original document to the tree vertices of the edited document, which corresponds to the minimum editing distance. Vertex to vertex maps form the training set, which is used to generate rules for automatic correction. The statistics of the applicability to the edited documents is collected for each rule. It is used for quality assessment and improvement of the rules.

    Цитирований: 5 (РИНЦ).
  2. Ирхин И.А., Булатов В.Г., Воронцов К.В.
    Аддитивная регуляризация тематических моделей с быстрой векторизацией текста
    Компьютерные исследования и моделирование, 2020, т. 12, № 6, с. 1515-1528

    Задача вероятностного тематического моделирования заключается в том, чтобы по заданной коллекции текстовых документов найти две матрицы: матрицу условных вероятностей тем в документах и матрицу условных вероятностей слов в темах. Каждый документ представляется в виде мультимножества слов, то есть предполагается, что для выявления тематики документа не важен порядок слов в нем, а важна только их частота. При таком предположении задача сводится к вычислению низкорангового неотрицательного матричного разложения, наилучшего по критерию максимума правдоподобия. Данная задача имеет в общем случае бесконечное множество решений, то есть является некорректно поставленной. Для регуляризации ее решения к логарифму правдоподобия добавляется взвешенная сумма оптимизационных критериев, с помощью которых формализуются дополнительные требования к модели. При моделировании больших текстовых коллекций хранение первой матрицы представляется нецелесообразным, поскольку ее размер пропорционален числу документов в коллекции. В то же время тематические векторные представления документов необходимы для решения многих задач текстовой аналитики — информационного поиска, кластеризации, классификации, суммаризации текстов. На практике тематический вектор вычисляется для каждого документа по необходимости, что может потребовать десятков итераций по всем словам документа. В данной работе предлагается способ быстрого вычисления тематического вектора для произвольного текста, требующий лишь одной итерации, то есть однократного прохода по всем словам документа. Для этого в модель вводится дополнительное ограничение в виде уравнения, позволяющего вычислять первую матрицу через вторую за линейное время. Хотя формально данное ограничение не является оптимизационным критерием, фактически оно выполняет роль регуляризатора и может применяться в сочетании с другими критериями в рамках теории аддитивной регуляризации тематических моделей ARTM. Эксперименты на трех свободно доступных текстовых коллекциях показали, что предложенный метод улучшает качество модели по пяти оценкам качества, характеризующим разреженность, различность, информативность и когерентность тем. Для проведения экспериментов использовались библиотеки с открытымк одомB igARTM и TopicNet.

    Irkhin I.A., Bulatov V.G., Vorontsov K.V.
    Additive regularizarion of topic models with fast text vectorizartion
    Computer Research and Modeling, 2020, v. 12, no. 6, pp. 1515-1528

    The probabilistic topic model of a text document collection finds two matrices: a matrix of conditional probabilities of topics in documents and a matrix of conditional probabilities of words in topics. Each document is represented by a multiset of words also called the “bag of words”, thus assuming that the order of words is not important for revealing the latent topics of the document. Under this assumption, the problem is reduced to a low-rank non-negative matrix factorization governed by likelihood maximization. In general, this problem is ill-posed having an infinite set of solutions. In order to regularize the solution, a weighted sum of optimization criteria is added to the log-likelihood. When modeling large text collections, storing the first matrix seems to be impractical, since its size is proportional to the number of documents in the collection. At the same time, the topical vector representation (embedding) of documents is necessary for solving many text analysis tasks, such as information retrieval, clustering, classification, and summarization of texts. In practice, the topical embedding is calculated for a document “on-the-fly”, which may require dozens of iterations over all the words of the document. In this paper, we propose a way to calculate a topical embedding quickly, by one pass over document words. For this, an additional constraint is introduced into the model in the form of an equation, which calculates the first matrix from the second one in linear time. Although formally this constraint is not an optimization criterion, in fact it plays the role of a regularizer and can be used in combination with other regularizers within the additive regularization framework ARTM. Experiments on three text collections have shown that the proposed method improves the model in terms of sparseness, difference, logLift and coherence measures of topic quality. The open source libraries BigARTM and TopicNet were used for the experiments.

  3. Жданова О.Л., Неверова Г.П., Фрисман Е.Я.
    Динамика планктонного сообщества с учетом трофических характеристик зоопланктона
    Компьютерные исследования и моделирование, 2024, т. 16, № 2, с. 525-554

    Предложена четырехкомпонентная модель планктонного сообщества с дискретным временем, учитывающая конкурентные взаимоотношения между разными группами фитопланктона и трофические характеристики зоопланктона: рассматривается деление зоопланктона на хищный и нехищный типы. Изъятие нехищного зоопланктона хищным явно представлено в модели. Нехищный зоопланктон питается фитопланктоном, включающим два конкурирующих компонента: токсичный и нетоксичный тип, при этом последний пригоден в пищу для зоопланктона. Модель двух связанных уравнений Рикера, ориентированная на описание динамики конкурентного сообщества, используется для описания взаимодействия двух типов фитопланктона и позволяет неявно учитывать ограничение роста биомассы каждого из компонентов-конкурентов доступностью внешних ресурсов. Изъятие жертв хищниками описывается трофической функцией Холлинга типа II с учетом насыщения хищника.

    Анализ сценариев перехода от стационарной динамики к колебаниям численности сообщества показал, что потеря устойчивости нетривиального равновесия, соответствующего существованию полного сообщества, может происходить как через каскад бифуркаций удвоения периода, так и бифуркацию Неймарка – Сакера, ведущую к возникновению квазипериодических колебаний. Предложенная в данной работе модель, являясь достаточно простой, демонстрирует динамику сообщества подобную той, что наблюдается в естественных системах и экспериментах: с отставанием колебаний хищника от жертвы примерно на четверть периода, длиннопериодические противофазные циклы хищника и жертвы, а также скрытые циклы, при которых плотность жертв остается практически постоянной, а плотность хищников флуктуирует, демонстрируя влияние быстрой эволюции, маскирующей трофическое взаимодействие. При этом вариация внутрипопуляционных параметров фито- или зоопланктона может приводить к выраженным изменениям динамического режима в сообществе: резким переходам от регулярной к квазипериодической динамике и далее к точным циклам с небольшим периодом или даже стационарной динамике. Квазипериодическая динамика может возникать при достаточно небольшихск оростях роста фитопланктона, соответствующих стабильной или регулярной динамике сообщества. Смена динамического режима в этой области (переход от регулярной динамики к квазипериодической и наоборот) может происходить за счет вариации начальных условий или внешнего воздействия, изменяющего текущие численности компонентов и смещающего систему в бассейн притяжения другого динамического режима.

    Zhdanova O.L., Neverova G.P., Frisman E.Y.
    Modeling the dynamics of plankton community considering the trophic characteristics of zooplankton
    Computer Research and Modeling, 2024, v. 16, no. 2, pp. 525-554

    We propose a four-component model of a plankton community with discrete time. The model considers the competitive relationships of phytoplankton groups exhibited between each other and the trophic characteristics zooplankton displays: it considers the division of zooplankton into predatory and non-predatory components. The model explicitly represents the consumption of non-predatory zooplankton by predatory. Non-predatory zooplankton feeds on phytoplankton, which includes two competing components: toxic and non-toxic types, with the latter being suitable for zooplankton food. A model of two coupled Ricker equations, focused on describing the dynamics of a competitive community, describes the interaction of two phytoplanktons and allows implicitly taking into account the limitation of each of the competing components of biomass growth by the availability of external resources. The model describes the prey consumption by their predators using a Holling type II trophic function, considering predator saturation.

    The analysis of scenarios for the transition from stationary dynamics to fluctuations in the population size of community members showed that the community loses the stability of the non-trivial equilibrium corresponding to the coexistence of the complete community both through a cascade of period-doubling bifurcations and through a Neimark – Sacker bifurcation leading to the emergence of quasi-periodic oscillations. Although quite simple, the model proposed in this work demonstrates dynamics of comunity similar to that natural systems and experiments observe: with a lag of predator oscillations relative to the prey by about a quarter of the period, long-period antiphase cycles of predator and prey, as well as hidden cycles in which the prey density remains almost constant, and the predator density fluctuates, demonstrating the influence fast evolution exhibits that masks the trophic interaction. At the same time, the variation of intra-population parameters of phytoplankton or zooplankton can lead to pronounced changes the community experiences in the dynamic mode: sharp transitions from regular to quasi-periodic dynamics and further to exact cycles with a small period or even stationary dynamics. Quasi-periodic dynamics can arise at sufficiently small phytoplankton growth rates corresponding to stable or regular community dynamics. The change of the dynamic mode in this area (the transition from stable dynamics to quasi-periodic and vice versa) can occur due to the variation of initial conditions or external influence that changes the current abundances of components and shifts the system to the basin of attraction of another dynamic mode.

  4. Аронов И.З., Максимова О.В.
    Теоретическое моделирование достижения консенсуса в условиях коалиций на основе регулярных марковских цепей
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 1247-1256

    Часто решения в социальных группах принимается на основе консенсуса. Это касается, например, проведения экспертизы в техническом комитете по стандартизации (ТК) перед утверждением национального стандарта Росстандартом. Стандарт утверждается в том и только том случае, если обеспечен консенсус в ТК. Такой же подход к разработке стандартов принят практически во всех странах мира, а также на региональном и международном уровне. Ранее опубликованные работы авторов посвящены построению математической модели времени достижения консенсуса в технических комитетах по стандартизации в условиях варьирования числа членов ТК и уровня их авторитарности. Настоящее исследование является продолжением этих работ для случая образования коалиций в работе социальных групп, в том числе технических комитетов по стандартизации. В рамках модели показано, что при наличии коалиций консенсус не достижим. Однако коалиции, как правило, преодолеваются в ходе переговорного процесса, в против- ном случае число принятых стандартов было бы исключительно мало. В работе проанализированы факторы, которые оказывают влияние на преодоление коалиций: величина уступки и индекс влияния коалиции. На основе статистического моделирования регулярных марковских цепей исследуется их воздействие на время обеспечения консенсуса. Доказано, что время достижения консенсуса значимо зависит от величины односторонней уступки коалиции и слабо зависит от размеров коалиций. Построена регрессионная модель зависимости среднего числа согласований от величины уступки. Выявлено, что даже небольшая уступка влечет наступление консенсуса, увеличение размера уступки приводит (при прочих равных факторах) к резкому снижению времени до наступления консенсуса. Показано, что уступка бо́льшей коалиции в отношении малочисленной коалиции не требует в среднем бо́льшего времени до наступления консенсуса. Уступка авторитарного лидера в группе позволяет сократить число согласований и повысить качество консенсуса. Полученные результаты имеют практическую ценность для всех организационных структур, где возникновение коалиций влечет невозможность принятия решений в рамках достижения консенсуса и требует рассмотрения различных способов для выхода на консенсусное решение.

    Aronov I.Z., Maksimova O.V.
    Theoretical modeling consensus building in the work of standardization technical committees in coalitions based on regular Markov chains
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 1247-1256

    Often decisions in social groups are made by consensus. This applies, for example, to the examination in the technical committee for standardization (TC) before the approval of the national standard by Rosstandart. The standard is approved if and only if the secured consensus in the TC. The same approach to standards development was adopted in almost all countries and at the regional and international level. Previously published works of authors dedicated to the construction of a mathematical model of time to reach consensus in technical committees for standardization in terms of variation in the number of TC members and their level of authoritarianism. The present study is a continuation of these works for the case of the formation of coalitions that are often formed during the consideration of the draft standard to the TC. In the article the mathematical model is constructed to ensure consensus on the work of technical standardization committees in terms of coalitions. In the framework of the model it is shown that in the presence of coalitions consensus is not achievable. However, the coalition, as a rule, are overcome during the negotiation process, otherwise the number of the adopted standards would be extremely small. This paper analyzes the factors that influence the bridging coalitions: the value of the assignment and an index of the effect of the coalition. On the basis of statistical modelling of regular Markov chains is investigated their effects on the time to ensure consensus in the technical Committee. It is proved that the time to reach consensus significantly depends on the value of unilateral concessions coalition and weakly depends on the size of coalitions. Built regression model of dependence of the average number of approvals from the value of the assignment. It was revealed that even a small concession leads to the onset of consensus, increasing the size of the assignment results (with other factors being equal) to a sharp decline in time before the consensus. It is shown that the assignment of a larger coalition against small coalitions takes on average more time before consensus. The result has practical value for all organizational structures, where the emergence of coalitions entails the inability of decision-making in the framework of consensus and requires the consideration of various methods for reaching a consensus decision.

Страницы: « первая предыдущая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.