Все выпуски
- 2024 Том 16
- 2023 Том 15
- 2022 Том 14
- 2021 Том 13
- 2020 Том 12
- 2019 Том 11
- 2018 Том 10
- 2017 Том 9
- 2016 Том 8
- 2015 Том 7
- 2014 Том 6
- 2013 Том 5
- 2012 Том 4
- 2011 Том 3
- 2010 Том 2
- 2009 Том 1
-
Обзор современных технологий извлечения знаний из текстовых сообщений
Компьютерные исследования и моделирование, 2021, т. 13, № 6, с. 1291-1315Решение общей проблемы информационного взрыва связано с системами автоматической обработки цифровых данных, включая их распознавание, сортировку, содержательную обработку и представление в виде, приемлемом для восприятия человеком. Естественным решением является создание интеллектуальных систем извлечения знаний из неструктурированной информации. При этом явные успехи в области обработки структурированных данных контрастируют со скромными достижениями в области анализа неструктурированной информации, в частности в задачах обработки текстовых документов. В настоящее время данное направление находится в стадии интенсивных исследований и разработок. Данная работа представляет собой системный обзор международных и отечественных публикаций, посвященных ведущему тренду в области автоматической обработки потоков текстовой информации, а именно интеллектуальному анализу текстов или Text Mining (TM). Рассмотрены основные задачи и понятия TM, его место в области проблемы искусственного интеллекта, а также указаны сложности при обработке текстов на естественном языке (NLP), обусловленные слабой структурированностью и неоднозначностью лингвистической ин- формации. Описаны стадии предварительной обработки текстов, их очистка и селекция признаков, которые, наряду с результатами морфологического, синтаксического и семантического анализа, являются компонентами TM. Процесс интеллектуального анализа текстов представлен как отображение множества текстовых документов в «знания», т.е. в очищенную от избыточности и шума совокупность сведений, необходимых для решения конкретной прикладной задачи. На примере задачи трейдинга продемонстрирована формализация принятия торгового решения, основанная на совокупности аналитических рекомендаций. Типичными примерами TM являются задачи и технологии информационного поиска (IR), суммаризации текста, анализа тональности, классификации и кластеризации документов и т. п. Общим вопросом для всех методов TM является выбор типа словоформ и их производных, используемых для распознавания контента в последовательностях символов NL. На примере IR рассмотрены типовые алгоритмы поиска, основанные на простых словоформах, фразах, шаблонах и концептах, а также более сложные технологии, связанные с дополнением шаблонов синтаксической и семантической информацией. В общем виде дано описание механизмов NLP: морфологический, синтаксический, семантический и прагматический анализ. Приведен сравнительный анализ современных инструментов TM, позволяющий осуществить выбор платформы, исходя из особенности решаемой задачи и практических навыков пользователя.
Ключевые слова: извлечение знаний, извлечение информации, обработка естественного языка, машинное обучение, семантическое аннотирование.
Extracting knowledge from text messages: overview and state-of-the-art
Computer Research and Modeling, 2021, v. 13, no. 6, pp. 1291-1315In general, solving the information explosion problem can be delegated to systems for automatic processing of digital data. These systems are intended for recognizing, sorting, meaningfully processing and presenting data in formats readable and interpretable by humans. The creation of intelligent knowledge extraction systems that handle unstructured data would be a natural solution in this area. At the same time, the evident progress in these tasks for structured data contrasts with the limited success of unstructured data processing, and, in particular, document processing. Currently, this research area is undergoing active development and investigation. The present paper is a systematic survey on both Russian and international publications that are dedicated to the leading trend in automatic text data processing: Text Mining (TM). We cover the main tasks and notions of TM, as well as its place in the current AI landscape. Furthermore, we analyze the complications that arise during the processing of texts written in natural language (NLP) which are weakly structured and often provide ambiguous linguistic information. We describe the stages of text data preparation, cleaning, and selecting features which, alongside the data obtained via morphological, syntactic, and semantic analysis, constitute the input for the TM process. This process can be represented as mapping a set of text documents to «knowledge». Using the case of stock trading, we demonstrate the formalization of the problem of making a trade decision based on a set of analytical recommendations. Examples of such mappings are methods of Information Retrieval (IR), text summarization, sentiment analysis, document classification and clustering, etc. The common point of all tasks and techniques of TM is the selection of word forms and their derivatives used to recognize content in NL symbol sequences. Considering IR as an example, we examine classic types of search, such as searching for word forms, phrases, patterns and concepts. Additionally, we consider the augmentation of patterns with syntactic and semantic information. Next, we provide a general description of all NLP instruments: morphological, syntactic, semantic and pragmatic analysis. Finally, we end the paper with a comparative analysis of modern TM tools which can be helpful for selecting a suitable TM platform based on the user’s needs and skills.
-
Гидродинамическая активация свертывания крови в стенозированных сосудах. Теоретический анализ
Компьютерные исследования и моделирование, 2012, т. 4, № 1, с. 155-183В настоящей работе исследованы гидродинамические механизмы активации плазменного звена системы свертывания крови при числах Рейнольдса в интервале от 10 до 500. Условия активации изучены в рамках модели, предполагающей, что проницаемость сосудистых стенок по отношению к первичным активаторам системы свертывания крови возрастает с увеличением касательного напряжения. Обнаружено несколько характерных сценариев развития процессов тромбообразования. Изучено влияние изменения топологии течения на активацию внутрисосудистого свертывания крови. Установлено, что пороговая активация плазменного звена системы гемостаза в стенозированных сосудах может иметь место не только при ослаблении, но и при интенсификации кровотока. В заключительной части работы обсуждены возможные медицинские приложения полученных результатов.
Ключевые слова: математическое моделирование, свертывание крови, стеноз сосуда, процессы структурообразования.
Hydrodynamical activation of blood coagulation in stenosed vessels. Theoretical analysis
Computer Research and Modeling, 2012, v. 4, no. 1, pp. 155-183Просмотров за год: 2. Цитирований: 5 (РИНЦ).The mechanisms of hydrodynamical activation of blood coagulation system are investigated in stenosed vessels for a wide range of Reynolds number values (from 10 up to 500). It is assumed that the vessel wall permeability for procoagulant factors rapidly increases when wall shear stress exceeds specific threshold value. A number of patterns of blood coagulation processes development are described. The influence of blood flow topology changes on activation of blood coagulation is explored. It is established that not only blood flow decrease, but also its increase may promote activation of blood coagulation. It was found that dependence of thrombogenic danger of stenosis on vessel lumen blockage ratio is non-monotonic. The relevance of obtained theoretical results for clinical practice is discussed.
-
Семантическая структуризация текстовых документов на основе паттернов сущностей естественного языка
Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1185-1197Рассматривается технология создания паттернов из слов (понятий) естественного языка по текстовым данным в модели «мешок слов». Паттерны применяются для снижения размерности исходного пространства в описании документов и поиска семантически связанных слов по темам. Процесс снижения размерности реализуется через формирование по паттернам латентных признаков. Исследуется многообразие структур отношений документов для разбиения их на темы в латентном пространстве.
Считается, что заданное множество документов (объектов) разделено на два непересекающихся класса, для анализа которых необходимо использовать общий словарь. Принадлежность слов к общему словарю изначально неизвестна. Объекты классов рассматриваются в ситуации оппозиции друг к другу. Количественные параметры оппозиционности определяются через значения устойчивости каждого признака и обобщенные оценки объектов по непересекающимся наборам признаков.
Для вычисления устойчивости используются разбиения значений признаков на непересекающиеся интервалы, оптимальные границы которых определяются по специальному критерию. Максимум устойчивости достигается при условии, что в границах каждого интервала содержатся значения одного из двух классов.
Состав признаков в наборах (паттернах из слов) формируется из упорядоченной по значениям устойчивости последовательности. Процесс формирования паттернов и латентных признаков на их основе реализуется по правилам иерархической агломеративной группировки.
Набор латентных признаков используется для кластерного анализа документов по метрическим алгоритмам группировки. В процессе анализа применяется коэффициент контентной аутентичности на основе данных о принадлежности документов к классам. Коэффициент является численной характеристикой доминирования представителей классов в группах.
Для разбиения документов на темы предложено использовать объединение групп по отношению их центров. В качестве закономерностей по каждой теме рассматривается упорядоченная по частоте встречаемости последовательность слов из общего словаря.
Приводятся результаты вычислительного эксперимента на коллекциях авторефератов научных диссертаций. Сформированы последовательности слов из общего словаря по четырем темам.
Ключевые слова: тематическое моделирование, иерархическая агломеративная группировка, онтология, общий словарь, контентная аутентичность.
Semantic structuring of text documents based on patterns of natural language entities
Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1185-1197The technology of creating patterns from natural language words (concepts) based on text data in the bag of words model is considered. Patterns are used to reduce the dimension of the original space in the description of documents and search for semantically related words by topic. The process of dimensionality reduction is implemented through the formation of patterns of latent features. The variety of structures of document relations is investigated in order to divide them into themes in the latent space.
It is considered that a given set of documents (objects) is divided into two non-overlapping classes, for the analysis of which it is necessary to use a common dictionary. The belonging of words to a common vocabulary is initially unknown. Class objects are considered as opposition to each other. Quantitative parameters of oppositionality are determined through the values of the stability of each feature and generalized assessments of objects according to non-overlapping sets of features.
To calculate the stability, the feature values are divided into non-intersecting intervals, the optimal boundaries of which are determined by a special criterion. The maximum stability is achieved under the condition that the boundaries of each interval contain values of one of the two classes.
The composition of features in sets (patterns of words) is formed from a sequence ordered by stability values. The process of formation of patterns and latent features based on them is implemented according to the rules of hierarchical agglomerative grouping.
A set of latent features is used for cluster analysis of documents using metric grouping algorithms. The analysis applies the coefficient of content authenticity based on the data on the belonging of documents to classes. The coefficient is a numerical characteristic of the dominance of class representatives in groups.
To divide documents into topics, it is proposed to use the union of groups in relation to their centers. As patterns for each topic, a sequence of words ordered by frequency of occurrence from a common dictionary is considered.
The results of a computational experiment on collections of abstracts of scientific dissertations are presented. Sequences of words from the general dictionary on 4 topics are formed.
-
Влияние направленных перемещений хищника на формирование пространственных структур в модели трехвидового сообщества с учетом всеядности хищника
Компьютерные исследования и моделирование, 2023, т. 15, № 6, с. 1617-1634Рассматривается модель, описывающая пространственно-временную динамику сообщества, состоящего из трех популяций, представляющих звенья трофической цепи. Локальные взаимодействия популяций строятся по типу «хищник – жертва», причем хищник потребляет не только жертву, но и ресурс, составляющий рацион жертвы. В предыдущей работе автором был проведен анализ модели без учета пространственной неоднородности. Данное исследование продолжает модельное изучение сообщества, учитывая диффузию особей, а также направленные перемещения хищника. Предполагается, что хищник реагирует на пространственное изменение ресурса и жертвы, занимая области с более высокой плотностью или избегая их. В модели такое поведение описывается адвективным членом со скоростью, пропорциональной градиенту плотности ресурса и жертвы. Система рассматривается в одномерной области в предположении нулевых потоков через границу. Динамика модели определяется устойчивостью системы в окрестности пространственно-однородного равновесия к малым пространственно-неоднородным возмущениям. В работе проведен анализ возможности возникновения в системе волновой неустойчивости, приводящей к возникновению автоволн и неустойчивости Тьюринга, в результате которой образуются стационарные структуры. Получены достаточные условия существования обоих видов неустойчивости, определяющие границы области значений коэффициентов таксиса, при которых система может потерять устойчивость. Анализ влияния параметров локальной кинетики модели на возможность образования пространственных структур показал, что при положительном таксисе на ресурс возможна лишь неустойчивость Тьюринга, а при отрицательном — оба вида неустойчивости. Для поиска численного решения системы использован метод линий с расщеплением разностного оператора по физическим процессам. Пространственно-временная динамика системы представлена в нескольких вариантах, реализующих один из типов неустойчивости. В случае положительного таксиса на жертву в областях меньшего размера возможно как реализация автоволнового режима, так и образование стационарных структур; с увеличением области тьюринговы структуры не образуются. Если же таксис на жертву отрицательный, то стационарные структуры возникают в областях любого размера, периодические структуры появляются только в более крупных областях.
Ключевые слова: модель трехвидового сообщества, неустойчивость, вызванная трофотаксисом, пространственные структуры.
Pattern formation of a three-species predator – prey model with prey-taxis and omnivorous predator
Computer Research and Modeling, 2023, v. 15, no. 6, pp. 1617-1634The spatiotemporal dynamics of a three-component model for food web is considered. The model describes the interactions among resource, prey and predator that consumes both species. In a previous work, the author analyzed the model without taking into account spatial heterogeneity. This study continues the model study of the community considering the diffusion of individuals, as well as directed movements of the predator. It is assumed that the predator responds to the spatial change in the resource and prey density by occupying areas where species density is higher or avoiding them. Directed predator movement is described by the advection term, where velocity is proportional to the gradient of resource and prey density. The system is considered on a one-dimensional domain with zero-flux conditions as boundary ones. The spatiotemporal dynamics produced by model is determined by the system stability in the vicinity of stationary homogeneous state with respect to small inhomogeneous perturbations. The paper analyzes the possibility of wave instability leading to the emergence of autowaves and Turing instability, as a result of which stationary patterns are formed. Sufficient conditions for the existence of both types of instability are obtained. The influence of local kinetic parameters on the spatial structure formation was analyzed. It was shown that only Turing instability is possible when taxis on the resource is positive, but with a negative taxis, both types of instability are possible. The numerical solution of the system was found by using method of lines (MOL) with the numerical integration of ODE system by means of splitting techniques. The spatiotemporal dynamics of the system is presented in several variants, realizing one of the instability types. In the case of a positive taxis on the prey, both autowave and stationary structures are formed in smaller regions, with an increase in the region size, Turing structures are not formed. For negative taxis on the prey, stationary patterns is observed in both regions, while periodic structures appear only in larger areas.
-
Особенности социальных взаимодействий: базовая модель
Компьютерные исследования и моделирование, 2023, т. 15, № 6, с. 1673-1693В работе рассматриваются базовая модель конкурентных взаимодействий и ее использование для анализа и описания социальных процессов. Особенностью модели является то, что она описывает взаимодействие нескольких конкурирующих акторов, при этом акторы могут варьировать стратегию своих действий, в частности, образовывать коалиции для совместного противодействия общему противнику.
В результате моделирования выявлены различные режимы конкурентного взаимодействия, проведена их классификация, описаны их особенности. В ходе исследования уделено внимание так называемым негрубым (по А.А. Андронову) случаям реализации конкурентного взаимодействия, которые до сих пор редко рассматривались в научной литературе, но зато достаточно часто встречаются в реальной жизни. Сиспо льзованием базовой математической модели рассмотрены условия реализации различных режимов конкурентных взаимодействий, определены условия перехода от одних режимов к другим, приведены примеры реализации этих режимов в экономике, социальной и политической жизни.
Показано, что при относительно невысоком уровне конкуренции, носящей неантагонистический характер, конкуренция может приводить к повышению активности взаимодействующих акторов и к общему экономическому росту. Причем при наличии расширяющихся ресурсных возможностей (до тех пор, пока такие возможности сохраняются) данный рост может иметь гиперболический характер. При снижении ресурсных возможностей и усилении конкуренции происходит переход к колебательному режиму, когда более слабые акторы объединяются для совместного противодействия более сильным. При дальнейшем снижении ресурсных возможностей и усилении конкуренции происходит переход к формированию устойчивых иерархических структур. При этом модель показывает, что в определенный момент происходит потеря устойчивости, система становится негрубой (по А.А. Андронову) и чувствительной к флуктуациям изменений параметров. В результате сложившиеся иерархии могут разрушиться и замениться на новые. При дальнейшем повышении интенсивности конкуренции происходит полное подавление актором-лидером своих оппонентов и установление монополизма.
Приведены примеры из экономической, социальной, политической жизни, иллюстрирующие закономерности, выявленные на основе моделирования с использованием базовой модели конкуренции. Полученные результаты могут быть использованы при анализе, моделировании и прогнозировании социально-экономических и политических процессов.
Ключевые слова: конкуренция, математическое моделирование, игра с нулевой и положительной суммой, монополизм, иерархии, динамическое равновесие, устойчивые структуры.
Features of social interactions: the basic model
Computer Research and Modeling, 2023, v. 15, no. 6, pp. 1673-1693The paper considers the basic model of competitive interactions and its use for the analysis and description of social processes. The peculiarity of the model is that it describes the interaction of several competing actors, while actors can vary the strategy of their actions, in particular, form coalitions to jointly counter a common enemy. As a result of modeling, various modes of competitive interaction were identified, their classification was conducted, and their features were described. In the course of the study, the attention is paid to the so-called “rough” (according to A.A. Andronov) cases of the implementation of competitive interaction, which until now have rarely been considered in the scientific literature, but are quite common in real life. Using a basic mathematical model, the conditions for the implementation of various modes of competitive interactions are considered, the conditions for the transition from one mode to another are determined, examples of the implementation of these modes in the economy, social and political life are given. It is shown that with a relatively low level of competition, which is non-antagonistic in nature, competition can lead to an increase in the activity of interacting actors and to overall economic growth. Moreover, in the presence of expanding resource opportunities (as long as such opportunities remain), this growth may have a hyperbolic character. With a decrease in resource capabilities and increased competition, there is a transition to an oscillatory mode, when weaker actors unite to jointly counteract stronger ones. With a further decrease in resource opportunities and increased competition, there is a transition to the formation of stable hierarchical structures. At the same time, the model shows that at a certain moment there is a loss of stability, the system becomes “rough” according to A.A. Andronov and sensitive to fluctuations in parameter changes. As a result, the existing hierarchies may collapse and be replaced by new ones. With a further increase in the intensity of competition, the actor-leader completely suppresses his opponents and establishes monopolism. Examples from economic, social, and political life are given, illustrating the patterns identified on the basis of modeling using the basic model of competition. The obtained results can be used in the analysis, modeling and forecasting of socioeconomic and political processes.
Журнал индексируется в Scopus
Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU
Журнал входит в систему Российского индекса научного цитирования.
Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science
Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"