Текущий выпуск Номер 1, 2024 Том 16

Все выпуски

Результаты поиска по 'feature selection':
Найдено статей: 15
  1. Многомерные данные, при использовании значительно большего количества признаков относительно меньшего числа наблюдений, порождают хорошо известную проблему переопределённой задачи. В связи с этим, представляется целесообразным описание данных в терминах меньшего числа мета-признаков, которые вычисляются при помощи так называемых матричных факторизаций. Такие факторизации способствуют уменьшению случайного шума при сохранении наиболее существенной информации. Три новых и взаимосвязанных метода предложены в этой статье: 1) факторизационный механизм градиентного спуска с двумя (согласно размерности микрочипа) гибкими и адаптируемыми параметрами обучения, включая явные формулы их автоматического пересчета, 2) непараметрический критерий для отбора количества факторов, и 3) неотрицательная модификация градиентной факторизации, которая не требует дополнительных вычислительных затрат в сравнении с базовой моделью. Мы иллюстрируем эффективность предложенных методов в приложении к задаче направляемой классификации данных в области биоинформатики.

    Microarray datasets are highly dimensional, with a small number of collected samples in comparison to thousands of features. This poses a significant challenge that affects the interpretation, applicability and validation of the analytical results. Matrix factorizations have proven to be a useful method for describing data in terms of a small number of meta-features, which reduces noise, while still capturing the essential features of the data. Three novel and mutually relevant methods are presented in this paper: 1) gradient-based matrix factorization with two adaptive learning rates (in accordance with the number of factor matrices) and their automatic updates; 2) nonparametric criterion for the selection of the number of factors; and 3) nonnegative version of the gradient-based matrix factorization which doesn't require any extra computational costs in difference to the existing methods. We demonstrate effectiveness of the proposed methods to the supervised classification of gene expression data.

    Цитирований: 4 (РИНЦ).
  2. Эффективность производственного процесса непосредственно зависит от качества управления технологией, которая, в свою очередь, опирается на точность и оперативность обработки контрольно- измерительной информации. Разработка математических методов исследования системных связей и закономерностей функционирования и построение математических моделей с учетом структурных особенностей объекта исследований, а также написание программных продуктов для реализации данных методов являются актуальными задачами. Практика показала, что список параметров, имеющих место при исследовании сложного объекта современного производства, варьируется от нескольких десятков до нескольких сот наименований, причем степень воздействия каждого из факторов в начальный момент не ясна. Приступать к работе по непосредственному определению модели в этих условиях нельзя — объем требуемой информации может оказаться слишком велик, причем бóльшая часть работы по сбору этой информации будет проделана впустую из-за того, что степень влияния на параметры оптимизации большинства факторов из первоначального списка окажется пренебрежимо малой. Поэтому необходимым этапом при определении модели сложного объекта является работа по сокращению размерности факторного пространства. Большинство промышленных производств являются групповыми иерархическими процессами массового и крупносерийного производства, характеризующимися сотнями факторов. (Для примера реализации математических методов и апробации построенных моделей в основу были взяты данные Молдавского металлургического завода.) С целью исследования системных связей и закономерностей функционирования таких сложных объектов обычно выбираются несколько информативных параметров и осуществляется их выборочный контроль. В данной статье описывается последовательность приведения исходных показателей технологического процесса выплавки стали к виду, пригодному для построения математической модели с целью прогнозирования, внедрения новых видов стали и создание основы для разработки системы автоматизированного управления качеством продукции. В процессе преобразования выделяются следующие этапы: сбор и анализ исходных данных, построение таблицы слабокоррелированных параметров, сокращение факторного пространства с помощью корреляционных плеяд и метода весовых коэффициентов. Полученные результаты позволяют оптимизировать процесс построения модели многофакторного процесса.

    Efficiency of production directly depends on quality of the management of technology which, in turn, relies on the accuracy and efficiency of the processing of control and measuring information. Development of the mathematical methods of research of the system communications and regularities of functioning and creation of the mathematical models taking into account structural features of object of researches, and also writing of the software products for realization of these methods are an actual task. Practice has shown that the list of parameters that take place in the study of complex object of modern production, ranging from a few dozen to several hundred names, and the degree of influence of each factor in the initial time is not clear. Before working for the direct determination of the model in these circumstances, it is impossible — the amount of the required information may be too great, and most of the work on the collection of this information will be done in vain due to the fact that the degree of influence on the optimization of most factors of the original list would be negligible. Therefore, a necessary step in determining a model of a complex object is to work to reduce the dimension of the factor space. Most industrial plants are hierarchical group processes and mass volume production, characterized by hundreds of factors. (For an example of realization of the mathematical methods and the approbation of the constructed models data of the Moldavian steel works were taken in a basis.) To investigate the systemic linkages and patterns of functioning of such complex objects are usually chosen several informative parameters, and carried out their sampling. In this article the sequence of coercion of the initial indices of the technological process of the smelting of steel to the look suitable for creation of a mathematical model for the purpose of prediction is described. The implementations of new types became also creation of a basis for development of the system of automated management of quality of the production. In the course of weak correlation the following stages are selected: collection and the analysis of the basic data, creation of the table the correlated of the parameters, abbreviation of factor space by means of the correlative pleiads and a method of weight factors. The received results allow to optimize process of creation of the model of multiple-factor process.

    Просмотров за год: 6. Цитирований: 1 (РИНЦ).
  3. Колдоба А.В., Скалько Ю.И.
    Численное моделирование распространения прямоточных волн внутрипластового горения в инверсном режиме
    Компьютерные исследования и моделирование, 2020, т. 12, № 5, с. 993-1006

    Одной из перспективных технологий повышения нефтеотдачи при разработке нетрадиционных нефтяных пластов является метод термогазового воздействия. Метод основан на закачке в пласт кислородосодержащей смеси и ее трансформации в высокоэффективный смешивающийся с пластовой нефтью вытесняющий агент за счет самопроизвольных внутрипластовых окислительных процессов. В ряде случаев этот метод обладает большим потенциалом по сравнению с другими способами повышения нефтеотдачи. В данной работе рассматриваются некоторые вопросы распространения волн внутрипластового горения. В зависимости от параметров коллектора и закачиваемой смеси такие волны могут распространяться в различных режимах. В данной работе рассматривается только прямоточный инверсный режим распространения. В этом режиме волна горения распространяется в направлении течения окислителя и фронт реакции отстает от тепловой волны, в которой вещество (углеводородные фракции, пористый скелет и др.) прогреваются до температур, достаточных для протекания реакции окисления. В работе представлены результаты аналитического исследования и численного моделирования структуры инверсной волны внутрипластового горения при двухфазном течении в пористом слое. Сделаны упрощающие предположения о теплофизических свойствах флюидных фаз, которые позволяют, с одной стороны, сделать модель внутрипластового горения обозримой для анализа, а с другой — передать основные особенности этого процесса. Рассмотрено решение типа «бегущая волна» и указаны условия его реализации. Выделено два режима распространения инверсных волн внутрипластового горения: гидродинамический и кинетический. Численное моделирование распространения волны внутрипластового горения проводилось с помощью термогидродинамического симулятора, разработанного для численного интегрирования неизотермических многокомпонентных фильтрационных течений, сопровождающихся фазовыми переходами и химическими реакциями.

    Koldoba A.V., Skalko Y.I.
    Numerical simulation of inverse mode propagation in-situ combustion direct-flow waves
    Computer Research and Modeling, 2020, v. 12, no. 5, pp. 993-1006

    One of the promising technologies for enhanced oil recovery in the development of unconventional oil reservoirs is the thermo-gas method. The method is based on the injection of an oxygen-containing mixture into the formation and its transformation into a highly efficient displacing agent miscible with the formation of oil due to spontaneous in-situ oxidative processes. In some cases, this method has great potential compared to other methods of enhanced oil recovery. This paper discusses some issues of the propagation of in-situ combustion waves. Depending on the parameters of the reservoir and the injected mixture, such waves can propagate in different modes. In this paper, only the direct-flow inverse propagation mode is considered. In this mode, the combustion wave propagates in the direction of the oxidant flow and the reaction front lags behind the heatwave, in which the substance (hydrocarbon fractions, porous skeleton, etc.) is heated to temperatures sufficient for the oxidation reaction to occur. The paper presents the results of an analytical study and numerical simulation of the structure of the inverse wave of in-situ combustion. in two-phase flow in a porous layer. Some simplifying assumptions about the thermal properties of fluid phases was accepted, which allow, on the one hand, to modify the in-situ combustion model observable for analysis, and with another is to convey the main features of this process. The solution of the “running wave” type is considered and the conditions of its implementation are specified. Selected two modes of reaction trailing front regime in-situ combustion waves: hydrodynamic and kinetic. Numerical simulation of the in-situ combustion wave propagation was carried out with using the thermohydrodynamical simulator developed for the numerical integration of non-isothermal multicomponent filtration flows accompanied by phase transitions and chemical reaction.

  4. Петров М.Н., Зимина С.В., Дьяченко Д.Л., Дубоделов А.В., Симаков С.С.
    Двухпроходная модель Feature-Fused SSD для детекции разномасштабных изображений рабочих на строительной площадке
    Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 57-73

    При распознавании рабочих на изображениях строительной площадки, получаемых с камер наблюдения, типичной является ситуация, при которой объекты детекции имеют сильно различающийся пространственный масштаб относительно друг друга и других объектов. Повышение точности детекции мелких объектов может быть обеспечено путем использования Feature-Fused модификации детектора SSD (Single Shot Detector). Вместе с применением на инференсе нарезки изображения с перекрытием такая модель хорошо справляется с детекцией мелких объектов. Однако при практическом использовании данного подхода требуется ручная настройка параметров нарезки. При этом снижается точность детекции объектов на сценах, отличающихся от сцен, использованных при обучении, а также крупных объектов. В данной работе предложен алгоритм автоматического выбора оптимальных параметров нарезки изображения в зависимости от соотношений характерных геометрических размеров объектов на изображении. Нами разработан двухпроходной вариант детектора Feature-Fused SSD для автоматического определения параметров нарезки изображения. На первом проходе применяется усеченная версия детектора, позволяющая определять характерные размеры объектов интереса. На втором проходе осуществляется финальная детекция объектов с параметрами нарезки, выбранными после первого прохода. Был собран датасет с изображениями рабочих на строительной площадке. Датасет включает крупные, мелкие и разноплановые изображения рабочих. Для сравнения результатов детекции для однопроходного алгоритма без разбиения входного изображения, однопроходного алгоритма с равномерным разбиением и двухпроходного алгоритма с подбором оптимального разбиения рассматривались тесты по детекции отдельно крупных объектов, очень мелких объектов, с высокой плотностью объектов как на переднем, так и на заднем плане, только на заднем плане. В диапазоне рассмотренных нами случаев наш подход превосходит подходы, взятые в сравнение, позволяет хорошо бороться с проблемой двойных детекций и демонстрирует качество 0,82–0,91 по метрике mAP (mean Average Precision).

    Petrov M.N., Zimina S.V., Dyachenko D.L., Dubodelov A.V., Simakov S.S.
    Dual-pass Feature-Fused SSD model for detecting multi-scale images of workers on the construction site
    Computer Research and Modeling, 2023, v. 15, no. 1, pp. 57-73

    When recognizing workers on images of a construction site obtained from surveillance cameras, a situation is typical in which the objects of detection have a very different spatial scale relative to each other and other objects. An increase in the accuracy of detection of small objects can be achieved by using the Feature-Fused modification of the SSD detector. Together with the use of overlapping image slicing on the inference, this model copes well with the detection of small objects. However, the practical use of this approach requires manual adjustment of the slicing parameters. This reduces the accuracy of object detection on scenes that differ from the scenes used in training, as well as large objects. In this paper, we propose an algorithm for automatic selection of image slicing parameters depending on the ratio of the characteristic geometric dimensions of objects in the image. We have developed a two-pass version of the Feature-Fused SSD detector for automatic determination of optimal image slicing parameters. On the first pass, a fast truncated version of the detector is used, which makes it possible to determine the characteristic sizes of objects of interest. On the second pass, the final detection of objects with slicing parameters selected after the first pass is performed. A dataset was collected with images of workers on a construction site. The dataset includes large, small and diverse images of workers. To compare the detection results for a one-pass algorithm without splitting the input image, a one-pass algorithm with uniform splitting, and a two-pass algorithm with the selection of the optimal splitting, we considered tests for the detection of separately large objects, very small objects, with a high density of objects both in the foreground and in the background, only in the background. In the range of cases we have considered, our approach is superior to the approaches taken in comparison, allows us to deal well with the problem of double detections and demonstrates a quality of 0.82–0.91 according to the mAP (mean Average Precision) metric.

  5. Жданова О.Л., Жданов В.С., Неверова Г.П.
    Моделирование динамики планктонного сообщества с учетом токсичности фитопланктона
    Компьютерные исследования и моделирование, 2022, т. 14, № 6, с. 1301-1323

    Предложена трехкомпонентная модельпланк тонного сообщества с дискретным временем. Сообщество представлено зоопланктоном и двумя конкурирующими за ресурсы видами фитопланктона: токсичным и нетоксичным. Модельдв ух связанных уравнений Рикера, ориентированная на описание динамики конкурентного сообщества, используется для описания взаимодействия двух видов фитопланктона и позволяет неявно учитывать ограничение роста биомассы каждого из видов-конкурентов доступностью внешних ресурсов. Изъятие фитопланктона за счет питания зоопланктоном описывается трофической функцией Холлинга II типа с учетом насыщения хищника. Способность фитопланктона защищаться от хищничества и избирательность питания хищника учтены в виде ограничения потребления: зоопланктон питается только нетоксичным фитопланктоном.

    Анализ сценариев перехода от стационарной динамики к колебаниям численности сообщества показал, что потеря устойчивости нетривиального равновесия, соответствующего сосуществованию двух видов фитопланктона и зоопланктона, может происходитьч ерез каскад бифуркаций удвоения периода, также возникает бифуркация Неймарка – Сакера, ведущая к возникновению квазипериодических колебаний. Вариация внутрипопуляционных параметров фито- или зоопланктона может приводитьк выраженным изменениям динамического режима в сообществе: резким переходам от регулярной к квазипериодической динамике и далее к точным циклам с небольшим периодом или даже стационарной динамике. В областях мультистабильности возможна кардинальная смена как динамического режима, так и состава сообщества за счет изменения начальных условий или же текущего состава сообщества. Предложенная в данной работе трехкомпонентная модель динамики сообщества с дискретным временем, являясь достаточно простой, позволяет получитьадекв атную динамику взаимодействующих видов: возникают динамические режимы, отражающие основные свойства экспериментальной динамики. Так, наблюдается динамика характерная для модели «хищник–жертва» без учета эволюции — с отставанием динамики хищника от жертвы примерно на четвертьперио да. Рассмотрение генетической неоднородности фитопланктона, даже в случае выделения всего двух генетически различных форм: токсичного и нетоксичного, позволяет наблюдатьв модели как длиннопериодические противофазные циклы хищника и жертвы, так и скрытые циклы, при которых плотностьч исленности жертв остается практически постоянной, а плотность численности хищников колеблется, демонстрируя влияние быстрой эволюции, маскирующей трофическое взаимодействие видов.

    Zhdanova O.L., Zhdanov V.S., Neverova G.P.
    Modeling the dynamics of plankton community considering phytoplankton toxicity
    Computer Research and Modeling, 2022, v. 14, no. 6, pp. 1301-1323

    We propose a three-component discrete-time model of the phytoplankton-zooplankton community, in which toxic and non-toxic species of phytoplankton compete for resources. The use of the Holling functional response of type II allows us to describe an interaction between zooplankton and phytoplankton. With the Ricker competition model, we describe the restriction of phytoplankton biomass growth by the availability of external resources (mineral nutrition, oxygen, light, etc.). Many phytoplankton species, including diatom algae, are known not to release toxins if they are not damaged. Zooplankton pressure on phytoplankton decreases in the presence of toxic substances. For example, Copepods are selective in their food choices and avoid consuming toxin-producing phytoplankton. Therefore, in our model, zooplankton (predator) consumes only non-toxic phytoplankton species being prey, and toxic species phytoplankton only competes with non-toxic for resources.

    We study analytically and numerically the proposed model. Dynamic mode maps allow us to investigate stability domains of fixed points, bifurcations, and the evolution of the community. Stability loss of fixed points is shown to occur only through a cascade of period-doubling bifurcations. The Neimark – Sacker scenario leading to the appearance of quasiperiodic oscillations is found to realize as well. Changes in intrapopulation parameters of phytoplankton or zooplankton can lead to abrupt transitions from regular to quasi-periodic dynamics (according to the Neimark – Sacker scenario) and further to cycles with a short period or even stationary dynamics. In the multistability areas, an initial condition variation with the unchanged values of all model parameters can shift the current dynamic mode or/and community composition.

    The proposed discrete-time model of community is quite simple and reveals dynamics of interacting species that coincide with features of experimental dynamics. In particular, the system shows behavior like in prey-predator models without evolution: the predator fluctuations lag behind those of prey by about a quarter of the period. Considering the phytoplankton genetic heterogeneity, in the simplest case of two genetically different forms: toxic and non-toxic ones, allows the model to demonstrate both long-period antiphase oscillations of predator and prey and cryptic cycles. During the cryptic cycle, the prey density remains almost constant with fluctuating predators, which corresponds to the influence of rapid evolution masking the trophic interaction.

  6. В работе предложен адаптивный алгоритм, моделирующий процесс формирования начальных поведенческих навыков на примере системы «глаза–манипулятор» анимата. Ситуация формирования начальных поведенческих навыков возникает, например, когда ребенок осваивает управление своими руками на основе понимания связи между исходно неидентифицированными пятнами на сетчатке своих глаз и положением реального предмета. Поскольку навыки управления телом не «вшиты» исходно в головной и спинной мозг на уровне инстинктов, то человеческому ребенку, как и большинству детенышей других млекопитающих, приходится осваивать эти навыки в режиме поискового поведения. Поисковое поведение начинается с метода проб и ошибок в чистом виде, затем его вклад постепенно уменьшается по мере освоения своего тела и окружающей среды. Поскольку образцов правильного поведения на этом этапе развития организм не имеет, то единственным способом выделения правильных навыков является положительное подкрепление при достижении цели. Ключевой особенностью предлагаемого алгоритма является фиксация в режиме импринтинга только завершающих действий, которые привели к успеху, или, что очень важно, привели к уже знакомой запечатленной ситуации, однозначно приводящей к успеху. Со временем непрерывная цепочка правильных действий удлиняется — максимально используется предыдущий позитивный опыт, а негативный «забывается» и не используется. Тем самым наблюдается постепенная замена случайного поиска целенаправленными действиями, что наблюдается и у реальных детенышей.

    Тем самым алгоритм способен устанавливать соответствие между закономерностями окружающего мира и «внутренними ощущениями», внутренним состоянием самого анимата. В предлагаемой модели анимата использовалось 2 типа нейросетей: 1) нейросеть NET1, на вход которой подавались текущие положения кисти руки и целевой точки, а на выходе — двигательные команды, направляющие «кисть» манипулятора анимата к целевой точке; 2) нейросеть NET2, которая на входе получала координаты цели и текущей координаты «кисти», а на выходе формировала значение вероятности того, что анимату уже «знакома» эта ситуация и он «знает», как на нее реагировать. Благодаря такой архитектуре у анимата есть возможность опираться на «опыт» нейросети в распознанных ситуациях, когда отклик от сети NET2 близок к 1, и, с другой стороны, запускать случайный поиск, когда опыта функционирования в этой области зрительного поля у анимата нет (отклик NET2 близок к 0).

    Tumanyan A.G., Bartsev S.I.
    Model of formation of primary behavioral patterns with adaptive behavior based on the combination of random search and experience
    Computer Research and Modeling, 2016, v. 8, no. 6, pp. 941-950

    In this paper, we propose an adaptive algorithm that simulates the process of forming the initial behavioral skills on the example of the system ‘eye-arm’ animat. The situation is the formation of the initial behavioral skills occurs, for example, when a child masters the management of their hands by understanding the relationship between baseline unidentified spots on the retina of his eye and the position of the real object. Since the body control skills are not ‘hardcoded’ initially in the brain and the spinal cord at the level of instincts, the human child, like most young of other mammals, it is necessary to develop these skills in search behavior mode. Exploratory behavior begins with trial and error and then its contribution is gradually reduced as the development of the body and its environment. Since the correct behavior patterns at this stage of development of the organism does not exist for now, then the only way to select the right skills is a positive reinforcement to achieve the objective. A key feature of the proposed algorithm is to fix in the imprinting mode, only the final action that led to success, and that is very important, led to the familiar imprinted situation clearly leads to success. Over time, the continuous chain is lengthened right action — maximum use of previous positive experiences and negative ‘forgotten’ and not used.

    Thus there is the gradual replacement of the random search purposeful actions that observed in the real young. Thus, the algorithm is able to establish a correspondence between the laws of the world and the ‘inner feelings’, the internal state of the animat. The proposed animat model was used 2 types of neural networks: 1) neural network NET1 to the input current which is fed to the position of the brush arms and the target point, and the output of motor commands, directing ‘brush’ manipulator animat to the target point; 2) neural network NET2 is received at the input of target coordinates and the current coordinates of the ‘brush’ and the output value is formed likelihood that the animat already ‘know’ this situation, and he ‘knows’ how to react to it. With this architecture at the animat has to rely on the ‘experience’ of neural networks to recognize situations where the response from NET2 network of close to 1, and on the other hand, run a random search, when the experience of functioning in this area of the visual field in animat not (response NET2 close to 0).

    Просмотров за год: 6. Цитирований: 2 (РИНЦ).
  7. Малыгина Н.В., Сурков П.Г.
    О моделировании преодоления водной преграды Rangifer tarandus L
    Компьютерные исследования и моделирование, 2019, т. 11, № 5, с. 895-910

    Видоспецифическими поведенческими признаками дикого северного оленя Rangifer tarandus L. традиционно признаны сезонные миграции и стадный инстинкт. В период миграций эти животные вынуждены преодолевать водные преграды. Особенности поведения рассматриваются как результат процесса селекции, когда среди множества стратегий выбрана единственно эволюционно-стабильная, определяющая репродукцию и биологическую выживаемость дикого северного оленя как вида. Ввиду эскалации промышленного освоения Арктики в настоящее время естественные процессы в популяциях диких северных оленей таймырской популяции происходят на фоне увеличения влияния негативных факторов, поэтому естественно возникла необходимость выявления этологических особенностей этих животных. В настоящей работе представлены результаты применения классических методов теории оптимального управления и дифференциальных игр к исследованию миграционных этограмм диких северных оленей при преодолении водных преград, в том числе крупных рек. На основе этологических особенностей этих животных и форм поведения стадо представляется в качестве управляемой динамической системы. Также оно делится на два класса особей: вожак и остальное стадо, для которых строятся свои модели, описывающие траектории их движения. В основу моделей закладываются гипотезы, представляющие собой математическую формализацию некоторых схем поведения животных. Данный подход позволил найти траекторию важенки с использованием методов теории оптимального управления, а при построении траекторий остальных особей — применить принцип управления с поводырем. Апробация полученных результатов, которые могут быть использованы в формировании общей «платформы» для систематического построения моделей адаптивного поведения и в качестве задела для фундаментальных разработок моделей когнитивной эволюции, проводится численно на модельном примере, использующем данные наблюдений на реке Верхняя Таймыра.

    Malygina N.V., Surkov P.G.
    On the modeling of water obstacles overcoming by Rangifer tarandus L
    Computer Research and Modeling, 2019, v. 11, no. 5, pp. 895-910

    Seasonal migrations and herd instinct are traditionally recognized as wild reindeer (Rangifer tarandus L.) species-specific behavioral signs. These animals are forced to overcome water obstacles during the migrations. Behaviour peculiarities are considered as the result of the selection process, which has chosen among the sets of strategies, as the only evolutionarily stable one, determining the reproduction and biological survival of wild reindeer as a species. Natural processes in the Taimyr population wild reindeer are currently occurring against the background of an increase in the influence of negative factors due to the escalation of the industrial development of the Arctic. That is why the need to identify the ethological features of these animals completely arose. This paper presents the results of applying the classical methods of the theory of optimal control and differential games to the wild reindeer study of the migration patterns in overcoming water barriers, including major rivers. Based on these animals’ ethological features and behavior forms, the herd is presented as a controlled dynamic system, which presents also two classes of individuals: the leader and the rest of the herd, for which their models, describing the trajectories of their movement, are constructed. The models are based on hypotheses, which are the mathematical formalization of some animal behavior patterns. This approach made it possible to find the trajectory of the important one using the methods of the optimal control theory, and in constructing the trajectories of other individuals, apply the principle of control with a guide. Approbation of the obtained results, which can be used in the formation of a common “platform” for the adaptive behavior models systematic construction and as a reserve for the cognitive evolution models fundamental development, is numerically carried out using a model example with observational data on the Werchnyaya Taimyra River.

  8. Шокиров Ф.Ш.
    Взаимодействие бризера с доменной стенкой в двумерной О(3) нелинейной сигма-модели
    Компьютерные исследования и моделирование, 2017, т. 9, № 5, с. 773-787

    Методами численного моделирования проведено исследование процессов взаимодействия осциллирующего солитона (бризера) с 180-градусной доменной стенкой нееловского типа в рамках (2 + 1)-мерной суперсимметричной О(3) нелинейной сигма-модели. Целью настоящей работы является исследование нелинейной эволюции и устойчивости системы взаимодействующих локализованных динамических и топологических решений. Для построения моделей взаимодействия были использованы стационарные бризерные решения и решения в виде доменных стенок, полученные в рамках двумерного уравнения синус-Гордона добавлением специально подобранных возмущений вектору А3-поля в изотопическом пространстве блоховской сферы. При отсутствии внешнего магнитного поля нелинейные сигма-модели обладают формальной лоренц-инвариантностью, которая позволяет построить, в частности, движущиеся решения и провести полный анализ экспериментальных данных нелинейной динамики системы взаимодействующих солитонов. В настоящей работе на основе полученных движущихся локализованных решений построены модели налетающих и лобовых столкновений бризеров с доменной стенкой, где, в зависимости от динамических параметров системы, наблюдаются процессы столкновения и отражения солитонов друг от друга, дальнодействующие взаимодействия, а также распад осциллирующего солитона на линейные волны возмущений. В отличие от бризерного решения, обладающего динамикой внутренней степени свободы, интеграл энергии топологически устойчивого солитона во всех проведенных экспериментах сохраняется с высокой точностью. Для каждого типа взаимодействия определен интервал значений скорости движения сталкивающихся динамических и топологических солитонов в зависимости от частоты вращения вектора А3-поля в изотопическом пространстве. Численные модели построены на основе методов теории конечных разностных схем, использованием свойств стереографической проекции, с учетом теоретико-групповых особенностей конструкций класса O(N) нелинейных сигма-моделей теории поля. По периметру двумерной области моделирования установлены специально разработанные граничные условия, которые поглощают линейные волны возмущений, излучаемые взаимодействующими солитонными полями. Таким образом, осуществлено моделирование процессов взаимодействия локализованных решений в бесконечном двумерном фазовом пространстве. Разработан программный модуль, позволяющий провести комплексный анализ эволюции взаимодействующих решений нелинейных сигма-моделей теории поля, с учетом ее групповых особенностей в двумерном псевдоевклидовом пространстве. Проведен анализ изоспиновой динамики, а также плотности и интеграла энергии системы взаимодействующих динамических и топологических солитонов.

    Shokirov F.S.
    Interaction of a breather with a domain wall in a two-dimensional O(3) nonlinear sigma model
    Computer Research and Modeling, 2017, v. 9, no. 5, pp. 773-787

    By numerical simulation methods the interaction processes of oscillating soliton (breather) with a 180-degree Neel domain wall in the framework of a (2 + 1)-dimensional supersymmetric O(3) nonlinear sigma model is studied. The purpose of this paper is to investigate nonlinear evolution and stability of a system of interacting localized dynamic and topological solutions. To construct the interaction models, were used a stationary breather and domain wall solutions, where obtained in the framework of the two-dimensional sine-Gordon equation by adding specially selected perturbations to the A3-field vector in the isotopic space of the Bloch sphere. In the absence of an external magnetic field, nonlinear sigma models have formal Lorentz invariance, which allows constructing, in particular, moving solutions and analyses the experimental data of the nonlinear dynamics of an interacting solitons system. In this paper, based on the obtained moving localized solutions, models for incident and head-on collisions of breathers with a domain wall are constructed, where, depending on the dynamic parameters of the system, are observed the collisions and reflections of solitons from each other, a long-range interactions and also the decay of an oscillating soliton into linear perturbation waves. In contrast to the breather solution that has the dynamics of the internal degree of freedom, the energy integral of a topologically stable soliton in the all experiments the preserved with high accuracy. For each type of interaction, the range of values of the velocity of the colliding dynamic and topological solitons is determined as a function of the rotation frequency of the A3-field vector in the isotopic space. Numerical models are constructed on the basis of methods of the theory of finite difference schemes, using the properties of stereographic projection, taking into account the group-theoretical features of constructions of the O(N) class of nonlinear sigma models of field theory. On the perimeter of the two-dimensional modeling area, specially developed boundary conditions are established that absorb linear perturbation waves radiated by interacting soliton fields. Thus, the simulation of the interaction processes of localized solutions in an infinite two-dimensional phase space is carried out. A software module has been developed that allows to carry out a complex analysis of the evolution of interacting solutions of nonlinear sigma models of field theory, taking into account it’s group properties in a two-dimensional pseudo-Euclidean space. The analysis of isospin dynamics, as well the energy density and energy integral of a system of interacting dynamic and topological solitons is carried out.

    Просмотров за год: 6.
  9. Макаров И.С., Баганцова Е.Р., Яшин П.А., Ковалёва М.Д., Захарова Е.М.
    Разработка и исследование жесткого алгоритма анализа публикаций в Twitter и их влияния на движение рынка криптовалют
    Компьютерные исследования и моделирование, 2023, т. 15, № 1, с. 157-170

    Посты в социальных сетях являются важным индикатором, отображающим положение активов на финансовом рынке. В статье описывается жесткое решение задачи классификации для определения влияния активности в социальных сетях на движение финансового рынка. Отбираются аккаунты авторитетных в сообществе крипто-трейдеров-инфлюенсеров. В качестве данных используются специальные пакеты сообщений, которые состоят из текстовых постов, взятых из Twitter. Приведены способы предобработки текста, заключающиеся в лемматизации Stanza и применении регулярных выражений, для очищения зашумленных текстов, особенностью которых является многочисленное употребление сленговых слов и сокращений. Решается задача бинарной классификации, где слово рассматривается как элемент вектора единицы данных. Для более точного описания криптовалютной активности ищутся наилучшие параметры разметки для обработки свечей Binance. Методы выявления признаков, необходимых для точного описания текстовых данных и последующего процесса установления зависимости, представлены в виде машинного обучения и статистического анализа. В качестве первого используется отбор признаков на основе критерия информативности, который применяется при разбиении решающего дерева на поддеревья. Такой подход реализован в модели случайного леса и актуален для задачи выбора значимых для «стрижки деревьев» признаков. Второй же основан на жестком составлении бинарного вектора в ходе грубой проверки наличия либо отсутствия слова в пакете и подсчете суммы элементов этого вектора. Затем принимается решение в зависимости от преодоления этой суммой порогового значения, базирующегося на уровне, предварительно подобранном с помощью анализа частотного распределения упоминаний слова. Алгоритм, используемый для решения проблемы, был назван бенчмарком и проанализирован в качестве инструмента. Подобные алгоритмы часто используются в автоматизированных торговых стратегиях. В процессе исследования также описаны наблюдения влияния часто встречающихся в тексте слов, которые используются в качестве базиса размерностью 2 и 3 при векторизации.

    Makarov I.S., Bagantsova E.R., Iashin P.A., Kovaleva M.D., Zakharova E.M.
    Development of and research into a rigid algorithm for analyzing Twitter publications and its influence on the movements of the cryptocurrency market
    Computer Research and Modeling, 2023, v. 15, no. 1, pp. 157-170

    Social media is a crucial indicator of the position of assets in the financial market. The paper describes the rigid solution for the classification problem to determine the influence of social media activity on financial market movements. Reputable crypto traders influencers are selected. Twitter posts packages are used as data. The methods of text, which are characterized by the numerous use of slang words and abbreviations, and preprocessing consist in lemmatization of Stanza and the use of regular expressions. A word is considered as an element of a vector of a data unit in the course of solving the problem of binary classification. The best markup parameters for processing Binance candles are searched for. Methods of feature selection, which is necessary for a precise description of text data and the subsequent process of establishing dependence, are represented by machine learning and statistical analysis. First, the feature selection is used based on the information criterion. This approach is implemented in a random forest model and is relevant for the task of feature selection for splitting nodes in a decision tree. The second one is based on the rigid compilation of a binary vector during a rough check of the presence or absence of a word in the package and counting the sum of the elements of this vector. Then a decision is made depending on the superiority of this sum over the threshold value that is predetermined previously by analyzing the frequency distribution of mentions of the word. The algorithm used to solve the problem was named benchmark and analyzed as a tool. Similar algorithms are often used in automated trading strategies. In the course of the study, observations of the influence of frequently occurring words, which are used as a basis of dimension 2 and 3 in vectorization, are described as well.

  10. Мусаев А.А., Григорьев Д.А.
    Обзор современных технологий извлечения знаний из текстовых сообщений
    Компьютерные исследования и моделирование, 2021, т. 13, № 6, с. 1291-1315

    Решение общей проблемы информационного взрыва связано с системами автоматической обработки цифровых данных, включая их распознавание, сортировку, содержательную обработку и представление в виде, приемлемом для восприятия человеком. Естественным решением является создание интеллектуальных систем извлечения знаний из неструктурированной информации. При этом явные успехи в области обработки структурированных данных контрастируют со скромными достижениями в области анализа неструктурированной информации, в частности в задачах обработки текстовых документов. В настоящее время данное направление находится в стадии интенсивных исследований и разработок. Данная работа представляет собой системный обзор международных и отечественных публикаций, посвященных ведущему тренду в области автоматической обработки потоков текстовой информации, а именно интеллектуальному анализу текстов или Text Mining (TM). Рассмотрены основные задачи и понятия TM, его место в области проблемы искусственного интеллекта, а также указаны сложности при обработке текстов на естественном языке (NLP), обусловленные слабой структурированностью и неоднозначностью лингвистической ин- формации. Описаны стадии предварительной обработки текстов, их очистка и селекция признаков, которые, наряду с результатами морфологического, синтаксического и семантического анализа, являются компонентами TM. Процесс интеллектуального анализа текстов представлен как отображение множества текстовых документов в «знания», т.е. в очищенную от избыточности и шума совокупность сведений, необходимых для решения конкретной прикладной задачи. На примере задачи трейдинга продемонстрирована формализация принятия торгового решения, основанная на совокупности аналитических рекомендаций. Типичными примерами TM являются задачи и технологии информационного поиска (IR), суммаризации текста, анализа тональности, классификации и кластеризации документов и т. п. Общим вопросом для всех методов TM является выбор типа словоформ и их производных, используемых для распознавания контента в последовательностях символов NL. На примере IR рассмотрены типовые алгоритмы поиска, основанные на простых словоформах, фразах, шаблонах и концептах, а также более сложные технологии, связанные с дополнением шаблонов синтаксической и семантической информацией. В общем виде дано описание механизмов NLP: морфологический, синтаксический, семантический и прагматический анализ. Приведен сравнительный анализ современных инструментов TM, позволяющий осуществить выбор платформы, исходя из особенности решаемой задачи и практических навыков пользователя.

    Musaev A.A., Grigoriev D.A.
    Extracting knowledge from text messages: overview and state-of-the-art
    Computer Research and Modeling, 2021, v. 13, no. 6, pp. 1291-1315

    In general, solving the information explosion problem can be delegated to systems for automatic processing of digital data. These systems are intended for recognizing, sorting, meaningfully processing and presenting data in formats readable and interpretable by humans. The creation of intelligent knowledge extraction systems that handle unstructured data would be a natural solution in this area. At the same time, the evident progress in these tasks for structured data contrasts with the limited success of unstructured data processing, and, in particular, document processing. Currently, this research area is undergoing active development and investigation. The present paper is a systematic survey on both Russian and international publications that are dedicated to the leading trend in automatic text data processing: Text Mining (TM). We cover the main tasks and notions of TM, as well as its place in the current AI landscape. Furthermore, we analyze the complications that arise during the processing of texts written in natural language (NLP) which are weakly structured and often provide ambiguous linguistic information. We describe the stages of text data preparation, cleaning, and selecting features which, alongside the data obtained via morphological, syntactic, and semantic analysis, constitute the input for the TM process. This process can be represented as mapping a set of text documents to «knowledge». Using the case of stock trading, we demonstrate the formalization of the problem of making a trade decision based on a set of analytical recommendations. Examples of such mappings are methods of Information Retrieval (IR), text summarization, sentiment analysis, document classification and clustering, etc. The common point of all tasks and techniques of TM is the selection of word forms and their derivatives used to recognize content in NL symbol sequences. Considering IR as an example, we examine classic types of search, such as searching for word forms, phrases, patterns and concepts. Additionally, we consider the augmentation of patterns with syntactic and semantic information. Next, we provide a general description of all NLP instruments: morphological, syntactic, semantic and pragmatic analysis. Finally, we end the paper with a comparative analysis of modern TM tools which can be helpful for selecting a suitable TM platform based on the user’s needs and skills.

Страницы: следующая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.