Текущий выпуск Номер 1, 2024 Том 16

Все выпуски

Результаты поиска по 'fragmentation':
Найдено статей: 20
  1. Якушевич Л.В.
    Биомеханика ДНК: вращательные колебания оснований
    Компьютерные исследования и моделирование, 2011, т. 3, № 3, с. 319-328

    В данной работе изучаются вращательные колебания азотистых оснований, образующих центральную пару в коротком фрагменте ДНК, состоящем из трех пар оснований. Построен простой механический аналог фрагмента, в котором основания имитируются маятниками, а взаимодействия между основаниями — пружинками. Получен лагранжиан модельной системы и уравнения движения. Получены решения уравнений движения для однородного случая, когда рассматриваемый фрагмент ДНК состоит из одинаковых пар оснований: из пар аденин-тимин (AT) или гуанинцитозин (GC). Построены траектории модельной системы в конфигурационном пространстве.

    Yakushevich L.V.
    Biomechanics of DNA: rotational oscillations of bases
    Computer Research and Modeling, 2011, v. 3, no. 3, pp. 319-328

    In this paper we study the rotational oscillations of the nitrous bases forming a central pair in a short DNA fragment consisting of three base pairs. A simple mechanical analog of the fragment where the bases are imitated by pendulums and the interactions between pendulums — by springs, has been constructed. We derived Lagrangian of the model system and the nonlinear equations of motions. We found solutions in the homogeneous case when the fragment considered consists of identical base pairs: Adenine-Thymine (AT- pair) or Guanine-Cytosine (GC-pair). The trajectories of the model system in the configuration space were also constructed.

    Просмотров за год: 3. Цитирований: 2 (РИНЦ).
  2. Аронов И.З., Максимова О.В., Зажигалкин А.В.
    Исследование времени достижения консенсуса в работе технических комитетов по стандартизации на основе регулярных марковских цепей
    Компьютерные исследования и моделирование, 2015, т. 7, № 4, с. 941-950

    В статье построена математическая модель обеспечения консенсуса в работе технических комитетов по стандартизации (ТК), основанная на модели консенсуса, предложенной ДеГроотом. Проанализированы основные проблемы достижения консенсуса при разработке консенсусных стандартов в условиях предложенной модели. Представлены результаты статистического моделирования, характеризующие зависимость времени достижения консенсуса от числа членов ТК и их авторитарности. Показано, что увеличение числа экспертов ТК и их авторитарности негативно влияет на время достижения консенсуса и увеличивает разобщенность группы.

    Aronov I.Z., Maksimova O.V., Zazhigalkin A.V.
    Investigation of time to reach consensus on the work of technical committees on standardization based on regular Markov chains
    Computer Research and Modeling, 2015, v. 7, no. 4, pp. 941-950

    In this paper construct the mathematical model for consensus in technical committees for standardization (TC), based on the consensus model proposed DeGroot. The basic problems of achieving consensus in the development of consensus standards in terms of the proposed model are discussed. The results of statistical modeling characterizing the dependence of time to reach consensus on the number of members of the TC and their authoritarianism are presented. It has been shown that increasing the number of TC experts and authoritarianism negative impact on the time to reach a consensus and increase fragmentation of the TC.

    Просмотров за год: 5. Цитирований: 8 (РИНЦ).
  3. Выход биомассы — отношение вновь синтезированного вещества растущих клеток к количеству потребленного субстрата — источника вещества и энергии для роста клеток. Выход является характеристикой эффективности конверсии субстрата в биомассу. Эта конверсия выполняется метаболизмом, который является полным множеством биохимических реакций, происходящих в клетках.

    В этой работе заново рассмотрена проблема предсказания максимального выхода роста живых клеток, основанная на балансе всего метаболизма клеток и его фрагментов, названных парциальными обменами (ПО). Для рассмотрения задачи использованы следующие ПО. При росте на любом субстрате мы рассматриваем стандартный конструктивный обмен (СКО), который состоит из одинаковых метаболических путей при росте различных организмов на любом субстрате. СКО начинается с нескольких стандартных соединений (узловых метаболитов): глюкоза, ацетил-КоА, $\alpha$-кетоглутарат, эритрозо-4-фосфат, оксалоацетат, рибозо-5-фосфат, 3-фосфоглицерат, фосфоенолпируват, пируват. Также рассматриваем передний метаболизм (ПМ) — остальная часть полного метаболизма. Первый ПО потребляет макроэргические связи (МЭС), образованные вторым ПО. В данной работе мы рассматриваем обобщенный вариант ПМ, когда учтены возможное наличие внеклеточных продуктов метаболизма и возможность как аэробного, так и анаэробного роста. Вместо отдельных балансов образования каждого узлового метаболита, как это было сделано в нашей предыдущей работе, данная работа имеет дело сразу со всем множеством этих метаболитов. Это делает решение задачи более компактным и требующим меньшего числа биохимических величин и значительно меньшего вычислительного времени. Выведено уравнение, выражающее максимальный выход биомассы через удельные количества МЭС, образованных и потребленных парциальными обменами. Оно содержит удельное потребление МЭС стандартным конструктивным обменом, которое является универсальным биохимическим параметром, применимым к широкому диапазону организмов и субстратов роста. Чтобы корректно определить этот параметр, полный конструктивный обмен и его передняя часть рассмотрены для роста клеток на глюкозе как наиболее изученном субстрате. Здесь мы использовали открытые ранее свойства элементного состава липидной и безлипидной частей биомассы. Было сделано численное исследование влияния вариаций соотношений между потоками через различные узловые метаболиты. Оно показало, что потребности СКО в макроэргических связях и NAD(P)H практически являются константами. Найденный коэффициент «МЭС/образованная биомасса» является эффективным средством для нахождения оценок максимального выхода биомассы из субстратов, для которых известен их первичный метаболизм. Вычисление отношения «АТФ/субстрат», необходимого для оценки выхода биомассы, сделано с помощью специального пакета компьютерных программ GenMetPath.

    Minkevich I.G.
    Estimation of maximal values of biomass growth yield based on the mass-energy balance of cell metabolism
    Computer Research and Modeling, 2019, v. 11, no. 4, pp. 723-750

    The biomass growth yield is the ratio of the newly synthesized substance of growing cells to the amount of the consumed substrate, the source of matter and energy for cell growth. The yield is a characteristic of the efficiency of substrate conversion to cell biomass. The conversion is carried out by the cell metabolism, which is a complete aggregate of biochemical reactions occurring in the cells.

    This work newly considers the problem of maximal cell growth yield prediction basing on balances of the whole living cell metabolism and its fragments called as partial metabolisms (PM). The following PM’s are used for the present consideration. During growth on any substrate we consider i) the standard constructive metabolism (SCM) which consists of identical pathways during growth of various organisms on any substrate. SCM starts from several standard compounds (nodal metabolites): glucose, acetyl-CoA 2-oxoglutarate, erythrose-4-phosphate, oxaloacetate, ribose-5- phosphate, 3-phosphoglycerate, phosphoenolpyruvate, and pyruvate, and ii) the full forward metabolism (FM) — the remaining part of the whole metabolism. The first one consumes high-energy bonds (HEB) formed by the second one. In this work we examine a generalized variant of the FM, when the possible presence of extracellular products, as well as the possibilities of both aerobic and anaerobic growth are taken into account. Instead of separate balances of each nodal metabolite formation as it was made in our previous work, this work deals at once with the whole aggregate of these metabolites. This makes the problem solution more compact and requiring a smaller number of biochemical quantities and substantially less computational time. An equation expressing the maximal biomass yield via specific amounts of HEB formed and consumed by the partial metabolisms has been derived. It includes the specific HEB consumption by SCM which is a universal biochemical parameter applicable to the wide range of organisms and growth substrates. To correctly determine this parameter, the full constructive metabolism and its forward part are considered for the growth of cells on glucose as the mostly studied substrate. We used here the found earlier properties of the elemental composition of lipid and lipid-free fractions of cell biomass. Numerical study of the effect of various interrelations between flows via different nodal metabolites has been made. It showed that the requirements of the SCM in high-energy bonds and NAD(P)H are practically constants. The found HEB-to-formed-biomass coefficient is an efficient tool for finding estimates of maximal biomass yield from substrates for which the primary metabolism is known. Calculation of ATP-to-substrate ratio necessary for the yield estimation has been made using the special computer program package, GenMetPath.

    Просмотров за год: 2.
  4. Чувилин К.В.
    Эффективный алгоритм сравнения документов в формате ${\mathrm{\LaTeX}}$
    Компьютерные исследования и моделирование, 2015, т. 7, № 2, с. 329-345

    Рассматривается задача построения различий, возникающих при редактировании документов в формате ${\mathrm{\LaTeX}}$. Каждый документ представляется в виде синтаксического дерева, узлы которого называются токенами. Строится минимально возможное текстовое представление документа, не меняющее синтаксическое дерево. Весь текст разбивается на фрагменты, границы которых соответствуют токенам. С помощью алгоритма Хиршберга строится отображение последовательности текстовых фрагментов изначального документа в аналогичную последовательность отредактированного документа, соответствующее минимальному редактирующему расстоянию. Строится отображение символов текстов, соответствующее отображению последовательностей текстовых фрагментов. В синтаксических деревьях выделяются токены такие, что символы соответствующих фрагментов текста при отображении либо все не меняются, либо все удаляются, либо все добавляются. Для деревьев, образованных остальными токенами, строится отображение с помощью алгоритма Zhang–Shasha.

    Chuvilin K.V.
    An efficient algorithm for ${\mathrm{\LaTeX}}$ documents comparing
    Computer Research and Modeling, 2015, v. 7, no. 2, pp. 329-345

    The problem is constructing the differences that arise on ${\mathrm{\LaTeX}}$ documents editing. Each document is represented as a parse tree whose nodes are called tokens. The smallest possible text representation of the document that does not change the syntax tree is constructed. All of the text is splitted into fragments whose boundaries correspond to tokens. A map of the initial text fragment sequence to the similar sequence of the edited document corresponding to the minimum distance is built with Hirschberg algorithm A map of text characters corresponding to the text fragment sequences map is cunstructed. Tokens, that chars are all deleted, or all inserted, or all not changed, are selected in the parse trees. The map for the trees formed with other tokens is built using Zhang–Shasha algorithm.

    Просмотров за год: 2. Цитирований: 2 (РИНЦ).
  5. Сызранова Н.Г., Андрущенко В.А.
    Численное моделирование физических процессов, приводящих к разрушению метеороидов в атмосфере Земли
    Компьютерные исследования и моделирование, 2022, т. 14, № 4, с. 835-851

    В рамках актуальной проблемы кометно-астероидной опасности численно исследуются физические процессы, вызывающие разрушение и фрагментацию метеорных тел в атмосфере Земли. На основе разработанной физико-математической модели, определяющей движение космических объектов естественного происхождения в атмосфере и их взаимодействия с ней, рассмотрено падение трех одних из самых крупных и по некоторым показателям необычных болидов в истории метеоритики: Тунгусского, Витимского и Челябинского. Их необычность заключается в отсутствии каких-либо материальных метеоритных останков и кратеров в районе предполагаемого места падения для двух первых тел и необнаружении, как предполагается, основного материнского тела для третьего тела (из-за слишком малого количества массы выпавших осколков по сравнению с оценочной массой). Изучено воздействие аэродинамических нагрузок и тепловых потоков на эти тела, приводящее к интенсивному поверхностному уносу массы и возможной фрагментации. Скорости изучаемых небесных тел, изменение их масс определяются из модернизированной системы уравнений теории метеорной физики. Важный фактор, который здесь учитывается, — это переменность параметра уноса массы метеорита под действием тепловых потоков (радиационных и конвективных) вдоль траектории полета. Процесс фрагментации болидов в настоящей работе рассматривается в рамках модели прогрессивного дробления на основе статистической теории прочности с учетом влияния масштабного фактора на предел прочности объектов. Выявлены явления и эффекты, возникающие при различных кинематических и физических параметрах каждого из этих тел. В частности, изменение баллистики их полета в более плотных слоях атмосферы, заключающееся в переходе от режима падения к режиму подъема. При этом возможна реализация следующих сценариев события: первый— возврат тела обратно в космическое пространство при его остаточной скорости, большей второй космической; второй — переход тела на орбиту спутника Земли при остаточной скорости, большей первой космической; третий — при меньших значениях остаточной скорости тела возвращение его через некоторое время к режиму падения и выпадение на значительном расстоянии от предполагаемого места падения. Именно реализация одного из этих трех сценариев события объясняет, например, отсутствие материальных следов, в том числе и кратеров в случае Тунгусского болида в окрестности вывала леса. Предположения о возможности таких сценариев события высказывались и ранее другими авторами, а в настоящей работе их реализация подтверждена результатами численных расчетов.

    Syzranova N.G., Andruschenko V.A.
    Numerical modeling of physical processes leading to the destruction of meteoroids in the Earth’s atmosphere
    Computer Research and Modeling, 2022, v. 14, no. 4, pp. 835-851

    Within the framework of the actual problem of comet-asteroid danger, the physical processes causing the destruction and fragmentation of meteor bodies in the Earth’s atmosphere are numerically investigated. Based on the developed physicalmathematical models that determines the movements of space objects of natural origin in the atmosphere and their interaction with it, the fall of three, one of the largest and by some parameters unusual bolides in the history of meteoritics, are considered: Tunguska, Vitim and Chelyabinsk. Their singularity lies in the absence of any material meteorite remains and craters in the area of the alleged crash site for the first two bodies and the non-detection, as it is assumed, of the main mother body for the third body (due to the too small amount of mass of the fallen fragments compared to the estimated mass). The effect of aerodynamic loads and heat flows on these bodies are studied, which leads to intensive surface mass loss and possible mechanical destruction. The velocities of the studied celestial bodies and the change in their masses are determined from the modernized system of equations of the theory of meteoric physics. An important factor that is taken into account here is the variability of the meteorite mass entrainment parameter under the action of heat fluxes (radiation and convective) along the flight path. The process of fragmentation of meteoroids in this paper is considered within the framework of a progressive crushing model based on the statistical theory of strength, taking into account the influence of the scale factor on the ultimate strength of objects. The phenomena and effects arising at various kinematic and physical parameters of each of these bodies are revealed. In particular, the change in the ballistics of their flight in the denser layers of the atmosphere, consisting in the transition from the fall mode to the ascent mode. At the same time, the following scenarios of the event can be realized: 1) the return of the body back to outer space at its residual velocity greater than the second cosmic one; 2) the transition of the body to the orbit of the Earth satellite at a residual velocity greater than the first cosmic one; 3) at lower values of the residual velocity of the body, its return after some time to the fall mode and falling out at a considerable distance from the intended crash site. It is the implementation of one of these three scenarios of the event that explains, for example, the absence of material traces, including craters, in the case of the Tunguska bolide in the vicinity of the forest collapse. Assumptions about the possibility of such scenarios have been made earlier by other authors, and in this paper their implementation is confirmed by the results of numerical calculations.

  6. Краснов Ф.В., Смазневич И.С., Баскакова Е.Н.
    Метод контрастного семплирования для предсказания библиографических ссылок
    Компьютерные исследования и моделирование, 2021, т. 13, № 6, с. 1317-1336

    В работе рассматривается задача поиска в научной статье фрагментов с недостающими библиографическими ссылками с помощью автоматической бинарной классификации. Для обучения модели предложен метод контрастного семплирования, новшеством которого является рассмотрение контекста ссылки с учетом границ фрагмента, максимально влияющего на вероятность нахождения в нем библиографической ссылки. Обучающая выборка формировалась из автоматически размеченных семплов — фрагментов из трех предложений с метками классов «без ссылки» и «со ссылкой», удовлетворяющих требованию контрастности: семплы разных классов дистанцируются в исходном тексте. Пространство признаков строилось автоматически по статистике встречаемости термов и расширялось за счет конструирования дополнительных признаков — выделенных в тексте сущностей ФИО, чисел, цитат и аббревиатур.

    Проведена серия экспериментов на архивах научных журналов «Правоприменение» (273 статьи) и «Журнал инфектологии» (684 статьи). Классификация осуществлялась моделями Nearest Neighbours, RBF SVM, Random Forest, Multilayer Perceptron, с подбором оптимальных гиперпараметров для каждого классификатора.

    Эксперименты подтвердили выдвинутую гипотезу. Наиболее высокую точность показал нейросетевой классификатор (95%), уступающий по скорости линейному, точность которого при контрастном семплировании также оказалась высока (91–94 %). Полученные значения превосходят результаты, опубликованные для задач NER и анализа тональности на данных со сравнимыми характеристиками. Высокая вычислительная эффективность предложенного метода позволяет встраивать его в прикладные системы и обрабатывать документы в онлайн-режиме.

    Krasnov F.V., Smaznevich I.S., Baskakova E.N.
    Bibliographic link prediction using contrast resampling technique
    Computer Research and Modeling, 2021, v. 13, no. 6, pp. 1317-1336

    The paper studies the problem of searching for fragments with missing bibliographic links in a scientific article using automatic binary classification. To train the model, we propose a new contrast resampling technique, the innovation of which is the consideration of the context of the link, taking into account the boundaries of the fragment, which mostly affects the probability of presence of a bibliographic links in it. The training set was formed of automatically labeled samples that are fragments of three sentences with class labels «without link» and «with link» that satisfy the requirement of contrast: samples of different classes are distanced in the source text. The feature space was built automatically based on the term occurrence statistics and was expanded by constructing additional features — entities (names, numbers, quotes and abbreviations) recognized in the text.

    A series of experiments was carried out on the archives of the scientific journals «Law enforcement review» (273 articles) and «Journal Infectology» (684 articles). The classification was carried out by the models Nearest Neighbors, RBF SVM, Random Forest, Multilayer Perceptron, with the selection of optimal hyperparameters for each classifier.

    Experiments have confirmed the hypothesis put forward. The highest accuracy was reached by the neural network classifier (95%), which is however not as fast as the linear one that showed also high accuracy with contrast resampling (91–94%). These values are superior to those reported for NER and Sentiment Analysis on comparable data. The high computational efficiency of the proposed method makes it possible to integrate it into applied systems and to process documents online.

  7. Тишкин В.Ф., Трапезникова М.А., Чечина А.А., Чурбанова Н.Г.
    Моделирование транспортных потоков на основе квазигазодинамического подхода и теории клеточных автоматов с использованием суперкомпьютеров
    Компьютерные исследования и моделирование, 2024, т. 16, № 1, с. 175-194

    Целью исследования являются моделирование динамики автотранспортных потоков на транспортных сетях мегаполисов и систематизация современного состояния дел в этой области. Во введении указывается, что на первый план выходит развитие интеллектуальных транспортных систем, которые становятся неотъемлемой частью современных транспортных технологий. Основным ядром таких систем являются адекватные математические модели, максимально приближенные к реальности. Отмечается, что в связи с большим объемом вычислений необходимо использование суперкомпьютеров, следовательно, создание специальных пар аллельных алгоритмов. В начале статьи приводится современная классификация моделей, обсуждаются отличительные особенности каждого класса со ссылками на соответствующие примеры. Далее основное внимание уделяется созданным авторами статьи разработкам в области как макроскопического, так и микроскопического моделирования и определению места этих разработок в приведенной выше классификации. Макроскопическая модель основана на приближении сплошной среды и использует идеологию квазигазодинамических систем уравнений. Указаны ее достоинства по сравнению с существующими моделями этого класса. Система уравнений модели представлена как в одномерном варианте, но с возможностью исследования многополосного движения, так и в двумерном варианте, с введением понятия боковой скорости, то есть скорости перестроения из полосы в полосу. Второй вариант позволяет проводить вычисления в расчетной области, соответствующей реальной геометрии дороги. Представлены тестовые расчеты движения по дороге с локальным расширением и по дороге с системой светофоров с различными светофорными режимами. Расчеты позволили в первом случае сделать интересные выводы о влиянии расширения на пропускную способность дороги в целом, а во втором случае — выбрать оптимальный режим для получения эффекта «зеленой волны». Микроскопическая модель основана на теории клеточных автоматов и однополосной модели Нагеля – Шрекенберга и обобщена авторами на случай многополосного движения. В модели реализованы различные поведенческие стратегии водителей. В качестве теста моделируется движение на реальном участке транспортной сети в центре г. Москвы. Причем для грамотного прохождения транспортных узлов сети в соответствии с правилами движения реализованы специальные алгоритмы, адаптированные для параллельных вычислений. Тестовые расчеты выполнены на суперкомпьютере К-100 ЦКП ИПМ им. М. В. Келдыша РАН.

    Tishkin V.F., Trapeznikova M.A., Chechina A.A., Churbanova N.G.
    Simulation of traffic flows based on the quasi-gasdynamic approach and the cellular automata theory using supercomputers
    Computer Research and Modeling, 2024, v. 16, no. 1, pp. 175-194

    The purpose of the study is to simulate the dynamics of traffic flows on city road networks as well as to systematize the current state of affairs in this area. The introduction states that the development of intelligent transportation systems as an integral part of modern transportation technologies is coming to the fore. The core of these systems contain adequate mathematical models that allow to simulate traffic as close to reality as possible. The necessity of using supercomputers due to the large amount of calculations is also noted, therefore, the creation of special parallel algorithms is needed. The beginning of the article is devoted to the up-to-date classification of traffic flow models and characterization of each class, including their distinctive features and relevant examples with links. Further, the main focus of the article is shifted towards the development of macroscopic and microscopic models, created by the authors, and determination of the place of these models in the aforementioned classification. The macroscopic model is based on the continuum approach and uses the ideology of quasi-gasdynamic systems of equations. Its advantages are indicated in comparison with existing models of this class. The model is presented both in one-dimensional and two-dimensional versions. The both versions feature the ability to study multi-lane traffic. In the two-dimensional version it is made possible by introduction of the concept of “lateral” velocity, i. e., the speed of changing lanes. The latter version allows for carrying out calculations in the computational domain which corresponds to the actual geometry of the road. The section also presents the test results of modeling vehicle dynamics on a road fragment with the local widening and on a road fragment with traffic lights, including several variants of traffic light regimes. In the first case, the calculations allow to draw interesting conclusions about the impact of a road widening on a road capacity as a whole, and in the second case — to select the optimal regime configuration to obtain the “green wave” effect. The microscopic model is based on the cellular automata theory and the single-lane Nagel – Schreckenberg model and is generalized for the multi-lane case by the authors of the article. The model implements various behavioral strategies of drivers. Test computations for the real transport network section in Moscow city center are presented. To achieve an adequate representation of vehicles moving through the network according to road traffic regulations the authors implemented special algorithms adapted for parallel computing. Test calculations were performed on the K-100 supercomputer installed in the Centre of Collective Usage of KIAM RAS.

  8. Воронина М.Ю., Орлов Ю.Н.
    Определение автора текста методом сегментации
    Компьютерные исследования и моделирование, 2022, т. 14, № 5, с. 1199-1210

    В работе описывается метод распознавания авторов литературных текстов по близости фрагментов, на которые разделен отдельный текст, к эталону автора. Эталоном является эмпирическое распределение частот буквосочетаний, построенное по обучающей выборке, куда вошли экспертно отобранные достоверно известные произведения данного автора. Совокупность эталонов разных авторов образует библиотеку, внутри которой и решается задача об идентификации автора неизвестного текста. Близость между текстами понимается в смысле нормы в L1 для вектора частот буквосочетаний, который строится для каждого фрагмента и для текста в целом. Автором неизвестного текста назначается тот, эталон которого чаще всего выбирается в качестве ближайшего для набора фрагментов, на которые разделен текст. Длина фрагмента оптимизируется исходя из принципа максимального различия расстояний от фрагментов до эталонов в задаче распознавания «свой–чужой». Тестирование метода проведено на корпусе отечественных и зарубежных (в переводе) авторов. Были собраны 1783 текста 100 авторов суммарным объемом примерно 700 млн знаков. Чтобы исключить тенденциозность отбора авторов, рассматривались авторы, фамилии которых начинались на одну и ту же букву (в данном случае Л). Ошибка идентификации по биграммам составила 12%. Наряду с достаточно высокой точностью данный метод обладает еще одним важным свойством: он позволяет оценить вероятность того, что эталон автора рассматриваемого текста в библиотеке отсутствует. Эта вероятность может быть оценена по результатам статистики ближайших эталонов для малых фрагментов текста. В работе исследуются также статистические цифровые портреты писателей: это совместные эмпирические распределения вероятности того, что некоторая доля текста идентифицируется на заданном уровне доверия. Практическая важность этих статистик в том, что носители соответствующих распределений практически не пересекаются для своих и чужих эталонов, что позволяет распознать эталонное распределение буквосочетаний на высоком уровне доверия.

    Voronina M.Y., Orlov Y.N.
    Identification of the author of the text by segmentation method
    Computer Research and Modeling, 2022, v. 14, no. 5, pp. 1199-1210

    The paper describes a method for recognizing authors of literary texts by the proximity of fragments into which a separate text is divided to the standard of the author. The standard is the empirical frequency distribution of letter combinations, built on a training sample, which included expertly selected reliably known works of this author. A set of standards of different authors forms a library, within which the problem of identifying the author of an unknown text is solved. The proximity between texts is understood in the sense of the norm in L1 for the frequency vector of letter combinations, which is constructed for each fragment and for the text as a whole. The author of an unknown text is assigned the one whose standard is most often chosen as the closest for the set of fragments into which the text is divided. The length of the fragment is optimized based on the principle of the maximum difference in distances from fragments to standards in the problem of recognition of «friend–foe». The method was tested on the corpus of domestic and foreign (translated) authors. 1783 texts of 100 authors with a total volume of about 700 million characters were collected. In order to exclude the bias in the selection of authors, authors whose surnames began with the same letter were considered. In particular, for the letter L, the identification error was 12%. Along with a fairly high accuracy, this method has another important property: it allows you to estimate the probability that the standard of the author of the text in question is missing in the library. This probability can be estimated based on the results of the statistics of the nearest standards for small fragments of text. The paper also examines statistical digital portraits of writers: these are joint empirical distributions of the probability that a certain proportion of the text is identified at a given level of trust. The practical importance of these statistics is that the carriers of the corresponding distributions practically do not overlap for their own and other people’s standards, which makes it possible to recognize the reference distribution of letter combinations at a high level of confidence.

  9. Жмуров А.А., Алексеенко А.Е., Барсегов В.А., Кононова О.Г., Холодов Я.А.
    Фазовый переход от α-спиралей к β-листам в суперспиралях фибриллярных белков
    Компьютерные исследования и моделирование, 2013, т. 5, № 4, с. 705-725

    Изучен переход от α-структур к β-структурам под воздействием внешнего механического поля в молекуле фибрина, содержащей суперспирали, и разрешен ландшафт энергии. Проведено детальное теоретическое моделирование отдельных этапов процесса растяжения суперспирального фрагмента. На графиках зависимости силы (F) от растяжения молекулы (X) для тандема из двух симметричных суперспиралей фибрина (длина каждой ∼17 нм) видны три режима механического поведения: (1) линейный (упругий) режим, в котором суперспирали ведут себя как энтропийная пружина (F<100−125 пН и X<7−8 нм), (2) вязкий (пластичный) режим, в котором сила сопротивления молекулы не меняется с увеличением растяжения (F≈150 пН и X≈10−35 нм) и (3) нелинейный режим зависимости F от X (F>175−200 пН и X>40−50 нм). В линейном режиме суперспирали раскручиваются на угол в 2π радиан, но структурные изменения на уровне вторичной структуры не происходят. Вязкий режим сопровождается фазовым переходом от тройных α-спиралей к параллельным β-листам, в результате которого изменяется вторичная структура. Критическое растяжение α-спиралей составляет 0.25 нм на один виток, а характерное изменение энергии — 4.9 ккал/моль. Также были подсчитаны связанные с фазовым переходом изменения во внутренней энергии Δu, энтропии Δs и механической емкости cf из расчета на один виток α-спирали. Подобное динамическое поведение α-спиралей при растяжении белковых филаментов может являться универсальным механизмом регуляции фибриллярных α-спиральных белков в ответ на внешнее силовое воздействие, возникающее в результате действия биологических сил.

    Zhmurov A.A., Alekseenko A.E., Barsegov V.A., Kononova O.G., Kholodov Y.A.
    Phase transition from α-helices to β-sheets in supercoils of fibrillar proteins
    Computer Research and Modeling, 2013, v. 5, no. 4, pp. 705-725

    The transition from α-helices to β-strands under external mechanical force in fibrin molecule containing coiled-coils is studied and free energy landscape is resolved. The detailed theoretical modeling of each stage of coiled-coils fragment pulling process was performed. The plots of force (F) as a function of molecule expansion (X) for two symmetrical fibrin coiled-coils (each ∼17 nm in length) show three distinct modes of mechanical behaviour: (1) linear (elastic) mode when coiled-coils behave like entropic springs (F<100−125 pN and X<7−8 nm), (2) viscous (plastic) mode when molecule resistance force does not increase with increase in elongation length (F≈150 pN and X≈10−35 nm) and (3) nonlinear mode (F>175−200 pN and X>40−50 nm). In linear mode the coiled-coils unwind at 2π radian angle, but no structural transition occurs. Viscous mode is characterized by the phase transition from the triple α-spirals to three-stranded parallel β-sheet. The critical tension of α-helices is 0.25 nm per turn, and the characteristic energy change is equal to 4.9 kcal/mol. Changes in internal energy Δu, entropy Δs and force capacity cf per one helical turn for phase transition were also computed. The observed dynamic behavior of α-helices and phase transition from α-helices to β-sheets under tension might represent a universal mechanism of regulation of fibrillar protein structures subject to mechanical stresses due to biological forces.

    Просмотров за год: 6. Цитирований: 1 (РИНЦ).
  10. Абдуллатыпов А.В., Цыганков А.А.
    Моделирование пространственной структуры гидрогеназы HydSL пурпурной серной бактерии Thiocapsa roseopersicina BBS
    Компьютерные исследования и моделирование, 2013, т. 5, № 4, с. 737-747

    В данной работе представлены модели железоникелевой гидрогеназы HydSL пурпурной серной бактерии Thiocapsa roseopersicina BBS. Показано, что полученные модели обладают более высоким уровнем доверия по сравнению с опубликованными ранее; впервые получена полноразмерная модель HydSL-гидрогеназы. Показана свободная ориентация С-концевого фрагмента малой субъединицы относительно основной белковой глобулы. Показано, что у термостабильной гидрогеназы HydSL Allochromatium vinosum и у полученной нами модели примерно одинаковое количество межсубъединичных ионных пар и их больше, чем у термолабильной гидрогеназы HydAB Desulfovibrio vulgaris.

    Abdullatypov A.V., Tsygankov A.A.
    Homology modeling of the spatial structure of HydSL hydrogenase from purple sulphur bacterium Thiocapsa roseopersicina BBS
    Computer Research and Modeling, 2013, v. 5, no. 4, pp. 737-747

    The results of homology modeling of HydSL, a NiFe-hydrogenase from purple sulphur bacterium Thiocapsa roseopersicina BBS are presented in this work. It is shown that the models have larger confidence level than earlier published ones; a full-size model of HydSL hydrogenase is presented for the first time. The C-end fragment of the enzyme is shown to have random orientation in relation to the main protein globule. The obtain models have a large number of ion pairs, as well as thermostable HydSL hydrogenase from Allochromatium vinosum, in contrast to thermolabile HydAB hydrogenase from Desulfovibrio vulgaris.

    Просмотров за год: 2. Цитирований: 5 (РИНЦ).
Страницы: предыдущая

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.