Все выпуски

[ Switch to English ]

Применение бета-регрессии в задаче альтернативного сплайсинга гена CD44

 pdf (809K)

Изоформный состав гена CD44 тесно связан с прогрессированием злокачественных опухолей и формированием раковых стволовых клеток. Хотя механизм альтернативного сплайсинга обеспечивает выборочное включение вариа- бельных экзонов этого гена, общий регуляторный ландшафт данного процесса до сих пор остается малоизученным.

В настоящей работе предложен новый вычислительный подход к анализу регуляции сплайсинга, основанный на моделировании долей экспрессии транскриптов с помощью аппарата бета-регрессии. Автор реализовал математическую модель в виде глубокого нейросетевого регрессора, который совместно оценивает параметры вероятностного распределения и применяет регуляризацию методом эластичной сети для отбора наиболее значимых биологических признаков. Разработанный метод успешно применен для идентификации рибонуклеиново-связывающих белков, вы- полняющих роль факторов сплайсинга и напрямую управляющих выбором сайтов сборки гена CD44 в клетках колоректального рака. В построенных регрессионных моделях целевыми переменными выступают строго нормированные доли экспрессии изоформ, а в качестве признаков используются уровни экспрессии потенциальных регуляторов.

В ходе исследования детально сопоставлены две схемы постановки задачи машинного обучения. Первая схема реализует классический подход «один против всех», предполагающий построение отдельной изолированной модели для каждой рассматриваемой изоформы. Второй подход представляет собой метод дерева изоформ, базирующий- ся на последовательном иерархическом разбиении транскриптов по наличию вариабельных экзонов с независимым подбором регуляторных белков на каждом этапе алгоритма. Вычислительная корректность программной реализации была предварительно подтверждена на искусственно сгенерированных данных: модель продемонстрировала высокую точность восстановления параметров при полном отсутствии систематического смещения оценок. Последующий сравнительный анализ на клинических данных выявил явное преимущество схемы «один против всех» с точки зрения итогового качества и стабильности предсказаний.

Биологический анализ результатов не только подтвердил участие известных регуляторов гена CD44, но и позволил выявить новые потенциальные факторы регуляции, среди которых выделяются белки ACO1, NUDT21 и AGO2. Для фактора ACO1 автор сформулировал оригинальную гипотезу, напрямую связывающую внутриклеточный метаболизм железа и регуляцию изоформного состава гена CD44. Полученные выводы существенно расширяют текущее понимание молекулярных механизмов онкогенеза.

Ключевые слова: бета-регрессия, машинное обучение, сплайсинг, CD44
Цитата: Пирогов А.А. Применение бета-регрессии в задаче альтернативного сплайсинга гена CD44 // Компьютерные исследования и моделирование, 2026, т. 18, № 3, с. 697-714
Citation in English: Pirogov A.A. Application of beta regression to the CD44 alternative splicing problem // Computer Research and Modeling, 2026, vol. 18, no. 3, pp. 697-714
DOI: 10.20537/2076-7633-2026-18-3-697-714
Creative Commons License Статья доступна по лицензии Creative Commons Attribution-NoDerivs 3.0 Unported License.

Copyright © 2026 Пирогов А.А.

Журнал индексируется в Scopus

Полнотекстовая версия журнала доступна также на сайте научной электронной библиотеки eLIBRARY.RU

Журнал включен в базу данных Russian Science Citation Index (RSCI) на платформе Web of Science

Международная Междисциплинарная Конференция "Математика. Компьютер. Образование"

Международная Междисциплинарная Конференция МАТЕМАТИКА. КОМПЬЮТЕР. ОБРАЗОВАНИЕ.