Виявлення впливу природного відбору на ДНК за допомогою штучного інтелекту Planet-Vie

Підходи до штучного інтелекту представляють нові програми для виявлення впливу позитивного відбору на геном. Вони починаються з фази, яка контролюється під час моделювання, а потім застосовується до природних даних. Дозвіл є поступовим після процесу, який називається глибоким навчанням. Перші результати, отримані на даних про людей, здаються дуже перспективними.

Більша частина варіацій ДНК всередині видів, мабуть, зумовлена так званими нейтральними мутаціями в тому сенсі, що еволюція їх частоти алелів по суті є випадковою під впливом генетичного дрейфу. Рідкісні вигідні мутації та шкідливі модифікують фенотип, який є ціллю відбору, позитивний у першому випадку, негативний у другому. Вигідні мутації, надаючи вигоду особам, які їх носять, є основним джерелом еволюційної адаптації. Їх еволюція (позитивний відбір) суттєво відрізняється від еволюції нейтральних мутацій. Однак пошук слідів позитивного відбору вздовж генома є непростим завданням, яке вимагає послідовності та аналізу ДНК великої кількості особин.

Спочатку розроблені методи статистичного аналізу для виявлення ознак позитивного відбору порівнювали генетичну мінливість, що спостерігається у локусі, із мінливістю, яка очікується у випадку нейтральної моделі (локус піддається лише нейтральним мутаціям). Ця модель базувалася на припущенні, що зміна частоти нейтральної мутації зумовлена лише випадковістю. Він також зробив тверді припущення щодо демографії розглянутого населення (однорідне населення, постійна робоча сила тощо). Отже, значні результати також можуть бути зумовлені вибором демографічних ефектів.

Новий міждисциплінарний підхід, який використовується для цих скринінгових аналізів виявлення, спирається на штучний інтелект, який має на меті імітувати функціонування мозку людини. Точніше, найбільш часто використовувані аналізи базуються на так званих методах глибокого навчання з поступовим уточненням класифікації між областями ДНК, вибраними чи ні, або навіть між різними селективними режимами (Shrider та Kern, 2017). Вони передбачають так зване контрольоване навчання. Програма спочатку дізнається про контрольні набори даних, де відома точна відповідь. Ці набори даних отримуються тут шляхом моделювання віртуальних даних. Навчена таким чином програма застосовується до реальних даних, раніше невідомих програмі, для виявлення областей ДНК, що підлягає відбору.

Одним з головних аргументів на користь цього типу методів є те, що вони роблять слабші припущення щодо способу зміни сукупності, ніж статистичні методи, які використовувались спочатку. Проте етап попереднього нагляду залишається залежним від демографічного сценарію, як правило, випливає з даних. Якщо цей сценарій не відповідає дійсності, результати можуть бути неправильними. Ще однією критикою є чорний ящик підходу: незрозуміло, що саме являє собою нібито селективний сигнал. Тому важко критично поглянути на результати і уявити альтернативні гіпотези. Однак сучасні дослідження спрямовані на характеристику цього сигналу.

Підсумовуючи, ці результати говорять про те, що штучний інтелект може бути ефективнішим при виявленні ділянок ДНК, підданих позитивному відбору, ніж статистичні методи, розроблені спочатку.

Список літератури

Itan, Y., Powell, A., Beaumont, M. A., Burger, J., & Thomas, M. G. (2009). Витоки стійкості лактази в Європі. PLoS обчислювальна біологія, 5 (8), e1000491.
Schrider, D. R., & Kern, A. D. (2017). М’які розгортки - це домінуючий спосіб адаптації в геномі людини. Молекулярна біологія та еволюція, 34 (8), 1863-1877.
Сагден, Л. А., Аткінсон, Е. Г., Фішер, А. П., Ронг, С., Хенн, Б. М., і Рамачандран, С. (2018). Локалізація адаптивних варіантів в геномах людини за допомогою усередненої оцінки однозалежності. Природні комунікації, 9, 703. doi: 10.1038/s41467-018-03100-7