Аналіз експресії генів - біологія

аналіз

Аналіз експресії генів відноситься до дослідження впровадження генетичної інформації (експресія генів) з використанням молекулярно-біологічних та біохімічних методів. Він може використовуватися як для окремих транскриптів, так і для всього транскриптома, а також дозволяє робити якісні та кількісні твердження про активність генів. Хоча в першому випадку повинна бути відома лише інформація про послідовність стенограми, яку слід дослідити, для аналізу транскриптома потрібна вся інформація про послідовність транскриптома.

У молекулярній біології активність та експресію тисяч генів можна одночасно виміряти за допомогою аналізу експресії генів, що дозволяє оглянути клітинні функції. Профілі експресії генів можуть бути використані, наприклад, для ідентифікації клітин, які знаходяться в активній фазі поділу, або для показу реакції клітин на конкретне лікування. Багато таких експериментів досліджують весь геном, тобто кожен ген певної клітини.

Методика мікрочипів ДНК [1] вимірює відносну активність раніше визначених генів-мішеней. Методи, засновані на послідовності, такі як послідовний аналіз експресії генів (SAGE, SuperSAGE), також використовуються для аналізу експресії генів. SuperSAGE особливо точний, оскільки цей метод не обмежується попередньо визначеними генами, але може вимірювати будь-який активний ген. З впровадженням методів секвенування наступного покоління, аналіз експресії на основі послідовностей користується все більшою популярністю як цифрова альтернатива мікрочипів. Однак мікрочипи використовувались частіше, як це показує використання цього методу у 17 000 статей PubMed до 2006 р.

  • Чи експресується ген взагалі за обстежених обставин?
  • У яких клітинах відбувається експресія (наприклад, гібридизація in situ)?

  • Наскільки велика різниця у вираженні порівняно з визначеним посиланням?
    • здорові проти хворих клітин
    • Дикий тип проти мутантних клітин
    • нестимульовані проти стимульованих клітин

Залежно від методу аналізуються продукти різних рівнів експресії генів:

Методи

  • За допомогою гібридизації in-situ в тканині виявляють РНК-специфічну РНК визначеного гена/набору генів і визначають локальний характер експресії генів.
  • У методі Норт-блот РНК спочатку виділяють і електрофоретично відокремлюють відповідно до її розміру в гелі. Після перенесення її на мембрану (блотування) шукану послідовність РНК виявляють міченими зондами (радіоізотопи, флуоресцентні барвники), виготовленими з комплементарної РНК або ДНК шляхом комплементарного зв'язування. Як правило, одночасно досліджується лише невелика кількість послідовностей.
  • У мікрочипах або макрочипах ДНК кількість мРНК великої кількості генів з клітин культури/тканини може бути визначена одночасно. Для цього мРНК виділяють і транскрибують у кДНК. За допомогою цього методу виявлення відбувається шляхом додаткової гібридизації позначеної кДНК (радіоізотопи, флуоресцентні барвники) із зондами масиву ДНК.
  • За допомогою серійного аналізу експресії генів (SAGE) і, зокрема, SuperSAGE, експресію теоретично всіх генів клітини можна визначити дуже точно, генеруючи короткий фрагмент послідовності (так звана "мітка" = мітка) з кожної транскрипції, і якомога більше з цих тегів послідовно. Перевагою над мікрочипами є набагато точніша кількісна оцінка транскриптів, а також можливість (особливо за допомогою SuperSAGE) ідентифікувати нові транскрипти (наприклад, некодуючі рибонуклеїнові кислоти, такі як мікроРНК або антисмислові РНК) та дослідити організми з раніше невідомими геномами.
  • Кількісна ПЛР у режимі реального часу є варіантом полімеразної ланцюгової реакції (ПЛР). Барвники або спеціальні зонди, додані в реакційну суміш, контролюють концентрацію продукту під час ПЛР. Зміна концентрації з плином часу дозволяє зробити висновки щодо початкової концентрації даної нуклеїнової кислоти.
  • За допомогою методу Вестерн-блот білки відокремлюються з урахуванням різних властивостей, таких як розмір, електричний заряд або ізоелектрична точка, а потім виявляються за допомогою антитіл. Як правило, одночасно досліджується лише керована кількість генних продуктів.
  • Диференціальний аналіз 2D гелів дозволяє одночасно експресувати до 10000 білків. Для цього білкові екстракти отримують із клітинних культур/тканин, розділяють їх двовимірно відповідно до ізоелектричної точки та молекулярної маси та виявляють та визначають кількісно за допомогою маркування або різних (флуоресцентних) методів фарбування. Визначені інтенсивності різних зразків порівнюють між собою, і, отже, поведінка експресії контролюється за різних умов.
  • У масивах білків, аналогічних масивам ДНК, досліджується кількість певних білків. Для виявлення використовуються численні взаємодії між білками та іншими молекулами: B. Взаємодія фермент-субстрат, антитіло-антиген або рецептор-месенджер.
  • В останні роки мас-спектрометричний аналіз білкових сумішей набуває все більшого значення. Використовуючи "спектральну величину", підраховують шматочки білка, подібні до фрагментів ДНК існуючих РНК в SAGE, і визначають їх частоту. Інші методи використовують інтенсивність сигналу певних пептидів у мас-спектрі як міру частоти.

У багатьох методах використовуються флуоресцентні барвники, які зчеплені з зондами (РНК-зонди, антитіла тощо) і зроблені видимими за допомогою флуоресцентної спектроскопії або флуоресцентної мікроскопії. Останній пропонує перевагу високого просторового дозволу. Крім того, використовуються радіоактивно мічені зонди або ті, які перетворюють хромогени в барвники за допомогою зв’язаних ферментів.

Порівняння з протеомікою

Геном людини містить близько 25 000 генів, які спільно створюють близько 1 000 000 різних білків. Ця різноманітність виникає головним чином через посттрансляційні модифікації, так що один ген може служити шаблоном для багатьох різних версій білка. Близько 2000 білків [5] (0,2% від загальної кількості) можна ідентифікувати в одному експерименті з мас-спектрометрією. Знання про окремі білки, які виробляє клітина (протеоміка), є більш важливим, ніж знання того, скільки мРНК виробляє кожен ген. Однак аналіз експресії генів дає найкращий огляд, який можна отримати в одному експерименті.

Використовуйте для розробки та перевірки гіпотез

обмеження

Перевірка методів високої пропускної здатності

І мікронабори ДНК, і qPCR використовують переважне зв'язування комплементарних послідовностей нуклеїнових кислот ("спарювання основ"), і обидва методи використовуються, часто послідовно, для створення профілів експресії генів. Незважаючи на те, що ДНК-мікрочипи мають високу пропускну здатність, їм не вистачає високої кількісної точності qPCR. Однак у той самий час, скільки потрібно для визначення експресії кількох десятків генів за допомогою qPCR, весь геном можна дослідити за допомогою мікрочипів ДНК. З цієї причини часто має сенс спочатку провести напівкількісний аналіз мікрочипів ДНК для ідентифікації генів-кандидатів, які потім можна перевірити та точніше визначити кількісно за допомогою qPCR. Додаткові експерименти, такі як вестерн-блоттінг білків диференційовано експресованих генів, можуть допомогти підтвердити результати аналізу експресії генів, оскільки концентрація мРНК не обов'язково корелює з кількістю експресованого білка.

Статистичний аналіз

Анотація генів

За допомогою статистичних методів можна надійно ідентифікувати гени, продукти яких змінюються в експериментальних умовах. Для змістовної інтерпретації профілів експресії важливо знати, який білок кодується яким геном і яку функцію він має. Цей процес називається анотацією генів. Деякі анотації надійніші за інші, а іноді і зовсім відсутні. Бази даних генних анотацій постійно змінюються, і різні бази даних використовують різні назви одного і того ж білка, що відображає зміну розуміння його функції. Використання стандартизованої генної номенклатури дозволяє уникнути проблеми різного іменування, проте точне віднесення транскриптів до генів [13] [14] залишається важливою проблемою.

Класифікація регульованих генів

Наступним кроком після ідентифікації групи диференційовано регульованих генів є пошук закономірностей у цій групі. Чи мають білки, які кодують ці гени, подібні функції? Вони хімічно схожі? Вони розташовані в подібних клітинних відділеннях? Аналіз онтології генів забезпечує загальний спосіб визначення цих взаємозв’язків. Онтологія генів починається з дуже широкої верхньої категорії, наприклад, "метаболічного процесу", а потім підрозділяє їх на менші підкатегорії, такі як "метаболізм вуглеводів", які, в свою чергу, можна розділити на більш конкретні підгрупи, такі як "фосфорилювання інозитолу та його похідних". Окрім своєї біологічної функції, хімічних властивостей та розташування клітин, гени мають і інші властивості. Наприклад, гени можна класифікувати на групи на основі їх зв’язку з іншими генами, їх зв’язку із захворюваннями або взаємодії з наркотиками або токсинами. База даних молекулярних підписів (База даних молекулярних підписів) [15] та База даних порівняльної токсикогеноміки (Порівняльна база даних токсикогеноміки) [16] пропонують можливість класифікації генів найрізноманітнішими способами.

Розпізнавання шаблону між регульованими генами

Коли сортуються регульовані гени відповідно до того, що вони є і що вони роблять, можуть виникнути важливі взаємозв'язки між різними генами [18]. Наприклад, ви могли б отримати вказівку на те, що конкретний ген кодує білок, який утворює фермент, який, у свою чергу, активує білок, який регулює другий ген у нашому списку. Цей другий ген може бути фактором транскрипції, який, у свою чергу, регулює ще один із генів-кандидатів. Спостерігаючи за цими зшивками, ми можемо припустити, що це більше, ніж випадкові асоціації, і що всі ці гени є в нашому списку, оскільки вони є частиною основного біологічного процесу. З іншого боку, гени, які є незалежними та повністю випадковими, можуть, звичайно, створювати враження, що вони є частиною загального процесу, хоча це не так.

Причинно-наслідкові зв’язки

Використання шаблонів для розпізнавання регульованих генів

Висновки

Аналіз експресії генів дає нову інформацію про те, як поводяться гени за різних умов. За великим рахунком, методи мікрочипів створюють надійні профілі виразу [24]. На основі цих даних можна скласти нові біологічні гіпотези або перевірити існуючі гіпотези. Однак обсяг і складність цих експериментів часто призводять до різних інтерпретацій. У багатьох випадках аналіз даних профілів виразів вимагає значно більше часу та зусиль, ніж оригінальний експеримент для отримання даних. Багато вчених використовують кілька статистичних методів та попередній аналіз даних та консультуються з біостатами чи іншими експертами в галузі технології мікрочипів перед публікацією результатів аналізу експресії генів. Хороша експериментальна установка, адекватна кількість біологічних копій та повторні експерименти відіграють ключову роль у проведенні успішних аналізів експресії генів.