Наиболее полное на сегодняшний день представление о геноме человека ускорит диагностику редких заболеваний и рака.
Испанские исследователи из Центра геномной регуляции приняли участие в создании самого полного на сегодняшний день каталога генетических вариаций, расшифровав некоторые из наиболее трудно идентифицируемых и малоизученных участков генома человека . Этот прорыв, опубликованный в эту среду в двух статьях в журнале Nature, ускорит диагностику редких заболеваний и рака .
«В каждом геноме человека существует около 25 000 структурных вариантов, но только один из них вызывает заболевание, поэтому необходимо сузить область поиска и провести скрининг вариантов. С текущими источниками мы можем перейти от 25 000 к нескольким тысячам, но это всё ещё поиск иголки в стоге сена. Благодаря этой новой ссылке, которую мы публикуем вместе с этой работой , мы сузили область поиска до менее чем 200 вариантов-кандидатов , что значительно облегчает генетическую диагностику в клинической практике», — пояснил доктор Бернардо Родригес-Мартин, соавтор исследования, во время пресс-конференции, где были представлены результаты.
«Эта работа представляет собой наиболее полное на сегодняшний день исследование структурных генетических вариаций в геноме человека. Это шаг вперёд к персонализированной медицине, основанной на геномной информации», — добавил он. Эксперт отметил, что такие больницы, как больница Сан-Жоан-де-Деу, сотрудничающая с CGR, уже используют эти технологии для диагностики редких заболеваний у детей.
Кроме того, эти новые технологии могут быть применены для изучения мутаций, вызывающих рак . «У 15% пациентов мутация, вызывающая рак, не обнаруживается, и это может быть связано с тем, что предыдущие технологии не могли её обнаружить. Ещё одной серьёзной проблемой является понимание мутаций, которые накапливаются на протяжении нашей жизни. Эта технология позволяет нам с беспрецедентной точностью понять, как мы накапливаем мутации с возрастом, а также под воздействием факторов окружающей среды и образа жизни», — добавляет исследователь, признавая, что одним из ограничений является всё ещё высокая стоимость секвенирования. « Секвенирование генома стоит тысячу евро . За последние пять лет стоимость значительно снизилась, примерно в пять раз, поэтому мы можем представить себе не столь отдалённое будущее, примерно через пять лет, когда цена достаточно снизится, и за несколько сотен евро мы сможем секвенировать геном с помощью этой технологии», — заключает он.
В 2003 году геном человека был впервые секвенирован. Тогда было обнаружено, что 60% генома состоит из повторяющейся ДНК, но оставшиеся 8% оставались нерасшифрованными из-за своей сложности. В 2015 году в рамках проекта «1000 геномов» было секвенировано более 1000 геномов человека в 26 популяциях по всему миру. Однако ограничения этих технологий, позволяющих считывать только очень короткие фрагменты ДНК, оставили большие области генома неисследованными. В период с 2021 по 2023 год весь геном человека будет расшифрован благодаря технологии длинных считываний, но в рамках одной референсной выборки. Для расширения числа референсных выборок был запущен проект «Пангеном», охватывающий 47 человек с 5 континентов.
Исследователи значительно расширили каталог известных генетических вариаций человека. Полученные наборы данных, опубликованные в эту среду в журнале Nature, представляют собой наиболее полный на сегодняшний день обзор генома человека . В первой статье, подготовленной совместно Европейской лабораторией молекулярной биологии (EMBL), Дюссельдорфским университетом имени Генриха Гейне (HHU) и Центром геномной регуляции (CRG) в Барселоне, был проанализирован геном 1019 человек из 26 популяций на пяти континентах.
Исследователи специально искали структурные варианты в геноме человека. Это крупные фрагменты ДНК, которые были удалены, дуплицированы, вставлены, инвертированы или перестроены. Различия в структурных вариантах между людьми могут включать изменения в тысячах «букв» ДНК одновременно, часто приводя к отключению генов и развитию многих редких заболеваний и видов рака.
Команда обнаружила и классифицировала более 167 000 структурных вариантов у 1019 человек , что удвоило известное количество структурных вариаций в человеческом пангеноме – эталоне, связывающем ДНК многих людей, а не полагающемся на один геном. У каждого человека медианное количество структурных изменений составило 7,5 миллионов, что свидетельствует об огромном объёме редактирования генома, которое природа осуществляет сама.
«Мы обнаружили в этих популяциях настоящий клад скрытых генетических вариаций , многие из которых были недостаточно представлены в предыдущих референтных наборах. Например, 50,9% инсерций и 14,5% делеций, которые мы обнаружили, не были зарегистрированы в предыдущих каталогах вариаций. Это важный шаг к картированию «слепых пятен» в геноме человека и уменьшению предвзятости, которая долгое время отдавала предпочтение геномам европейского происхождения, а также открывает путь к разработке методов лечения и тестов, которые одинаково эффективны для людей по всему миру», — говорит доктор Бернардо Родригес-Мартин.
Примерно три из пяти (59%) обнаруженных вариантов встречались менее чем у одного процента людей, что является критическим уровнем редкости для диагностики генетических заболеваний, поскольку позволяет более эффективно отфильтровывать безвредные вариации . В ходе тестирования новый референтный набор сократил список предполагаемых мутаций с десятков тысяч до нескольких сотен, что ускоряет диагностику редких генетических синдромов и других заболеваний, таких как рак.
Бернардо Родригес-Мартин начал работу над проектом в лаборатории Яна Корбеля в EMBL и завершил его, перейдя в CRG и основав собственную группу. Он разработал SVAN — программу, которая классифицирует каждое изменение ДНК как «дополнительный скопированный фрагмент» или «удалённый фрагмент», помогая команде анализировать генетические данные и выявлять новые закономерности.
Исследование SVAN показало, что более половины недавно выявленного разнообразия генома человека приходится на высокоповторяющиеся сегменты ДНК — части генома, которые ранее считались «мусорными» или слишком сложными для изучения. «Повторяющиеся элементы представляют собой богатый и ранее игнорируемый резервуар генетического разнообразия. Они играют ключевую роль в разнообразии, болезнях и эволюции человека», — говорит Эмилиано Сотело-Фонсека, аспирант CRG и соавтор первого исследования.
Эти повторяющиеся сегменты ДНК включают мобильные элементы, также известные как «прыгающие гены» из-за их способности реплицироваться по всему геному. Исследователи обнаружили, что среди тысяч мобильных элементов генома человека большая часть мутагенеза зародышевой линии обусловлена активностью нескольких десятков высокоактивных элементов.
Например, было обнаружено, что один особенно гиперактивный элемент LINE-1 перехватывает мощный регуляторный переключатель, производя гораздо больше своих копий, чем обычно, что приводит к попаданию дополнительного генетического материала в ДНК многих людей. Исследователи наблюдали аналогичный трюк с другим классом прыгающих генов, называемых SVA.
«Наша работа показывает, как мобильные элементы усиливают свою активность, перехватывая наши регуляторные механизмы генома. Эта недооцененная стратегия может способствовать развитию таких заболеваний, как рак, и заслуживает дальнейшего изучения», — говорит доктор Родригес-Мартин.
Во второй статье, подготовленной совместно Европейской лабораторией молекулярной биологии (EMBL) и Дюссельдорфским университетом имени Генриха Гейне (HHU), использовалась гораздо меньшая выборка, состоящая всего из 65 человек, но было объединено несколько мощных методов секвенирования для реконструкции геномов человека с беспрецедентной детализацией .
Этот подход помог исследователям расшифровать наиболее трудночитаемые участки, включая центромеры. Практически полная, без пробелов, сборка каждой хромосомы этих людей позволила исследователям обнаружить крупные генетические вариации в областях, которые не были обнаружены ни в первой статье, ни в других исследованиях.
Результаты показывают, что объединение подхода первой статьи, где множество геномов секвенировано на умеренной глубине, с подходом второй статьи, где несколько геномов изучены очень подробно, является самым быстрым путем к полной и всеобъемлющей карте генетического разнообразия человека .
«В одном исследовании используется меньшая мощность секвенирования, но гораздо большая когорта. В другом используется меньшая когорта, но гораздо большая мощность секвенирования на образец. Это привело к взаимодополняющим выводам», — отмечает доктор Ян Корбель, руководитель группы и исполняющий обязанности директора EMBL в Гейдельберге, а также соавтор обоих исследований.
В обеих работах проводилось повторное секвенирование геномов людей, участвовавших в проекте «1000 геномов » – знаковой инициативе, картировавшей глобальное генетическое разнообразие в 2015 году. Проект опирался на технологию секвенирования с коротким считыванием , позволяющую считывать лишь очень короткие фрагменты ДНК за раз. Эти фрагменты были слишком короткими, чтобы выявить большие участки отсутствующей или скопированной ДНК, длинные участки ДНК, меняющие направление, или повторы, которые во многих местах кажутся практически идентичными.
Успехи новых исследований стали возможны благодаря «длинночтовому» секвенированию — новой технологии, которая считывает тысячи или десятки тысяч букв ДНК одновременно, помогая исследователям находить большое количество скрытых вариаций, которые невозможно было обнаружить с помощью предыдущих методов.
Обе статьи также представляют собой важные достижения в построении эталонного пангенома человека. Последние двадцать лет учёные использовали последовательность ДНК отдельного человека в качестве стандартного генома, но пангеном был бы более полезен для персонализированной медицины, поскольку он отражал бы глобальное разнообразие.
Разрабатывая инновационные алгоритмы, которые могут анализировать 1019 различных геномов в ширину и 65 сверхполных геномов в глубину, исследователи предоставляют дорожную карту, которая делает возможность существования настоящего человеческого пангенома скорее практической, чем амбициозной, особенно с учетом снижения затрат на длинную считывающую последовательность.
«Благодаря этим исследованиям мы создали комплексный и актуальный с медицинской точки зрения ресурс , который теперь может быть использован исследователями по всему миру для лучшего понимания происхождения геномных вариаций человека и того, как на них влияет широкий спектр факторов», — говорит Тобиас Маршалл, профессор Дюссельдорфского университета имени Генриха Гейне и соавтор обоих исследований. «Это прекрасный пример совместных исследований, открывающих новые перспективы в геномной науке и являющихся шагом к более полному пониманию пангенома человека», — заключает он.
abc