Het meest complete beeld van het menselijk genoom tot nu toe zal de diagnose van zeldzame ziekten en kanker versnellen.
Spaanse onderzoekers van het Centrum voor Genomische Regulatie hebben meegewerkt aan de totstandkoming van de meest uitgebreide catalogus van genetische variaties tot nu toe. Ze hebben enkele van de moeilijkst te identificeren en meest over het hoofd geziene regio's van het menselijk genoom ontcijferd. Deze doorbraak, die woensdag in twee artikelen in het tijdschrift Nature werd gepubliceerd, zal de diagnose van zeldzame ziekten en kanker versnellen.
"Elk menselijk genoom heeft ongeveer 25.000 structurele varianten, maar slechts één daarvan veroorzaakt ziekte. Daarom is het noodzakelijk om de zoekruimte te verkleinen en te screenen op varianten. Met de huidige referenties kunnen we van 25.000 naar een paar duizend gaan, maar dat is nog steeds zoeken naar een speld in een hooiberg. Dankzij deze nieuwe referentie die we met dit werk publiceren , hebben we de zoekruimte beperkt tot minder dan 200 kandidaatvarianten , wat de genetische diagnose in de klinische praktijk aanzienlijk vergemakkelijkt", legde Dr. Bernardo Rodríguez-Martín, medeauteur van de studie, uit tijdens de persconferentie waarop de resultaten werden gepresenteerd.
"Dit werk vormt tot nu toe de meest uitgebreide referentie naar structurele genetische variatie in het menselijk genoom. Het is een stap voorwaarts in de richting van gepersonaliseerde geneeskunde op basis van genomische informatie", voegde hij eraan toe. De expert stelde dat ziekenhuizen zoals Sant Joan de Deu, dat samenwerkt met de CGR, deze technologieën al gebruiken om zeldzame ziekten bij kinderen te diagnosticeren.
Bovendien kunnen deze nieuwe technologieën worden toegepast op het onderzoek naar mutaties die kanker veroorzaken. "Bij 15% van de patiënten wordt een kankerverwekkende mutatie niet gevonden, en dit kan komen doordat eerdere technologieën deze niet konden detecteren. Een andere grote uitdaging is het begrijpen van de mutaties die zich gedurende ons leven ophopen. Deze technologie stelt ons in staat om met ongekende precisie te begrijpen hoe we mutaties ophopen naarmate we ouder worden en door omgevings- en levensstijlfactoren," voegt de onderzoeker toe, die erkent dat een van de beperkingen de nog steeds hoge kosten van sequencing zijn. " Het sequencen van een genoom kost duizend euro . In de afgelopen vijf jaar is dit aanzienlijk gedaald, ongeveer vijf keer zo hoog, dus we kunnen ons een niet zo verre toekomst voorstellen, over ongeveer vijf jaar, waarin de prijs voldoende zal zijn gedaald en we voor een paar honderd euro met deze technologie een genoom kunnen sequencen," concludeert hij.
In 2003 werd het menselijk genoom voor het eerst in kaart gebracht. Men ontdekte toen dat 60% van het genoom bestaat uit repetitief DNA, maar de resterende 8% bleef onontdekt vanwege de complexiteit ervan. In 2015 sequenste het 1000 Genomes-project meer dan 1000 menselijke genomen in 26 populaties wereldwijd. De beperkingen van deze technologieën, die DNA slechts in zeer korte fragmenten kunnen lezen, lieten echter grote delen van het genoom onontgonnen. Tussen 2021 en 2023 zal het volledige menselijke genoom dankzij long-read-technologie worden ontrafeld, maar dan in één enkele referentie. Het Pangenome-project breidt het aantal referenties uit met 47 individuen van 5 continenten.
Onderzoekers hebben de catalogus met bekende menselijke genetische variatie aanzienlijk uitgebreid. De resulterende datasets, die woensdag in Nature zijn gepubliceerd, vormen het meest complete overzicht van het menselijk genoom tot nu toe . Het eerste artikel, gezamenlijk geleid door het European Molecular Biology Laboratory (EMBL), de Heinrich Heine Universiteit Düsseldorf (HHU) en het Centre for Genomic Regulation (CRG) in Barcelona, analyseerde het genoom van 1019 individuen uit 26 populaties verspreid over vijf continenten.
De onderzoekers zochten specifiek naar structurele varianten in het menselijk genoom. Dit zijn grote DNA-fragmenten die zijn verwijderd, gedupliceerd, ingevoegd, geïnverteerd of herschikt. Verschillen in structurele varianten tussen individuen kunnen leiden tot veranderingen in duizenden DNA-letters tegelijk, waardoor vaak genen worden uitgeschakeld en vele zeldzame ziekten en kankers ontstaan.
Het team vond en categoriseerde meer dan 167.000 structurele varianten bij de 1.019 individuen , een verdubbeling van de bekende hoeveelheid structurele variatie in het menselijk pangenoom. Deze maatstaf koppelt DNA van meerdere mensen aan elkaar in plaats van te vertrouwen op één enkel genoom. Elk individu droeg gemiddeld 7,5 miljoen letters met structurele veranderingen met zich mee, wat de enorme hoeveelheid genoombewerking die de natuur zelf uitvoert, benadrukt.
"We hebben een schat aan verborgen genetische variatie in deze populaties gevonden, waarvan vele ondervertegenwoordigd waren in eerdere referentiesets. Zo waren 50,9% van de inserties en 14,5% van de deleties die we vonden, niet gerapporteerd in eerdere variatiecatalogi. Dit is een belangrijke stap in het in kaart brengen van blinde vlekken in het menselijk genoom en het verminderen van de bias die al lang ten gunste is van genomen van Europese afkomst. Het maakt de weg vrij voor therapieën en tests die even goed werken bij mensen over de hele wereld", aldus dr. Bernardo Rodríguez-Martín.
Ongeveer drie op de vijf (59%) van de ontdekte varianten kwamen voor bij minder dan één procent van de personen, een cruciaal niveau van zeldzaamheid voor de diagnose van genetische ziekten, omdat het kan helpen om onschadelijke variaties effectiever te filteren . Tijdens het testen reduceerde de nieuwe referentieset de lijst met vermoedelijke mutaties van tienduizenden tot slechts een paar honderd, wat de diagnose van zeldzame genetische syndromen en andere ziekten zoals kanker versnelt.
Bernardo Rodríguez-Martín begon aan het project in het lab van Jan Korbel bij EMBL en voltooide het na zijn overstap naar het CRG om zijn eigen groep op te richten. Hij ontwikkelde SVAN, een softwareprogramma dat elke DNA-verandering categoriseert als een "extra gekopieerd stukje" of een "verwijderd fragment", waarmee het team de genetische data kan analyseren om nieuwe patronen te identificeren.
SVAN onthulde dat meer dan de helft van de nieuw in kaart gebrachte diversiteit in het menselijk genoom zich bevindt in zeer repetitieve DNA-segmenten – delen van het genoom die voorheen als 'junk' of te moeilijk te bestuderen werden beschouwd . "Repetitieve elementen vertegenwoordigen een rijk en voorheen genegeerd reservoir aan genetische diversiteit. Ze spelen een sleutelrol in menselijke diversiteit, ziekte en evolutie", aldus Emiliano Sotelo-Fonseca, promovendus aan het CRG en medeauteur van de eerste studie.
Deze repetitieve DNA-segmenten bevatten mobiele elementen, ook wel "springende genen" genoemd, vanwege hun vermogen om zich door het hele genoom te repliceren. Onderzoekers ontdekten dat van de duizenden mobiele elementen in het menselijk genoom de meeste kiemlijnmutagenese het gevolg is van de activiteit van enkele tientallen zeer actieve elementen.
Zo bleek een bijzonder overactief LINE-1-element een krachtige regulatieschakelaar te kaapten om veel meer kopieën van zichzelf te produceren dan normaal, waardoor extra genetisch materiaal in het DNA van veel mensen terechtkwam. Onderzoekers observeerden een soortgelijke truc bij een andere klasse springende genen, genaamd SVA's.
"Ons werk laat zien hoe mobiele elementen hun activiteit versterken door onze genomische regulerende controles te kapen, een onderschatte strategie die kan bijdragen aan de ontwikkeling van ziekten zoals kanker en nader onderzoek verdient", aldus Dr. Rodríguez-Martín.
Het tweede artikel, dat gezamenlijk werd uitgevoerd door het European Molecular Biology Laboratory (EMBL) en de Heinrich Heine-Universität Düsseldorf (HHU), gebruikte een veel kleinere steekproef van slechts 65 personen, maar combineerde verschillende krachtige sequentiemethoden om het menselijk genoom in ongekend detail te reconstrueren .
Deze aanpak hielp de onderzoekers de moeilijkst te lezen delen te decoderen, waaronder de centromeren. De vrijwel complete, gap-vrije samenstelling van elk chromosoom van deze individuen stelde de onderzoekers in staat om grote genetische varianten te detecteren in regio's die niet waren gevonden in het eerste artikel of in andere studies.
Uit de resultaten blijkt dat het combineren van de aanpak van het eerste artikel, met veel genomen die tot op bescheiden diepte zijn gesequenced, met de aanpak van het tweede artikel, met enkele genomen in groot detail, de snelste weg is naar een volledig en inclusieve kaart van de menselijke genetische diversiteit .
"Eén onderzoek gebruikt minder sequencing power, maar een veel groter cohort. Het andere gebruikt een kleiner cohort, maar veel meer sequencing power per monster. Dit leidde tot complementaire conclusies", aldus dr. Jan Korbel, groepsleider en interim-directeur van EMBL Heidelberg, en mede-senior auteur van beide onderzoeken.
Beide artikelen resequencedenteerden individuen uit het 1000 Genomes Project, het baanbrekende initiatief dat in 2015 de wereldwijde genetische diversiteit in kaart bracht. Het project maakte gebruik van 'short-read' sequencingtechnologie , die slechts zeer kleine DNA-fragmenten tegelijk kon lezen. Deze fragmenten waren te kort om grote stukken ontbrekend of gekopieerd DNA, lange stukken die van richting veranderen of herhalingen die op veel plaatsen vrijwel identiek lijken, te onthullen.
De vooruitgang die in de nieuwe onderzoeken is geboekt, is mogelijk gemaakt door 'long-read'-sequencing , een nieuwe technologie die duizenden of tienduizenden DNA-letters tegelijk leest, waardoor onderzoekers grote hoeveelheden verborgen variatie kunnen vinden die met eerdere methoden niet konden worden gedetecteerd.
Beide artikelen vertegenwoordigen ook belangrijke vooruitgang in de constructie van een referentie-pangenoom voor de mens. Wetenschappers hebben de afgelopen twintig jaar de DNA-sequentie van een individu gebruikt als standaard menselijk genoom, maar het pangenoom zou nuttiger zijn voor gepersonaliseerde geneeskunde, omdat het de wereldwijde diversiteit zou weerspiegelen.
Door innovatieve algoritmen te ontwikkelen die 1.019 verschillende genomen in de breedte en 65 ultra-complete genomen in de diepte kunnen analyseren, bieden de onderzoekers een stappenplan dat de mogelijkheid van een echt menselijk pangenoom meer praktisch maakt in plaats van ambitieus, vooral omdat de kosten voor het sequencen van lange lezingen afnemen.
"Dankzij deze studies hebben we een uitgebreide en medisch relevante bron gecreëerd die nu door onderzoekers wereldwijd kan worden gebruikt om de oorsprong van menselijke genomische variatie en hoe deze wordt beïnvloed door een breed scala aan factoren beter te begrijpen", aldus Tobias Marschall, hoogleraar aan de Heinrich Heine Universiteit Düsseldorf en co-senior auteur van beide studies. "Dit is een uitstekend voorbeeld van collaboratief onderzoek dat nieuwe perspectieven opent in de genomische wetenschap en een stap is naar een completer menselijk pangenoom", concludeert hij.
abc