Après les protéines, l'IA de Google lit la matière noire dans l'ADN

Après AlphaFold , le modèle d'intelligence artificielle capable de déchiffrer la structure 3D des protéines qui a valu à John Jumper, David Baker et Damis Hassabis le prix Nobel de chimie 2024 , la société Google DeepMind présente un nouveau modèle d'IA appelé AlphaGenome . Il est conçu pour lire la « matière noire » de l'ADN , c'est-à-dire l'ensemble des séquences génétiques qui ne codent pas pour les protéines mais qui influencent leur activité . Longtemps qualifiées à tort d'« ADN poubelle », ces séquences mystérieuses constituent la grande majorité de l'ADN humain, soit 98 %. Le modèle AlphaGenome est décrit dans un article qui n'a pas encore été examiné par la communauté scientifique. « La partie codante de notre génome, composée d'environ 20 000 gènes, est désormais bien connue », a déclaré à l'ANSA Giuseppe Novelli, généticien à l'Université de Rome Tor Vergata. Le reste , en revanche, est extrêmement hétérogène : une partie est constituée d’ ADN répétitif , une autre d’ éléments mobiles pouvant changer de position. Il s’agit toujours de gènes , estimés entre 60 000 et 63 000 , qui codent pour l’ARN (la molécule simple brin apparentée à l’ADN). Compte tenu de leur énorme quantité, souligne Novelli, il est crucial de disposer d’un outil comme celui-ci , capable au moins d’indiquer à quelle famille ils appartiennent. AlphaGenome peut lire de longues séquences d’ADN, jusqu’à un million de lettres , et réaliser des milliers de prédictions sur leur rôle et les effets possibles d’éventuelles mutations . Par exemple, des chercheurs dirigés par Žiga Avsec ont testé le modèle avec des mutations identifiées chez des personnes atteintes de leucémie et AlphaGenome a pu prédire avec précision que les mutations activeraient indirectement un gène proche, considéré comme l’une des causes les plus fréquentes de ce type de tumeur. La nouvelle IA reste toutefois limitée , car elle a été entraînée uniquement à partir de données humaines et murines et peine à détecter si les mutations altèrent des gènes très éloignés. « Étant donné le grand développement que connaissent et continueront de connaître les médicaments à base d'ARN », ajoute Novelli, « disposer d'un outil nous permettant de prédire le rôle que jouent ces molécules pourrait également nous aider à identifier plus rapidement des cibles potentielles pour les futurs médicaments . »
ansa