Le patron d'une association à but non lucratif spécialisée dans l'IA estime que la « nature fermée » de la plupart des recherches sur l'IA freine l'innovation

Un an avant qu'Elon Musk ne cofonde OpenAI à San Francisco, le cofondateur de Microsoft, Paul Allen, avait déjà créé un laboratoire de recherche en intelligence artificielle à but non lucratif à Seattle.
L'Institut Allen pour l'intelligence artificielle (Ai2) avait pour objectif de faire progresser l'IA au profit de l'humanité. Plus d'une décennie plus tard, Ai2 n'est peut-être pas aussi connu qu'OpenAI, les créateurs de ChatGPT, mais il poursuit toujours la recherche d'une IA « à fort impact », telle qu'envisagée par M. Allen, décédé en 2018.
Le dernier modèle d'IA d'Ai2, Tulu 3 405B, rivalise avec ceux d'OpenAI et de DeepSeek en Chine dans plusieurs tests. Contrairement à OpenAI, Ai2 affirme développer des systèmes d'IA « véritablement ouverts » sur lesquels d'autres pourront s'appuyer. Depuis 2023, le PDG d'Ai2, Ali Farhadi, dirige l'institut après un passage chez Apple.
Il a déclaré : « Notre mission est de favoriser l’innovation et les avancées en matière d’IA pour résoudre certains des problèmes les plus urgents de l’humanité. La plus grande menace pour l’innovation en matière d’IA est la nature fermée de la pratique. Nous avons fortement œuvré en faveur de l’ouverture. Prenons l’exemple des logiciels open source : l’idée de base est que je devrais pouvoir comprendre ce que vous avez fait, le modifier, le dériver, l’utiliser en partie, à moitié ou en totalité. Et une fois que j’ai créé quelque chose, je le publie et vous devriez pouvoir faire de même. »
Le débat autour de l'IA open source est actuellement un sujet brûlant. Pour nous, l'open source signifie avoir une compréhension claire de vos actions. Bien que les modèles de pondération ouverts comme ceux de Meta soient bénéfiques car les gens peuvent simplement prendre ces pondérations et continuer, ils ne sont pas qualifiés d'open source.
L'open source implique d'avoir accès à chaque pièce du puzzle. Si je devais spéculer, certaines des données d'entraînement de ces modèles pourraient contenir des éléments douteux. Cependant, les données d'entraînement, qui constituent la propriété intellectuelle proprement dite, sont probablement la partie la plus précieuse. Beaucoup pensent qu'elles ont une valeur significative, et je suis d'accord.
Les données jouent un rôle crucial dans l'amélioration de votre modèle et la modification de son comportement. C'est un processus laborieux et difficile. De nombreuses entreprises investissent massivement dans ce domaine et hésitent à partager leurs résultats. À mesure que l'IA mûrit, je pense qu'elle se prépare à être prise au sérieux dans des domaines critiques tels que la découverte scientifique.
Une grande partie de certaines disciplines implique une recherche complexe de solutions, qu'il s'agisse d'une structure génétique, d'une structure cellulaire ou de configurations spécifiques d'éléments. Bon nombre de ces problèmes peuvent être formulés par calcul. Il y a une limite à ce que l'on peut accomplir en téléchargeant simplement un modèle formé sur des données textuelles à partir d'Internet et en l'affinant. Notre objectif est de permettre aux scientifiques de former leurs propres modèles.
Vous pouvez retrouver cette histoire dans Mes favoris. Ou en naviguant vers l'icône utilisateur en haut à droite.
Daily Mirror