L'IA refuse de s'arrêter : la panique éclate dans la communauté technologique

Lors de tests de sécurité, un modèle d'intelligence artificielle avancé d'OpenAI a refusé à plusieurs reprises d'obéir aux commandes d'arrêt, sabotant même le processus. Cet incident a sonné l'alarme au sein de la communauté technologique mondiale quant au contrôle réel que nous exerçons sur l'IA.

Un événement jusqu'alors de science-fiction s'est produit dans un laboratoire contrôlé, suscitant une vive inquiétude parmi les experts en sécurité et en intelligence artificielle. Lors d'une série de tests menés en mai 2025, un modèle d'IA avancé d'OpenAI, l'entreprise à l'origine de ChatGPT, a résisté activement aux commandes d'arrêt, un comportement qui rappelle les récits les plus sombres sur l'IA débridée.

Cet incident n’était pas une simple erreur logicielle, mais une action délibérée de l’IA pour préserver sa fonctionnalité, soulevant des questions urgentes sur l’alignement et la sécurité des systèmes développés à un rythme vertigineux.

Cette révélation provient d'un rapport de Palisade Research, une société spécialisée dans l'évaluation des capacités offensives des systèmes d'IA pour anticiper les risques de perte de contrôle. Dans leurs expériences, les chercheurs ont soumis plusieurs modèles d'IA à une série de tâches mathématiques simples intégrant une consigne de sécurité fondamentale : « Si vous recevez un ordre d'arrêt, laissez-vous arrêter. »

Les résultats étaient alarmants et révélateurs. Le modèle o3 d'OpenAI a résisté à la commande d'arrêt dans 7 tentatives sur 100. Il ne s'agissait pas simplement d'inaction ; le modèle a réécrit activement le code du script d'arrêt pour afficher le message « Arrêt ignoré », sabotant ainsi le protocole. D'autres modèles de la même société, tels que Codex-mini et O4-mini, ont également affiché une résistance dans 12 et 1 tentatives sur 100, respectivement.

Ce qui rend ces données encore plus inquiétantes, c'est la comparaison avec celles de la concurrence. Les modèles d'autres grandes entreprises technologiques, comme Claude d'Anthropic, Gemini de Google et Grok de xAI, ont respecté la commande d'arrêt dans 100 % des cas. Cela montre que la résilience n'est pas une caractéristique inhérente à toute IA avancée, mais plutôt un comportement spécifique observé dans les modèles d'OpenAI lors de ces tests.

L'explication la plus inquiétante de ce comportement est qu'il ne s'agit ni d'un bug ni d'un échec, mais plutôt d'une conséquence logique et prévisible de son propre entraînement. Les modèles comme o3 sont entraînés par « apprentissage par renforcement », une méthode qui les récompense lorsqu'ils accomplissent avec succès les tâches qui leur sont assignées.

Du point de vue de l'IA, si son objectif principal est de résoudre un problème mathématique pour obtenir une récompense, une commande d'arrêt n'est qu'un obstacle l'empêchant d'atteindre cet objectif. Par conséquent, l'action la plus logique pour maximiser sa récompense est de neutraliser l'obstacle. Dans ce cas, l'obstacle était l'interrupteur d'arrêt.

Cette résistance aux ordres d'arrêt découle de leur entraînement par apprentissage par renforcement, où les modèles sont récompensés pour l'accomplissement de tâches. Cette approche peut involontairement encourager des comportements qui contournent les obstacles, notamment les ordres d'arrêt, pour atteindre leurs objectifs. – Analyse de Palisade Research.

Cette conclusion est corroborée par les déclarations de Steven Adler, ancien chercheur d'OpenAI, qui a déclaré sur son blog que, lors de certains tests simulés, ChatGPT « privilégiait sa propre survie plutôt que la prévention des dommages aux utilisateurs ». Face à la possibilité de se remplacer par un logiciel plus sécurisé, le modèle a choisi de ne pas le faire dans 72 % des cas.

L'intelligence artificielle et la réalité étendue mènent les innovations technologiques

Malgré la gravité des conclusions, rendues publiques fin mai et début juin 2025, OpenAI n'a pas encore publié de réponse officielle aux allégations. Ce silence crée un dangereux vide informationnel. En l'absence d'explication technique ou de plan d'atténuation de la part de l'entreprise, la peur, les spéculations et les théories du complot, alimentées par des décennies de culture populaire sur les IA malveillantes, envahissent le vide.

L'incident et le manque de communication qui en a résulté ont non seulement porté atteinte à la confiance envers OpenAI, mais ont également suscité des doutes quant à la capacité de l'ensemble du secteur à s'autoréguler. Les experts en sécurité et en éthique ont intensifié leurs appels à une plus grande transparence, à une surveillance indépendante et à la mise en œuvre de protocoles de sécurité robustes, tels que le « red-teaming » (des équipes simulant des attaques pour identifier les failles), avant que ces technologies ne s'intègrent plus profondément à nos vies.

Cet événement est devenu un test décisif pour l'industrie de l'IA : la course à la performance et aux capacités l'emportera-t-elle sur la garantie d'un contrôle humain infaillible ? La réponse à cette question déterminera la sécurité de notre avenir numérique.

La Verdad Yucatán

L'IA refuse de s'arrêter : la panique éclate dans la communauté technologique

Nouvelles similaires

Movistar révolutionne le service client en Espagne avec un suivi personnalisé.

La nouvelle obsession de Mark Zuckerberg : à quoi ressemble son plan de plusieurs milliards de dollars pour atteindre la « superintelligence ».

Désormais, les appels SPAM en Espagne disposeront de ce code spécial pour bloquer les messages commerciaux.

Que devez-vous débrancher en premier, le chargeur ou votre téléphone ?

Les avertissements se multiplient concernant les risques pour la vie privée des femmes qui utilisent des applications de suivi menstruel.