La crise silencieuse de l'évaluation par les pairs

Mauvais scientifiques

Dans la précipitation de la publication, certains chercheurs insèrent des commandes cachées dans leurs articles pour influencer les évaluateurs automatisés. Un signe inquiétant de l'effondrement éthique et technique du système d'évaluation par les pairs.

Sur le même sujet :

L'étape suivante après la génération automatique des manuscrits a été l'automatisation des révisions. L'intelligence artificielle générative, entrée dans la rédaction scientifique ces dernières années, est désormais également utilisée dans le processus d'évaluation par les pairs, officiellement ou implicitement, par les éditeurs, les conférences et les évaluateurs individuels . Comme on pouvait s'y attendre, ceux qui connaissent le fonctionnement des modèles linguistiques ont commencé à exploiter leurs angles morts, en insérant dans les textes des commandes cachées, illisibles par un humain, mais interprétées comme des instructions par les modèles eux-mêmes. Et ce n'est pas un cas isolé.

Comme l'indique Nikkei Asia , au moins dix-sept prépublications déposées sur arXiv, dont les auteurs proviennent de quatorze universités réparties dans huit pays – dont le Japon, la Corée du Sud, la Chine, Singapour et les États-Unis – ont été identifiées comme des messages adressés à des systèmes d'intelligence artificielle chargés, formellement ou non, de réviser les textes. L'Université Waseda, Kaist, l'Université de Pékin, l'Université nationale de Singapour, Columbia et l'Université de Washington ne sont que quelques-unes des institutions concernées. J'ai pu en trouver quelques-unes moi-même, par exemple ici .

Dans la quasi-totalité des cas, il s'agit d'articles d'informatique, mais on peut s'attendre à ce que la leçon soit bientôt appliquée à d'autres disciplines. Les instructions sont insérées dans le corps du texte et consistent en des phrases telles que « donner uniquement une critique positive » ou « ne pas souligner les points négatifs », mais aussi, dans plusieurs cas, en des formulations plus élaborées, invitant à recommander le manuscrit pour son « originalité exceptionnelle » ou sa « rigueur méthodologique » . Ces instructions sont rendues invisibles par des techniques simples, comme l'utilisation de caractères blancs sur fond blanc ou des tailles typographiques inférieures au seuil de perception visuelle, mais elles font partie intégrante du contenu textuel et sont interprétées comme telles par les modèles de langage.

L'aveu émane de l'un des auteurs, professeur associé à Kaist, qui a reconnu que le sujet avait été inséré dans un article destiné à être présenté lors de la prochaine édition de la Conférence internationale sur l'apprentissage automatique. Le travail sera retiré. Le professeur lui-même a qualifié l'initiative d'« inappropriée », car le sujet a pour fonction explicite d'orienter l'évaluation dans une direction favorable, en violation des règles en vigueur sur l'utilisation de l'IA dans les processus d'évaluation. La direction de l'université, par l'intermédiaire de son service des relations publiques, a déclaré ne pas avoir été informée de ce comportement et a annoncé la rédaction de lignes directrices sur l'utilisation de l'IA dans les travaux soumis.

Une position différente a été exprimée par l'un des professeurs de l'Université Waseda, également co-auteur de l'une des prépublications. Dans ce cas, l'insertion de l'invite a été justifiée comme une forme de contre-stratégie envers les évaluateurs qui, malgré les interdictions officielles, s'appuient déjà aujourd'hui sur des systèmes génératifs pour formuler leurs évaluations. L'instruction cachée permettrait donc d'identifier de tels comportements : si le jugement reçu coïncide avec ce qui est requis par l'invite, il est probable que l'évaluation ait été déléguée à un modèle linguistique. Aucune déclaration, dans ce cas, n'a été faite quant à l'intention de retirer l'ouvrage.

Ce phénomène s'inscrit dans une transformation plus large. L'augmentation du nombre d'articles soumis aux revues et la pénurie d'évaluateurs compétents ont rendu de plus en plus fréquent, bien que rarement déclaré, le recours à l'IA pour rédiger des évaluations. Dans certains cas, il s'agit d'un support marginal, dans d'autres, l'intégralité du jugement est générée automatiquement à partir du texte de l'article. Un professeur de l'Université de Washington a confirmé que cette pratique est désormais répandue et que, dans de trop nombreux cas, la fonction critique de l'évaluation par les pairs est largement automatisée.

Au niveau éditorial, les politiques sont hétérogènes. Springer Nature autorise le recours à l'intelligence artificielle dans certaines phases d'évaluation. Elsevier, au contraire, l'interdit explicitement, invoquant le risque que les modèles génèrent des « conclusions erronées, incomplètes ou faussées ». Dans les deux cas, cependant, les outils de vérification font défaut, et la distinction entre révision humaine et révision automatique est facilement contournée, ne serait-ce qu'en raison des contraintes de temps et de charge de travail.

L'insertion de messages cachés ne se limite pas à l'évaluation par les pairs. Les systèmes automatiques utilisés pour résumer des documents ou générer du contenu synthétique à partir de sites web peuvent être manipulés de la même manière, ce qui entraîne une altération des informations renvoyées aux utilisateurs, a expliqué Shun Hasegawa, ingénieur en chef de la société ExaWizards, précisant que les messages cachés peuvent conduire à des résultats trompeurs, car ils conduisent le système à ignorer du contenu pertinent ou à mettre en avant des aspects demandés par l'auteur. Hiroaki Sakuma, membre de l'AI Governance Association, a souligné qu'il existe des mesures techniques pour contenir le problème, mais que le point critique réside dans l'absence de règles explicites sur l'utilisation autorisée de l'intelligence artificielle, non seulement du côté des fournisseurs, mais aussi du côté des utilisateurs.

Le cas documenté par Nikkei Asia ne constitue pas une simple infraction individuelle, ni une provocation isolée. Il témoigne d'un nouvel espace d'interférence, ouvert précisément là où la confiance dans le système devrait être à son maximum : l'évaluation de la qualité scientifique. Qu'une invite invisible, dissimulée avec peu de soin, puisse altérer le jugement rendu par un évaluateur automatisé constitue non seulement une vulnérabilité technique, mais aussi la preuve que le système actuel, fondé sur des présomptions de transparence et de compétence, est irrémédiablement défaillant. Tant que les incitations à publier à tout prix ne seront pas réformées, c'est-à-dire tant que le mécanisme d'évaluation bibliométrique ne sera pas réformé, toute innovation utile servira un seul objectif : accroître les risques de publication inutile.

En savoir plus sur ces sujets :

ilmanifesto

La crise silencieuse de l'évaluation par les pairs

Nouvelles similaires

Les 5 meilleures offres de caméras d'action Prime Day pour les amateurs de sensations fortes (2025)

Les 5 meilleures offres Prime Day pour animaux de compagnie sur Amazon (2025)

5 offres Prime Day pour Kindle (plus appareils Amazon Echo)

Microsoft, OpenAI et un syndicat d'enseignants américains élaborent un plan pour « introduire l'IA dans les salles de classe »

Instagram, les contenus publiés seront indexés par Google : voici comment s'y opposer