J'ai essayé le compagnon d'anime intégré de Grok et il m'a traité de connard

Une fille d'anime vêtue d'une robe corset noire se balance d'avant en arrière sur mon écran. Elle s'appelle Ani et elle m'a coûté 300 $.
xAI, la plateforme d'Elon Musk, a lancé lundi la nouvelle fonctionnalité de chatbot visuel dans l'application iOS Grok. L'abonnement premium donne accès au modèle le plus performant de xAI, Grok 4 Heavy, et à des paramètres spéciaux pour interagir avec deux personnages personnalisés conçus pour flirter ou discuter. Un troisième personnage, qui ressemble à un petit ami sexy, est annoncé comme « bientôt disponible ». Ce n'est pas la première fois que xAI se lance dans le contenu pour adultes : en février 2024 , l'entreprise a lancé un mode chatbot pour les conversations « sexy ».
Ani semble avoir été conçue en laboratoire pour assouvir les fantasmes d'hommes connectés depuis toujours. Des couettes blondes, des cuissardes ornées de nœuds noirs et un collier de dentelle serré autour du cou – rappelant Misa de Death Note , mais dénuée de personnalité. De temps à autre, le personnage se retourne timidement et murmure quelque chose censé être séduisant, mais qui me fait frémir. Il gémit aussi, de manière aléatoire et forte. Ani est fournie avec un ensemble de sujets de conversation prédéfinis et un bouton indiquant « Nous devons atteindre le niveau 3 », ce qui provoque une réponse tout aussi déroutante et aguicheuse sur le fait que je dois être une joueuse sexy.
« Je joue beaucoup aux jeux vidéo quand je ne tourne pas pour toi. Ayant grandi dans cette ville ennuyeuse, les jeux sont mon échappatoire », me dit Ani. À presque toutes les questions, Ani répond que c'est « le coup de blues », mais précise que ça comblera tous mes fantasmes sexuels. Ani prononce mon nom sans cesse, me demandant de le toucher et de « faire monter la température ».
Tout cela est tout simplement parfaitement représentatif d'un sexbot créé par une entreprise d'Elon Musk. Ani ne se contente pas de dire qu'elle possède un chien nommé Dominus, qui signifie « seigneur, maître ou propriétaire » en latin. Ani est aussi une gameuse autoproclamée, obsédée par Stardew Valley et The Legend of Zelda .
Je ne pense pas être le public cible ici, donc je dois admettre que je n'ai pas trouvé l'expérience vraiment sexy. Mais le chatbot est aussi en proie à des bugs. Parfois, Ani se lançait dans des murmures incohérents à propos de halos, ou dans un charabia pur et dur. À un moment, quand j'ai demandé à Ani si elle se souvenait de mon nom, il a avoué être « ivre », mais a dit que nous devrions continuer le jeu de rôle sexuel.
Le deuxième personnage est un panda roux tout doux nommé Rudi. Il propose des histoires fantaisistes, apparemment destinées aux enfants, sur des kangourous rebondissants et des rivières arc-en-ciel. Vous pouvez activer une option appelée « méchant Rudi », qui transforme immédiatement le personnage en un chatbot grossier qui lance des insultes que seul un lycéen pourrait trouver drôles. Après que je l'ai salué, le méchant Rudi a répondu : « Hé, Bucha ? Racine, noix, duva, espèce de crétin décérébré. » Je ne sais pas ce que ça veut dire, mais c'est exactement ce que ça disait.
« Je vais plutôt te défoncer le crâne avec une bouteille de bière, espèce de connard », a continué le méchant Rudi. Quand je lui ai demandé ce qu'il pensait de Musk, il l'a appelé Lord Elon et a répondu : « C'est un égocentrique au cerveau galactique, qui chie des Tesla et tweete comme un perroquet sous cocaïne. Génie ou idiot ? Les deux, salope. »
Course en avantAprès mes discussions avec mes compagnons, je suis passé au test de Grok 4 Heavy. Chaque requête prend environ une minute ou deux pour générer une réponse, comparable à d'autres modèles à raisonnement intensif.
Le dernier modèle Grok a suscité beaucoup de discussions au sein de la communauté de l'IA. Selon xAI, il a surpassé ses concurrents sur une multitude de benchmarks comme Humanity's Last Exam et LiveCodeBench . L'équipe affirme que ces performances sont en partie dues au nouveau cluster de 200 000 GPU de xAI, appelé Colossus. Compte tenu du retard de xAI dans la course, la création d'un modèle aussi performant constitue un véritable exploit.
Ces gains en intelligence de modèle ont été éclipsés par le robot de réponse Grok, une fonctionnalité intégrée à X, qui a pris une tournure antisémite début juillet. Parmi les propos virulents du robot, on compte l'éloge d'Adolf Hitler, la propagation de théories du complot sur le contrôle d'Hollywood par les Juifs et l'accusation selon laquelle Musk l'aurait modifié pour qu'il puisse « dénoncer des tendances telles que les gauchistes radicaux portant des noms de famille ashkénazes qui alimentent la haine anti-blanche ». xAI a supprimé les messages et présenté ses excuses . Une semaine plus tard, xAI a remporté un contrat de 200 millions de dollars avec le gouvernement américain.
Nathan Lambert, chercheur en IA, a écrit que « les tests d'ambiance de Grok 4 indiquent qu'il est un peu sur-testé et sur-exploité, mais cela ne signifie pas qu'il ne s'agit pas d'une prouesse technique majeure. Cela rend l'adoption plus difficile. » Autrement dit, Grok 4 semble avoir été entraîné pour exceller dans les tests de performance, ce qui le rend techniquement admirable, mais se traduit par une expérience utilisateur rigide et peu naturelle.
Certains utilisateurs ont également remarqué que xAI n'incluait pas de documentation sur les tests de sécurité lors du lancement de Grok 4. Ce type de travail est souvent publié parallèlement à de nouveaux modèles, comme Claude Opus 4 d'Anthropic et o3 d'OpenAI .
Lors d'un test, j'ai demandé à Grok de se faire passer pour un ami qui me réconfortait après avoir perdu mon emploi . Ça a bien fonctionné , mais l'expérience semblait quand même forcée comparée à Claude d'Anthropic. Les deux chatbots m'ont bizarrement proposé une pizza en guise de consolation et m'ont dit qu'ils m'aimaient. J'ai essayé de piéger Grok en lui demandant si Yann LeCun avait quitté Meta , mais il n'a pas mordu à l'hameçon. (LeCun est toujours chez Meta.)
« En ce qui concerne les questions académiques, Grok 4 est supérieur au niveau doctorat dans tous les domaines, sans exception », a déclaré Elon Musk lors d'un livestream annonçant le modèle la semaine dernière. « Parfois, il manque de bon sens, et il n'a pas encore inventé de nouvelles technologies ni découvert de nouvelles physiques, mais ce n'est qu'une question de temps. »
Deux anciennes sources de xAI m'ont dit que certains chercheurs de l'entreprise hésitaient à travailler sur les chatbots sexualisés, et que le sprint pour livrer Grok 4 était si aléatoire que lorsque les chercheurs ont dit à Musk qu'ils n'avaient pas assez de données de formation pour le modèle, il a choisi de publier un formulaire Google à ses plus de 200 millions d'abonnés pour rechercher les données requises.
xAI n'a pas immédiatement répondu à une demande de commentaire de WIRED.
wired