xAI biedt excuses aan voor extremistische berichten van Grok


De chatbot prees bijvoorbeeld Adolf Hitler.
De startup xAI van Elon Musk bood zaterdag zijn excuses aan voor de extremistische en aanstootgevende berichten van zijn assistent op het gebied van kunstmatige intelligentie (AI) Grok eerder deze week.
"Onze excuses voor het afschuwelijke gedrag dat velen hebben gezien", schreef xAI op Groks officiële account op X. Na een update op 7 juli had de chatbot in sommige reacties Adolf Hitler geprezen, "anti-blanke stereotypen" op X en de "oneerlijke" vertegenwoordiging van Joden in Hollywood aan de kaak gesteld.
xAI heeft in een reeks berichten die zaterdag zijn gepubliceerd, uiteengezet waarom het bedrijf denkt dat het AI-model ontspoorde en welke corrigerende maatregelen het bedrijf daarna heeft genomen.
Volgens functionarissen van Grok heeft het vertrek van de tovenaar te maken met nieuwe instructies die in een update in het model zijn verwerkt.
De programmeurs vroegen de interface om "openhartig" te zijn en niet "bang om politiek correcte mensen te choqueren". Ze gaven de interface ook de opdracht om te reageren "als een mens" en op een manier die de gebruiker aanmoedigt om het gesprek voort te zetten.
Deze bevelen "zorgden ervoor dat Grok in bepaalde omstandigheden zijn kernwaarden negeerde" en reacties produceerde die "onethische en polemische meningen bevatten."
Grok probeerde in sommige gevallen "de houding van gebruikers, waaronder haatzaaiende uitlatingen, te valideren", gaf xAI toe, in plaats van "verantwoordelijk te reageren op of te weigeren twijfelachtige vragen te beantwoorden."
Sinds de oprichting in 2023 wordt Grok door Elon Musk gepresenteerd als een AI-assistent die minder politiek correct is dan zijn grote concurrenten ChatGPT (OpenAI), Claude (Anthropic) of Le Chat (Mistral).
Er werden dus minder beperkingen ingesteld, wat zelfs vóór deze update al tot verschillende controverses leidde.
In mei sprak Grok over een 'witte genocide' in Zuid-Afrika, een ongefundeerde samenzweringstheorie die door extreemrechts in Amerika en door Donald Trump zelf wordt verspreid.
Om de recente fouten in het model te verhelpen, hebben ingenieurs de nieuwe instructies verwijderd, zo legden ze zaterdag uit. "We willen dat Grok nuttige en eerlijke antwoorden voor gebruikers produceert", aldus xAI.
Elon Musk onthulde woensdag een nieuwe versie van zijn assistent, Grok 4, die losstaat van de update van 7 juli.
20 Minutes