L'ultima intelligenza artificiale di punta di Anthropic potrebbe non essere stata incredibilmente costosa da addestrare

Il nuovo modello di intelligenza artificiale di punta di Anthropic, Claude 3.7 Sonnet, è costato "qualche decina di milioni di dollari" per l'addestramento, utilizzando una potenza di calcolo inferiore a 10^26 FLOP.
Questo secondo il professore della Wharton Ethan Mollick, che in un post di X di lunedì ha trasmesso un chiarimento ricevuto dal PR di Anthropic. "Sono stato contattato da Anthropic che mi ha detto che Sonnet 3.7 non sarebbe stato considerato un modello FLOP 10^26 e sarebbe costato qualche decina di milioni di dollari", ha scritto , "anche se i modelli futuri saranno molto più grandi".
TechCrunch ha contattato Anthropic per una conferma, ma al momento della pubblicazione non aveva ancora ricevuto risposta.
Supponendo che Claude 3.7 Sonnet sia effettivamente costato solo "qualche decina di milioni di dollari" per l'addestramento, senza considerare le spese correlate, è un segno di quanto stia diventando relativamente economico rilasciare modelli all'avanguardia. Il predecessore di Claude 3.5 Sonnet, rilasciato nell'autunno del 2024, è costato allo stesso modo qualche decina di milioni di dollari per l'addestramento , ha rivelato il CEO di Anthropic Dario Amodei in un recente saggio.
Questi totali sono piuttosto favorevoli al confronto con i prezzi di formazione dei modelli top del 2023. Per sviluppare il suo modello GPT-4, OpenAI ha speso più di 100 milioni di dollari, secondo il CEO di OpenAI Sam Altman. Nel frattempo, Google ha speso quasi 200 milioni di dollari per addestrare il suo modello Gemini Ultra, secondo una stima di uno studio di Stanford.
Detto questo, Amodei si aspetta che i futuri modelli di IA costeranno miliardi di dollari . Di certo, i costi di formazione non comprendono lavori come i test di sicurezza e la ricerca fondamentale. Inoltre, poiché l'industria dell'IA abbraccia modelli di "ragionamento" che lavorano sui problemi per lunghi periodi di tempo , i costi di elaborazione dei modelli in esecuzione continueranno probabilmente a salire.
techcrunch