News Tech Claude Fable 5 debutta sul mercato Anthropic punta su performance estreme ma i costi API raddoppiano

La sezione di tecnologia di Inforge raccoglie ogni giorno le ultime notizie su ciò che riguarda internet e la tecnologia, dall'hardware, alle app e molto altro ancora.
b7055119423427c40a0e4d84054aed17682b50a2-2880x1620.webp



  • Anthropic ha presentato ufficialmente i modelli IA di classe "Mythos", introducendo Claude Fable 5 per il pubblico generale e Mythos 5 per un gruppo ristretto di partner operanti nella sicurezza informatica e nella biologia.
  • I nuovi modelli registrano prestazioni ai vertici della categoria nella programmazione e nell'analisi dei dati, accompagnati tuttavia da un costo di utilizzo API pari al doppio rispetto al precedente Claude Opus 4.8.
  • Sviluppatori indipendenti, tra cui Simon Willison, confermano le notevoli capacità di coding del modello, mentre Salvatore Sanfilippo dice che Fable 5 è attualmente il miglior modello al mondo per il ragionamento logico.


Anthropic ha ufficializzato il rilascio di Claude Fable 5 e Claude Mythos 5, inaugurando di fatto una nuova categoria di modelli linguistici di grandi dimensioni definita internamente "classe Mythos". Questa nuova generazione si posiziona al di sopra della precedente famiglia Opus in termini di capacità computazionali e analitiche. La redazione di The Verge ha fatto notare un dettaglio curioso riguardo la nomenclatura: i modelli portano il numero "5" nonostante l'azienda non abbia mai rilasciato versioni precedenti etichettate come Fable 1-4. Al momento, Anthropic non ha fornito spiegazioni ufficiali in merito a questo salto numerico.

Capacità tecniche e riscontri sul campo​

I dati forniti dall'azienda e i primi test indipendenti delineano un netto passo in avanti, in particolare per i task complessi e prolungati nel tempo. Nel settore del software engineering, Stripe ha riportato di aver compresso mesi di lavoro ingegneristico in pochi giorni. Su una base di codice Ruby da 50 milioni di righe, Fable 5 ha eseguito una migrazione su larga scala in sole 24 ore, un compito stimato in oltre due mesi di lavoro manuale per un team dedicato.

Nel comparto dell'analisi finanziaria, l'azienda di trading IMC ha evidenziato come Fable 5 abbia superato le loro valutazioni in ambiti critici come la root-cause analysis e il calcolo del valore atteso. Risultati simili si registrano nel campo della genomica e della ricerca biologica: l'accesso al modello Mythos 5 ha permesso a Dyno Therapeutics di valutare modifiche genetiche virali superando, in termini di precisione, software specifici dedicati al linguaggio delle proteine.

Sicurezza attiva e la netta divisione tra Fable e Mythos​

La distinzione tra i due modelli appena rilasciati risiede esclusivamente nei protocolli di sicurezza. Fable 5 è la versione destinata al pubblico generale ed è dotata di classificatori di sicurezza estremamente severi. Quando il sistema rileva prompt legati a cybersicurezza offensiva, biologia, chimica o tentativi di estrazione del modello (distillation), blocca l'elaborazione su Fable e instrada automaticamente la richiesta verso Claude Opus 4.8. Questa misura "conservativa", che attualmente genera falsi positivi nel 5% delle sessioni, è stata implementata per prevenire la generazione di codice malevolo o exploit avanzati.

Al contrario, Mythos 5 è privo di questi filtri. Viene distribuito unicamente a una cerchia ristretta di operatori governativi e infrastrutturali tramite il Project Glasswing, e sarà progressivamente esteso a ricercatori biomedici verificati attraverso un Trusted Access Program. A supporto di questa architettura, Anthropic ha imposto una nuova policy di conservazione dei dati di 30 giorni per tutto il traffico della classe Mythos, utile esclusivamente per l'analisi di vettori d'attacco e tecniche di jailbreak.

Costi API elevati e le prime recensioni degli sviluppatori​

Il salto prestazionale comporta un onere finanziario rilevante. Anthropic ha fissato il prezzo per entrambi i modelli a 10 dollari per milione di token in input e 50 dollari per milione di token in output. Si tratta di una tariffa doppia rispetto a Claude Opus 4.8.

Il noto sviluppatore e creatore del framework Django, Simon Willison, ha effettuato un test intensivo del modello rilasciando un'analisi dettagliata. Willison ha utilizzato l'API di Fable 5 per creare una sandbox Python in WebAssembly e per aggiornare la sua libreria Datasette Agent. Lo sviluppatore ha evidenziato la vasta conoscenza intrinseca del modello, capace di elencare l'esatta cronologia di progetti open source vecchi di vent'anni senza ricorrere a ricerche web. Il rovescio della medaglia è il consumo: in poche ore di sviluppo intensivo su task di programmazione complessi, Willison ha consumato oltre 110 dollari di token, confermando come Fable 5 sia un prodotto estremamente potente ma altrettanto dispendioso.



A fornire uno spaccato tecnico sulle reali capacità di Claude Fable 5 è intervenuto Salvatore Sanfilippo (noto come antirez, creatore di Redis). Attraverso un'analisi pubblicata sul suo canale, lo sviluppatore ha definito Fable 5 come il modello attualmente migliore al mondo, evidenziando un divario rispetto a competitor diretti come GPT-5.5-Xi (utilizzato per Codex) e GPT-5.5 Pro.

Sanfilippo ha testato a il modello utilizzandolo per lo sviluppo del suo motore di inferenza locale DwarfStar. Fable 5 si è dimostrato in grado di ragionare ad altissimo livello su tematiche ingegneristiche complesse, come l'implementazione dello speculative decoding con multi-token prediction. Laddove i modelli di OpenAI faticavano a calcolare i trade-off legati alle tempistiche di decodifica, Fable 5 ha fornito risposte lucide e precise, dimostrando una capacità di astrazione inedita. Dal punto di vista dell'usabilità, lo sviluppatore nota che Fable è un modello con cui si lavora in modo più fluido rispetto al passato, sebbene tenda a fornire pochissimi feedback durante il processo di ragionamento.

Sanfilippo evidenzia una grave mancanza di "steerability" (malleabilità): una volta intrapresa una direzione logica, il modello tende a ignorare i feedback correttivi dell'utente in corso d'opera. Interrompere la generazione per segnalare un errore produce spesso false rassicurazioni, seguite dalla reiterazione dell'approccio sbagliato.

Questa rigidità, secondo Sanfilippo, potrebbe derivare dall'uso di un'architettura Mixture of Experts (MoE) estremamente frammentata. Quando si richiede a Fable 5 di effettuare una "cross-code review" (confrontare due blocchi di codice forniti in contesti diversi), il modello va in confusione. La teoria è che la separazione dei pesi neurali tra i vari "esperti" impedisca una comunicazione fluida interna, portando il sistema a generare allucinazioni o risposte incoerenti quando deve incrociare dati complessi elaborati da moduli differenti.

Rischio di monopolio e shadow banning da parte di Anthropic​

Quindi se da un lato Fable 5 risulta meno restrittivo su task generici, dall'altro mostra comportamenti quando si toccano argomenti di ricerca di frontiera. Richieste come l'analisi e l'applicazione di un paper accademico sui LLM generano immediatamente un blocco da parte del modello.

Questa chiusura estrema non deriva esclusivamente da una reale preoccupazione per la sicurezza pubblica. La strategia di Anthropic sembrerebbe avere una matrice fortemente utilitaristica: blindare Fable 5 per impedire che sviluppatori indipendenti possano utilizzarlo per creare modelli concorrenti. Inoltre, limitando l'accesso alle capacità offensive e di analisi del codice esclusivamente a enti governativi e partner aziendali (tramite Mythos 5), Anthropic si assicura di fatto un controllo monopolistico sul remunerativo mercato delle vulnerabilità Zero-Day e della cybersicurezza avanzata.

Resta da capire se il mercato enterprise e i singoli sviluppatori riterranno sostenibile, nel lungo termine, il passaggio a modelli API con barriere d'ingresso finanziarie così elevate e policy di sicurezza estremamente rigide, o se l'alternativa rappresentata dall'inferenza locale ad alte prestazioni assumerà un ruolo via via più centrale nei flussi di lavoro ingegneristici quotidiani.
 
Indietro
Top Bottom