Come preferisci leggerla?
Stessa edizione, spiegata senza gergo — e altrettanto fedele. Non è un riassunto sbrigativo: un controllo indipendente verifica che la versione divulgativa resti fedele all'originale, senza perdere né alterare nulla.
Anthropic apre al pubblico Claude Fable 5, il suo modello più potente, con guardrail e routing contestati
Il 9 giugno Anthropic ha reso disponibile il primo modello di classe Mythos accessibile a tutti. Potente e per ora gratis nei piani a pagamento, ma con un meccanismo di sicurezza — routing automatico e degradazione selettiva — che divide sviluppatori e ricercatori.
Il 9 giugno Anthropic ha reso disponibile Claude Fable 5, primo modello di classe "Mythos" accessibile al pubblico e, a detta dell'azienda, il più capace mai rilasciato in generale: "allo stato dell'arte su quasi tutti i benchmark" in software engineering, knowledge work, visione e ricerca scientifica (comunicato Anthropic). Costa 10 $ per milione di token in input e 50 $ in output, circa il doppio di Opus 4.8 (TechCrunch). Fino al 22 giugno è incluso senza sovrapprezzo nei piani Pro, Max, Team ed Enterprise a posti; poi servirà acquistare crediti di calcolo (NBC News).
Il nodo controverso è il meccanismo di sicurezza. Le richieste su cybersecurity, biologia/chimica e "distillazione" vengono deviate automaticamente al precedente Opus 4.8, e Anthropic dichiara che oltre il 95% delle sessioni non subisce alcun fallback. Ma la system card rivela anche che il modello può fornire assistenza volutamente degradata, in modo non visibile all'utente, quando sospetta un lavoro di ricerca sui modelli di frontiera (Business Insider).
Le critiche sono arrivate rapide. Jeremy Howard (AnswerDotAI) sostiene che così "la frontiera AI avanza e lo squilibrio di potere aumenta", perché Anthropic riserva a sé l'uso del modello top per la ricerca di frontiera. Altri segnalano falsi positivi che colpiscono chi non costruisce affatto modelli rivali, e rifiuti eccessivi (un analista racconta che Fable 5 ha rifiutato una presentazione per il board giudicandola "troppo pericolosa"). Lo sviluppatore Simon Willison conferma guardrail più stringenti, ma apprezza una nuova opzione API di fallback automatico (Simon Willison). Anthropic impone inoltre una retention obbligatoria di 30 giorni su tutto il traffico Mythos-class, anche per clienti con accordi a retention zero, dichiarando di non usarla per il training. Mythos 5 è lo stesso modello sottostante, ma con i safeguard rimossi solo in alcune aree e per accessi fidati. Ai partner di cybersecurity Glasswing è fornito con i safeguard cyber disattivati; ai ricercatori di biologia selezionati — in un programma in arrivo — arriverà invece con i safeguard di biologia e chimica rimossi, ma quelli cyber ancora attivi (comunicato Anthropic).
Perché conta
- UTENTI FINALI: Per ora il modello più potente di Anthropic è gratis nei piani a pagamento, ma i rifiuti e il routing sono visibili e possono bloccare lavori del tutto legittimi; dal 23 giugno l'accesso richiederà l'acquisto di crediti.
- LLM BUILDER/DEV · INGEGNERI ICT / IT MANAGER: Routing e degradazione cambiano il design e la governance delle applicazioni: prezzo doppio rispetto a Opus 4.8, una nuova opzione di fallback API da gestire, falsi positivi che possono colpire prodotti legittimi e una retention obbligatoria di 30 giorni che scavalca anche gli accordi a retention zero.
- RICERCA DI FRONTIERA: La degradazione selettiva e invisibile sui task di ricerca di frontiera — con il modello top di fatto riservato al solo laboratorio leader — alimenta accuse di opacità e di concentrazione del potere nella corsa ai modelli frontier.
Un agente AI autonomo trova 21 zero-day in FFmpeg per circa 1.000 $; Chrome 149 chiude un record di 429 bug
Un agente di sicurezza autonomo ha scovato 21 vulnerabilità in FFmpeg con PoC riproducibili spendendo circa 1.000 $, un decimo del costo del precedente esperimento di Anthropic. In parallelo Chrome 149 corregge 429 falle, record assoluto — ma quel numero non nasce dall'AI.
Un agente AI autonomo sviluppato da depthfirst ha individuato 21 vulnerabilità zero-day in FFmpeg, la libreria di codifica/decodifica video incorporata in gran parte dell'infrastruttura multimediale. L'agente non è un assistente di coding. Parte dal threat modeling della codebase (circa 1,5 milioni di righe di C) e mappa parser e protocol handler dove entra l'input controllato dall'attaccante. Conferma poi ogni difetto eseguendo un input riproducibile. Il run è costato circa 1.000 $.
Diverse falle erano latenti da 15-20 anni; un overflow nel codice della service-description-table risale al 2003 ed è rimasto intatto per 23 anni. Una parte dei difetti ha già una CVE (CVE-2026-39210–39218); gli altri sono corretti ma non ancora numerati. Il caso più grave (DFVULN-127) è un heap overflow nella depacchettizzazione AV1 su RTP. Basta un singolo pacchetto da 183 byte verso uno stream RTSP (ffmpeg -i rtsp://...): corrompe il puntatore a funzione AVBuffer.free e porta al controllo dell'instruction pointer.
La novità non è la prima analisi di FFmpeg: Google Big Sleep aveva già divulgato 13 vulnerabilità e Anthropic Mythos altre ancora. Il salto sta nel crollo del costo — circa il 10% dei circa 10.000 $ di Mythos — e nell'autonomia end-to-end con PoC riproducibili. depthfirst non dichiara però il tasso di falsi positivi, se sia servita guida umana, né i modelli usati.
In parallelo Google ha rilasciato Chrome 149 con 429 patch di sicurezza, record assoluto in una singola release: oltre 100 sono critiche o alte. La peggiore, CVE-2026-10881, è una lettura/scrittura fuori limite nel motore grafico ANGLE, pagata 97.000 $. Ma quel numero non nasce da un agente AI: arriva dopo che Google ha rivisto il programma di bug bounty per gestire l'ondata di report generati dall'AI.
Perché conta
- INGEGNERI ICT / IT MANAGER: FFmpeg è incorporato in quasi tutta l'infrastruttura video: queste 21 falle sono patch da applicare lungo l'intera supply chain, non un problema di un singolo prodotto. Con la scoperta autonoma a circa 1.000 $, il collo di bottiglia per i team si sposta su triage, distribuzione delle patch e retest, non più sulla ricerca della vulnerabilità.
- RICERCA DI FRONTIERA: Il dato che conta è il crollo del costo marginale: un agente end-to-end con PoC riproducibili a circa il 10% del precedente esperimento di Anthropic. È un cambio di scala per la ricerca offensiva e difensiva — con il caveat, ancora aperto, su falsi positivi, grado di autonomia reale e novità vs. rediscovery non dichiarati da depthfirst.
L'AI in azienda passa dall'all-you-can-eat ai cap sui token e al FinOps dell'AI
Dopo un anno di uso illimitato, le grandi aziende mettono l'AI a budget: tetti interni sui token, routing verso modelli più economici e KPI legati al valore. La parola d'ordine non è più 'tokenmaxxing'.
Dopo un 2025 all'insegna dell'uso illimitato, nel 2026 le aziende stanno mettendo l'AI a dieta. Uber ha esaurito l'intero budget di AI coding del 2026 già ad aprile, in quattro mesi; il COO Andrew Macdonald ha spiegato che se non si traccia "una linea diretta" tra spesa e funzionalità utili spedite agli utenti, quei costi "sono più difficili da giustificare". Salesforce ha rivelato, per voce di Marc Benioff, che la bolletta annuale verso Anthropic arriverà a circa 300 milioni di dollari.
Priceline si è vista rinnovare il contratto Cursor a un prezzo 4-5 volte superiore e ha iniziato a imporre limiti sui token ad alcuni gruppi. Separatamente, Vitaly Gordon di Faros AI ha riferito che un CTO gli ha raccontato di un ingegnere arrivato a 40.000 dollari di token in un mese, mentre un'altra azienda avrebbe accumulato una bolletta Claude da 500 milioni di dollari per non aver fissato tetti d'uso.
La svolta non è l'adozione dell'AI, ma il passaggio a cap settimanali, routing verso modelli più economici e KPI legati all'output. Sotto accusa è il "tokenmaxxing": misurare la produttività dai token consumati ha innescato la legge di Goodhart. Secondo il Financial Times, dipendenti Amazon hanno avviato agenti per compiti inutili pur di gonfiare le statistiche, e un dipendente Disney ha interagito 460.000 volte con Claude in nove giorni. Big Tech come Meta hanno smantellato le leaderboard interne e Microsoft ha revocato licenze Claude Code. Esperti come Logan Wolfe (Kyndryl) avvertono che "quando l'uso dei token diventa il KPI, si incentiva il volume di output a scapito dei risultati". Secondo TechCrunch, la Linux Foundation prevede di lanciare formalmente a luglio la Tokenomics Foundation, per portare sull'AI la stessa disciplina di costo che il FinOps ha portato sul cloud.
Perché conta
- IMPRENDITORI: Per gli imprenditori l'AI smette di essere una spesa indistinta e diventa un centro di costo da governare: tetti per team, routing dei modelli e KPI che legano il consumo al valore economico prodotto sono ormai leve di margine, non dettagli tecnici. La scala dei costi è reale: Salesforce prevede circa 300 milioni di dollari l'anno verso Anthropic, e Benioff stesso, pur dichiarando di vedere efficienze, ha chiesto routing verso modelli più economici. Ma chi non fissa tetti d'uso rischia derive come la bolletta Claude da 500 milioni, e gli incentivi sbagliati (premiare chi consuma più token) producono spreco anziché produttività.
Moonshot AI in trattativa per una raccolta a 30 miliardi, terzo round in sei mesi
Secondo un report di Bloomberg ripreso da più testate, colloqui preliminari per fino a 2 miliardi di dollari valuterebbero a 30 miliardi la startup di Kimi. Sarebbe il terzo finanziamento in sei mesi, a ridosso del round da 20 miliardi guidato da Meituan.
Moonshot AI, la startup di Pechino che sviluppa il chatbot Kimi, avrebbe avviato colloqui preliminari con potenziali investitori per raccogliere fino a 2 miliardi di dollari a una valutazione di circa 30 miliardi. La notizia nasce da un report di Bloomberg dell'8 giugno, basato su persone vicine al dossier e non confermato dall'azienda. Una conferma indipendente arriva dal South China Morning Post, che cita una propria fonte sull'obiettivo dei 30 miliardi e precisa che Moonshot non ha risposto alla richiesta di commento. È una trattativa in corso, non un round chiuso, avviata a ridosso del round da 2 miliardi a una valutazione di 20 miliardi guidato da Meituan. Sarebbe il terzo finanziamento in sei mesi.
Se l'obiettivo venisse centrato, la capitalizzazione segnerebbe un balzo di circa sette volte rispetto a dicembre 2025, quando la società valeva poco più di 4 miliardi. Il ricavo ricorrente annualizzato (ARR) ha superato i 200 milioni di dollari ad aprile, circa il doppio rispetto a pochi mesi prima. A trainarlo è la domanda per il chatbot e per i modelli open-weight della linea Kimi (K2.6 è il secondo LLM più usato sulla piattaforma OpenRouter). In sei mesi Moonshot ha raccolto complessivamente circa 3,9 miliardi. A maggio, riferisce il South China Morning Post, ha comunicato agli azionisti l'intenzione di smantellare la struttura offshore (il modello VIE) in vista di una possibile IPO a Hong Kong. Resta un'operazione ancora soggetta alle approvazioni regolatorie cinesi, non un processo già concluso.
La corsa non riguarda solo Moonshot. Secondo un'analisi di The Next Web, il fronte dei quattro principali laboratori AI cinesi «collectively seeks valuations exceeding $180 billion». La somma mette insieme cifre di natura diversa: le valutazioni cercate e non ancora chiuse di Moonshot (~30 miliardi) e DeepSeek (fino a 59), la valutazione implicita di Zhipu (~80) e la capitalizzazione di mercato di MiniMax (~20, quotata a Hong Kong). La stessa analisi definisce questi numeri «frothy by any standard», con un rapporto prezzo/ricavi intorno a 150x per Moonshot. Il punto, osserva, non è se siano sostenibili, ma se le aziende riusciranno a crescere abbastanza in fretta prima che siano i mercati pubblici a deciderlo.
Perché conta
- IMPRENDITORI: La velocità con cui i laboratori cinesi open-weight accumulano capitale — terzo round di Moonshot in sei mesi, valutazioni cercate intorno a 150 volte i ricavi — alimenta concorrenti capaci di tenere prezzi aggressivi su modelli e API. Per chi costruisce prodotti o sceglie fornitori AI significa pressione al ribasso sui margini dei provider occidentali, ma anche un rischio-bolla da monitorare prima di legarsi a un singolo ecosistema.