OneLogic
Tutte le edizioni

Lumina Digest

Gli sviluppi dell'AI che contano, spiegati.

Come preferisci leggerla?

Stessa edizione, spiegata senza gergo — e altrettanto fedele. Non è un riassunto sbrigativo: un controllo indipendente verifica che la versione divulgativa resti fedele all'originale, senza perdere né alterare nulla.

OpenAI deposita un S-1 riservato alla SEC e avvia il percorso verso l'IPO

OpenAI ha presentato alla SEC una bozza riservata di registrazione, primo passo formale verso una possibile quotazione, una settimana dopo Anthropic. Ma sui tempi frena, e i conti restano il nodo aperto.

OpenAI ha depositato presso la SEC una bozza riservata di registrazione (draft S-1), il primo passo formale verso una possibile quotazione in borsa. La mossa arriva circa una settimana dopo quella analoga di Anthropic (~1 giugno). La società ha però precisato di non aver ancora deciso i tempi: «non abbiamo deciso il timing; potrebbe volerci un po', perché ci sono cose che vogliamo fare ed è più facile farle da privati». Si tiene comunque «l'opzione di quotarci prima, se risultasse la scelta migliore».

Il deposito riservato permette di preparare l'IPO senza rendere pubblici i numeri finché l'azienda non decide di procedere. Al momento non sono stati comunicati né prezzo né obiettivo di raccolta. Sulla valutazione, OpenAI è stata valutata circa 852 miliardi di dollari post-money a marzo 2026 e scambiata intorno a 880 miliardi sui mercati secondari ad aprile. La soglia dei 1.000 miliardi è invece quella toccata di recente da Anthropic su Forge Global, non da OpenAI. Per confronto, SpaceX è attesa a una quotazione da ~1.750 miliardi.

Il vero nodo sono i conti, e restano proiezioni. Secondo numeri del Wall Street Journal ripresi da TechCrunch — non dati di un S-1 pubblico, che resta riservato — per il 2028 OpenAI prevede di spendere in capacità di calcolo per la ricerca una cifra vicina ai 122 miliardi del round di marzo, e di bruciarne circa 85 nello stesso anno. Anche con ricavi raddoppiati, non genererebbe più cassa di quanta ne spenda per almeno altri quattro anni. È qui che si concentra lo scetticismo. I mercati pubblici chiedono evidenze di margini sostenibili e disciplina operativa. E diversi analisti si chiedono se l'AI di frontiera somigli al software, con i suoi margini scalabili, o piuttosto a un'industria ad alta intensità di capitale. In quest'ultima il costo di inference cresce con l'uso, anziché diluirsi su scala. Il passaggio ai mercati pubblici trasforma la narrazione privata in rendicontazione verificabile.

Perché conta

  • IMPRENDITORI: Dopo Anthropic, anche OpenAI muove verso i mercati pubblici: il confronto competitivo nell'AI si sposta da chi ha il modello migliore a chi regge capitale, disclosure e credibilità verso investitori e regolatori. Per chi costruisce un business è il segnale che la scala, in questo settore, richiede accesso ai capitali quanto innovazione.
  • LLM BUILDER/DEV: Un'IPO porta i conti del provider sotto i riflettori pubblici: burn, margini di inference e sostenibilità dei prezzi diventano rendicontabili. Chi sviluppa sopra questi modelli ottiene un metro per giudicare quanto siano sostenibili i costi — e quindi i prezzi delle API — su cui poggia il proprio stack.

Anthropic dichiara oltre l'80% del codice scritto da Claude, ma frena sul recursive self-improvement

Sulla base di metriche interne non auditate né indipendentemente riproducibili, l'Anthropic Institute sostiene che Claude stia accelerando lo sviluppo interno. Nello stesso documento «When AI builds itself», però, nega che l'auto-miglioramento ricorsivo sia già realtà.

L'Anthropic Institute ha pubblicato When AI builds itself, firmato da Marina Favaro e Jack Clark. La pagina ufficiale non espone una data di pubblicazione, ma le coperture indipendenti collocano l'uscita tra il 4 e il 5 giugno 2026. Il dato di apertura poggia su metriche interne dell'azienda, non auditate né verificabili in modo indipendente. A maggio 2026 oltre l'80% del codice mergeato nella codebase di Anthropic sarebbe scritto da Claude. Prima del lancio in research preview di Claude Code (febbraio 2025), la quota si fermava alle "low single digits". La leadership stima il 90% o più includendo script e codice sperimentale. Nel secondo trimestre 2026 l'ingegnere tipo avrebbe mergeato 8× codice al giorno rispetto al 2024.

Il report però ridimensiona da solo la metrica: "lines of code is an imperfect measure", e quel moltiplicatore "is almost certainly an overstatement of the true productivity gain". Soprattutto smentisce la lettura più sensazionalistica: "We are not there yet, and recursive self-improvement is not inevitable". L'auto-miglioramento ricorsivo — un'AI che progetta e addestra il proprio successore — resta uno scenario futuro, non un risultato raggiunto. Un esperimento citato saliva dal 23% al 97%, ma "didn't transfer cleanly to production-scale models". Per questo Anthropic chiede un meccanismo globale verificabile per rallentare o sospendere lo sviluppo di frontiera, come riportano Tom's Hardware e The Next Web.

Il timing alimenta i sospetti: State of Brand osserva che il documento è uscito pochi giorni dopo il deposito riservato per l'IPO (1° giugno), definendolo "not neutral testimony... a pitch". The Next Web si chiede invece se si tratti di "principled transparency or strategic positioning".

Perché conta

  • RICERCA DI FRONTIERA: Il valore del report è il confine netto che traccia: l'80% di codice assistito non è recursive self-improvement, che Anthropic dichiara esplicitamente non ancora raggiunto né inevitabile. Per chi studia capacità e governance di frontiera, due segnali restano da monitorare: il transfer fallito dal 23% al 97% su modelli di produzione e la richiesta di un meccanismo di pausa verificabile.
  • LLM BUILDER/DEV: I numeri dichiarati da Anthropic — 80% del merge, 8× codice al giorno — sono autodichiarazioni interne non auditate, non un benchmark verificabile in modo indipendente. La stessa azienda avverte che le righe di codice misurano quantità, non qualità, e sovrastimano il guadagno reale. Restano quindi un promemoria per non confondere volume e produttività effettiva nei propri team.
  • IMPRENDITORI: L'uscita a pochi giorni dal deposito IPO impone di separare la produttività apparente dalla capacità autonoma reale prima di tradurre lo slogan «l'AI costruisce l'AI» in tesi d'investimento o decisioni strategiche.

Microsoft disabilita circa 70 repository GitHub infettati da un worm ruba-credenziali per sviluppatori AI

Microsoft ha messo offline decine di propri progetti open source su GitHub dopo l'iniezione di un malware ruba-credenziali. Il codice si attiva appena uno sviluppatore apre il progetto compromesso in un agente AI come Claude Code o Gemini CLI. È la seconda compromissione in poche settimane, letta da alcuni ricercatori come una ri-compromissione dello stesso ecosistema.

Microsoft ha disabilitato circa 70 dei propri progetti open source su GitHub dopo che vi era stato iniettato un malware ruba-credenziali. Alcune testate contano 73 repository, rimossi attorno al 5 giugno dal sistema anti-frode della piattaforma. Molti dei progetti colpiti riguardavano servizi Azure e strumenti usati per programmare con gli agenti AI. Il codice malevolo si attiva nel momento in cui uno sviluppatore apre un progetto compromesso dentro un ambiente di sviluppo assistito, tra cui Claude Code, Gemini CLI e Visual Studio Code (alcuni report includono anche Cursor): a quel punto sottrae password e altre credenziali sensibili.

A segnalare il problema sono state la società di sicurezza Cloudsmith e la piattaforma di analisi OpenSourceMalware. Secondo alcune ricostruzioni il malware è un worm auto-replicante battezzato «Miasma», riconducibile alla famiglia del worm Shai-Hulud per npm. È una caratteristica che spiega la sua capacità di ri-diffondersi: non si tratta di una tecnica del tutto inedita, ma dell'evoluzione di codice già noto.

L'episodio è il secondo in poche settimane: a maggio era già stato compromesso il progetto Durable Task di Microsoft. OpenSourceMalware legge l'attacco di giugno come una ri-compromissione dello stesso ecosistema, mentre Cloudsmith punta a una rotazione delle credenziali incompleta dopo il primo incidente. Microsoft, per voce del portavoce Ben Hope, afferma di aver «rimosso temporaneamente alcuni repository» durante le verifiche: una parte è già stata ripristinata, altri restano offline. Ha inoltre avvisato «un piccolo numero di clienti» che potrebbero aver scaricato i contenuti infetti. L'azienda non ha però confermato il legame con l'incidente di maggio. Non ha nemmeno chiarito se gli aggressori abbiano riottenuto l'accesso o se si tratti di un'intrusione separata: la portata complessiva resta incerta.

Perché conta

  • INGEGNERI ICT / IT MANAGER: Conferma che gli ambienti agentici di sviluppo (Claude Code, Gemini CLI, VS Code) sono ormai un bersaglio diretto della supply chain: il furto di credenziali scatta all'apertura del progetto nell'agente, prima di qualunque build o esecuzione esplicita. Si impongono rotazione dei token, audit dei cloni recenti, blocco dell'auto-esecuzione degli agenti e isolamento degli ambienti AI-dev. La ri-compromissione dimostra che una bonifica parziale, senza rotazione completa delle credenziali, non basta.

Da agente singolo a flotte: Boris Cherny gestisce fino a decine di migliaia di agenti

Il creatore di Claude Code dice di orchestrare in certi giorni decine di migliaia di agenti AI in un'architettura gerarchica di subagenti. Nel secondo trimestre 2026 il tipico ingegnere di Anthropic mergeava circa 8 volte più codice al giorno rispetto al 2024, su una metrica che la stessa Anthropic dice sovrastimata. Restano aperti i nodi di verifica, supervisione e auto-miglioramento.

Boris Cherny, creatore e responsabile di Claude Code in Anthropic, ha dichiarato al Fortune Brainstorm Tech di Aspen che in certi giorni orchestra flotte di agenti AI su scala industriale: «Stamattina ne gestivo forse qualche centinaio», ha detto, «certi giorni sono migliaia, o decine di migliaia». Non scrive codice a mano da otto mesi (Fortune, 8 giugno).

Il meccanismo è un'architettura gerarchica di subagenti: «Hai un Claude Code, ma ha subagenti che sono altri Claude. L'utente non sta più promptando Claude: è un altro Claude che fa il prompting». Anthropic afferma che nel secondo trimestre del 2026 il tipico ingegnere dell'azienda mergeava circa 8 volte più codice al giorno rispetto al 2024. Avverte però che le righe di codice sono una misura imperfetta, che premia la quantità sulla qualità e «quasi certamente» sovrastima il reale guadagno di produttività (Anthropic, «Recursive self-improvement»). Claude Code, intanto, ormai «si scrive da solo» e conduce le proprie security review, e «inizia ad avere idee»: esamina GitHub e X per decidere cosa costruire, e Cherny racconta di svegliarsi trovando che Claude ha già agito su diverse di esse.

Automatizzata la generazione, il collo di bottiglia si è spostato sulla revisione: Anthropic ha schierato squadre di agenti con «persona» distinte che revisionano ogni pull request (Fortune, 9 giugno). Cherny riformula anche il costo: va confrontato con quanto sarebbe costato un ingegnere, non con un abbonamento da 20 dollari. Restano i caveat. La copertura indipendente di OpenTools riprende Fortune e descrive un sistema in cui i Claude di livello superiore promptano i Claude subordinati, con l'umano ormai fuori dal prompting loop. Su questa scala, «gestire» decine di migliaia di agenti somiglia più a una supervisione di alto livello che a un controllo puntuale di ciascuno. È una lettura che resta nostra, non un'affermazione di OpenTools. E Cherny stesso indica il recursive self-improvement come «uno dei grandi rischi per l'AI».

Perché conta

  • LLM BUILDER/DEV: Il baricentro del lavoro si sposta dall'esecuzione all'orchestrazione: scomporre i task, far girare lavoro parallelo e soprattutto verificarlo e integrarlo. Che la code review sia diventata il nuovo collo di bottiglia in Anthropic è il segnale operativo: senza scoping dei task, policy di permessi, audit trail, test, limiti di budget e review differenziale, una flotta amplifica errori, duplicazione e consumo di token invece di throughput utile.

OpenAI annuncia la sua 'terza fase': ricercatore AI automatizzato, AGI personale e intelligenza abbondante

Sam Altman e Jakub Pachocki fissano tre obiettivi di lungo periodo per OpenAI. È però una dichiarazione strategica, non un rilascio misurabile, arrivata lo stesso giorno del deposito riservato per l'IPO.

L'8 giugno 2026 il CEO Sam Altman e il chief scientist Jakub Pachocki hanno pubblicato «Built to benefit everyone: our plan», dichiarando che OpenAI entra nella sua «terza fase». Il documento fissa tre obiettivi dichiarati: costruire un «ricercatore AI automatizzato», accelerare l'economia e dare «a ogni persona sulla Terra un'AGI personale». La cornice è rendere l'AI «abbondante, accessibile, sicura, utile e facile» abbastanza perché «ogni persona e organizzazione» ne tragga beneficio.

L'unica data concreta è un orizzonte interno. OpenAI ritiene che «entro marzo 2028» una parte significativa della propria ricerca possa essere svolta da sistemi AI in tandem con i ricercatori umani. La tappa intermedia descritta nella roadmap è un «intern» di ricerca autonomo già nel 2026, precursore di un ricercatore pienamente automatizzato nel 2028. Sul fronte sicurezza il piano insiste che «i sistemi potenti devono restare sicuri, allineati all'intento umano e soggetti al controllo umano». Invoca inoltre forme di coordinamento nazionale e globale sul rischio.

Va letta per ciò che è. Le coperture indipendenti sottolineano che si tratta di «direction-setting»: ambizioni di lungo periodo prive di benchmark, percorso tecnico o tappe operative oltre quell'unica data. Il tempismo non è un dettaglio di contorno. L'annuncio è arrivato lo stesso giorno in cui OpenAI ha confermato il deposito riservato per una possibile IPO, peraltro descritta come ancora lontana.

Perché conta

  • LLM BUILDER/DEV: È un segnale di roadmap, non un rilascio: conviene progettare prodotti e agenti assumendo modelli via via più economici, integrati e autonomi. Ma finché restano proprietari metriche, API, prezzi e safety spec, va trattata come direzione strategica e non come capacità già disponibile su cui fondare un piano tecnico.
  • RICERCA DI FRONTIERA: Se l'obiettivo dichiarato è un «ricercatore AI» entro il 2028, il punto d'azione per la comunità è progettare benchmark da AI-scientist — formulazione di ipotesi, esperimenti, verifica/falsificazione — non solo task statici. L'assenza di benchmark pubblici nel piano rende ancora più urgente definirli in modo indipendente.