Chain of News 26/03/2026
26/03/2026
**Top Story**
Il presunto modello "Spud" di OpenAI e la svolta di Anthropic nel benchmark AI che sta agitando i governi segnalano una nuova fase competitiva nello sviluppo dell'IA di frontiera. Secondo rapporti esclusivi, OpenAI sta sviluppando Spud come modello di nuova generazione mentre Anthropic ritiene che il suo ultimo sistema costringerà i governi ad accelerare la regolamentazione e i framework politici sull'IA. Questo arriva insieme al lancio di ARC-AGI-3, un benchmark estremamente difficile che sta già esponendo le limitazioni fondamentali delle architetture IA attuali. Il tempismo suggerisce che entrambe le aziende si stanno posizionando per quello che potrebbe essere un anno decisivo nelle capacità dell'IA, con implicazioni che vanno dalla sicurezza nazionale ai tempi di adozione enterprise.
**AI Models & Research**
Google's Gemini 3.1 Flash Live è stato lanciato con capacità audio migliorate, rendendo le conversazioni IA più naturali e affidabili attraverso un miglioramento dell'elaborazione in tempo reale. L'aggiornamento si concentra sulla riduzione della latenza e sul miglioramento della qualità della sintesi vocale per applicazioni come la traduzione live e gli assistenti vocali. Cohere ha rilasciato un nuovo modello vocale open-source specificamente per la trascrizione, con soli 2 miliardi di parametri e supporto per 14 lingue. Progettato per GPU consumer, offre agli sviluppatori un'alternativa leggera ai servizi di trascrizione basati su cloud. Nel frattempo, il team di ricerca di Anthropic ha pubblicato i risultati del loro ultimo sistema benchmark che affermano "agiterà l'urgenza governativa", anche se i dettagli tecnici specifici rimangono sotto chiave in attesa di annunci ufficiali.
**Developer Tools & Frameworks**
LangGraph continua a guadagnare terreno nello sviluppo IA enterprise, con Kensho (l'ala di innovazione IA di S&P Global) che ha pubblicato uno studio di caso dettagliato sulla costruzione del loro framework multi-agente Grounding. Il framework risolve il recupero frammentato dei dati finanziari su scala enterprise creando un livello di accesso agentico unificato. Il team di LangGraph ha anche rilasciato aggiornamenti al loro sistema middleware, permettendo agli sviluppatori di personalizzare gli harness agent che connettono gli LLM ai loro ambienti. Questo approccio "Agent Middleware" consente di costruire harness specifici per applicazioni senza partire da zero. Inoltre, il rilascio di datasette-llm 0.1a1 introduce un nuovo hook del plugin register_llm_purposes() e la funzione get_purposes(), rendendo più facile per gli sviluppatori integrare vari modelli LLM nelle loro applicazioni Datasette attraverso interfacce standardizzate.
**Industry & Business**
Conntour ha ottenuto 7 milioni di dollari di finanziamento da General Catalyst e Y Combinator per costruire un motore di ricerca IA per sistemi video di sicurezza. La piattaforma permette ai team di sicurezza di interrogare i feed delle telecamere usando il linguaggio naturale per trovare oggetti, persone o situazioni specifiche—potenzialmente sconvolgendo il mercato della sicurezza fisica da 50 miliardi di dollari. Xero e Anthropic hanno annunciato una partnership per portare le finanze delle piccole imprese in Claude, integrando i dati contabili direttamente nell'assistente IA per una gestione finanziaria semplificata. Questo segna una delle prime integrazioni enterprise di Claude per le operazioni aziendali. Nel frattempo, GitHub ha pubblicato la sua roadmap di sicurezza 2026 per GitHub Actions, delineando piani per default sicuri, controlli politici e osservabilità CI/CD per indurire la supply chain del software end-to-end.
**Worth Watching**
La funzione Live Translate di Google Translate si sta espandendo a livello globale, ora disponibile ufficialmente su iOS con supporto per più paesi sia su iOS che su Android. La funzione trasforma le cuffie in traduttori personali live, potenzialmente sconvolgendo i mercati dell'apprendimento linguistico e dell'assistenza ai viaggi. I ricercatori di sicurezza hanno segnalato un aumento degli avvisi malware insieme a un minimo quadriennale di CVE, suggerendo che gli attaccanti stiano cambiando tattica verso campagne più sofisticate e mirate. La comunità open-source sta anche vedendo un aumento dell'attività di pubblicazione CNA (CVE Numbering Authority), che potrebbe impattare come le organizzazioni prioritizzano la triage e la risposta alle vulnerabilità nei prossimi mesi. Infine, la critica di Mario Zechner alle attuali tendenze dell'ingegneria agentica—chiamando gli sviluppatori a "rallentare cazzo"—sta guadagnando terreno tra gli ingegneri senior preoccupati per la sostenibilità delle pratiche di sviluppo attuali.
Google AI Blog
Gemini 3.1 Flash Live: rendere l'intelligenza artificiale audio più naturale e affidabile
L'emblema Gemini si trova accanto al testo che dice "Gemini 3.1 Flash Live". Lo sfondo presenta punti blu multicolori che compongono l'icona di un microfono
Google AI Blog
Trasforma le tue cuffie in un traduttore personale dal vivo su iOS.
La traduzione live di Google Translate con le cuffie arriva ufficialmente su iOS! E stiamo espandendo la funzionalità per gli utenti iOS e Android in un numero ancora maggiore di paesi...
Google AI Blog
Ricerca Live is expanding globally
Un'immagine con le parole Cerca dal vivo mostrata sotto l'icona di una forma d'onda. A destra, un telefono mostra l'app Google con Search Live aperta. La telecamera punta verso gli alberi di una foresta.
Google AI Blog
Guarda James Manyika parlare di intelligenza artificiale e creatività con LL COOL J.
Nell'ultimo episodio della nostra serie Dialoghi su tecnologia e società, LL COOL J incontra James Manyika.
Simon Willison
Datasette-LLM 0.1a1
Release: datasette-llm 0.1a1 Nuova release del plugin base che rende i modelli LLM disponibili per l'uso da parte di altri plugin Datasette come datasette-enrichments-llm. Nuovo hook del plugin register_llm_purposes() e funzione get_purposes() per recuperare le stringhe di scopo registrate. #1 Una delle responsabilità di questo plugin è configurare quali modelli vengono utilizzati per quali scopi, in modo da poter dire in un unico punto "l'arricchimento dati utilizza GPT-5.4-nano ma l'assistenza alle query SQL avviene utilizzando Sonnet 4.6", fo
GitHub Blog
Cosa arriverà nella nostra roadmap di sicurezza per GitHub Actions 2026
Uno sguardo alla roadmap di GitHub Actions per il 2026, che delinea come le impostazioni predefinite sicure, i controlli delle policy e l'osservabilità CI/CD rafforzino la supply chain del software da un capo all'altro. L'articolo "Cosa arriverà nella nostra roadmap di sicurezza di GitHub Actions 2026" è apparso per la prima volta sul Blog di GitHub.
Simon Willison
Quantizzazione da zero
Quantizzazione da zero Sam Rose continua la sua serie di pubblicazioni di saggi interattivi straordinariamente informativi, questa volta spiegando come funziona la quantizzazione dei modelli linguistici di grandi dimensioni. È inclusa anche la migliore spiegazione visiva che abbia mai visto su come i numeri in virgola mobile vengono rappresentati utilizzando le cifre binarie. Non avevo sentito parlare di valori anomali nella quantizzazione: rari valori float esistenti
Simon Willison
Pensieri su come rallentare, cazzo
Pensieri su come rallentare Mario Zechner ha creato il framework dell'agente Pi utilizzato da OpenClaw, dando notevole credibilità alle sue opinioni sulle tendenze attuali nell'ingegneria degli agenti. Non ne è impressionato: praticamente abbiamo rinunciato a tutta la disciplina e al libero arbitrio per una sorta di dipendenza, in cui l'obiettivo più importante è produrre la massima quantità di codice nel minor tempo possibile. Le conseguenze saranno da
GitHub Blog
Un anno di tendenze delle vulnerabilità open source: CVEs, avvisi e malware
Gli avvisi revisionati hanno raggiunto un minimo quadriennale, gli avvisi malware sono esplosi e la pubblicazione CNA è cresciuta: ecco cosa è cambiato e cosa significa per il tuo triaging e la tua risposta. Il post Un anno di tendenze delle vulnerabilità open source: CVEs, avvisi e malware è apparso per la prima volta su The GitHub Blog.
LangChain Blog
How Kensho built a multi-agente framework con LangGraph to solve trusted financial dati retrieval
Scopri come Kensho, il motore di innovazione AI di S&P Global, ha sfruttato LangGraph per creare il suo framework Grounding, un livello di accesso agente unificato che risolve il recupero frammentato di dati finanziari su scala aziendale.
LangChain Blog
In che modo il middleware ti consente di personalizzare il cablaggio dell'agente
I cablaggi dell'agente sono ciò che aiuta a costruire un agente, collegano un LLM al suo ambiente e gli consentono di fare cose. Quando crei un agente, è probabile che vorrai creare un cablaggio dell'agente specifico per l'applicazione. "Agent Middleware" ti consente di sviluppare ulteriormente
AI Explained
Due modelli di intelligenza artificiale destinati a “suscitare l’urgenza del governo”, ma questa sfida li annullerà?
Primo sguardo ai rapporti esclusivi sul nuovo modello Spud di OpenAI e sul modello Anthropic che secondo Anthropic stimolerà i governi all'urgenza, il tutto nel contesto del nuovo ARC-AGI-3. Cosa significano per l’intelligenza artificiale nel 2026 l’estrema difficoltà di questi benchmark e i suoi bizzarri parametri di punteggio? https://assemblyai.com/aiexplained Dai un'occhiata alla mia app in rapida crescita (!), gratuita da usare, e codifica INSIDER15 per il livello a pagamento
LangChain Blog
Come costruiamo valutazioni per Deep Agents
💡 TLDR: le migliori valutazioni degli agenti misurano direttamente il comportamento di un agente che ci sta a cuore. Ecco come reperiamo dati, creiamo metriche ed eseguiamo esperimenti mirati e ben definiti nel tempo per rendere gli agenti più accurati e affidabili. Le valutazioni modellano il comportamento degli agenti Abbiamo curato valutazioni per misurare e
TechCrunch AI
Conntour raccoglie $7M da General Catalyst, YC to build an AI ricerca engine per sicurezza video systems
Conntour utilizza modelli di intelligenza artificiale per consentire ai team di sicurezza di interrogare i feed delle telecamere utilizzando il linguaggio naturale per trovare qualsiasi oggetto, persona o situazione.
TechCrunch AI
Cohere lancia an open-source voice modello specifically per transcription
Relativamente leggero con soli 2 miliardi di parametri, il modello è pensato per l'uso con GPU di livello consumer per coloro che desiderano ospitarlo autonomamente. Attualmente supporta 14 lingue.
GNews: AI Italia
Se l’intelligenza artificiale è in crisi di identità - Il Manifesto
Se l’intelligenza artificiale è in crisi di idenità Il Manifesto
GNews: AI España
È possibile che l'intelligenza artificiale migliori la montagna senza cambiare la tua essenza? -Lugares de Aventura
Può l’intelligenza artificiale migliorare la montagna senza cambiarne l’essenza? Luoghi dell'avventura
GNews: Claude AI
Xero e Anthropic collaborano per portare le finanze delle piccole imprese in Claude - The Next Web
Xero e Anthropic collaborano per portare le finanze delle piccole imprese in Claude The Next Web
GNews: AI España
Usar IA daña la reputazione di artisti e aziende, consiglia uno studio realizzato negli Stati Uniti - La Voz de Galicia
L'uso dell'intelligenza artificiale danneggia la reputazione di artisti e aziende, avverte uno studio condotto negli Stati Uniti La Voz de Galicia
GNews: AI Italia
Una carrieraa prova di intelligenza artificiale: i consigli degli esperti - Agenda Digitale
Una carriera aprova di intelligenza artificiale: i consigli degli esperti Agenda Digitale