Una IA risolve il problema matematico di Erdös: "ningún humano había dado solución mejor en 80 años" - Cadena SER
Una IA risolve il problema matematico di Erdös: "ningún humano había dado solución mejor en 80 años" Cadena SER
Una IA risolve il problema matematico di Erdös: "ningún humano había dado solución mejor en 80 años" Cadena SER
A seguito dei nostri precedenti aggiornamenti, GitHub Copilot per Eclipse è open source, con il codice disponibile su GitHub sotto la licenza MIT. Questo segna un traguardo importante per GitHub Copilot in... Il post GitHub Copilot per Eclipse è open source è apparso per la prima volta sul blog GitHub.
1Password, Keycard presentano strumenti per la delega sicura delle credenziali dell'agente AI Aggiornamento biometrico
L'ottimizzazione delle preferenze dirette (DPO) è emersa come un'alternativa popolare all'apprendimento per rinforzo dal feedback umano (RLHF), offrendo equivalenza teorica con un'implementazione più semplice. Dimostriamo che questa equivalenza è condizionale piuttosto che universale, in base a un presupposto implicito spesso violato nella pratica: la politica ottimale RLHF deve preferire le risposte preferite dall’uomo.
La realizzazione di reti autonome (AN) di livello 4/5 richiede il passaggio dall'automazione statica all'intelligenza nativa dell'agente. Le operazioni attuali, che fanno affidamento su copioni rigidi, non hanno l’autorità cognitiva per gestire condizioni non nominali. Per affrontare questo problema, questa lettera propone un’architettura di riferimento gerarchica multi-agente che consente un’autonomia di alto livello. Il framework presenta un Dual-Driven Orchestrator che coordina agenti esecutivi specializzati, supportato da una memoria pubblica condivisa per la conoscenza del dominio unificato.
I Large Language Models (LLM) funzionano bene in molti compiti linguistici, ma il loro ragionamento basato sulla Teoria della Mente (ToM) è ancora disomogeneo in contesti sociali complessi. I benchmark esistenti, incluso ExploreToM, non sempre mettono alla prova le convinzioni ricorsive e le asimmetrie informative che rendono difficili queste impostazioni. Questo articolo presenta OSCToM (Teoria della mente con conflitto personale osservatore), un approccio per modellare i conflitti di credenze annidate nei compiti di ToM basati su LLM.
La pianificazione è una capacità fondamentale per i modelli linguistici di grandi dimensioni (LLM) perché compiti così complessi richiedono modelli per coordinare obiettivi, vincoli, risorse e conseguenze a lungo termine in soluzioni eseguibili e verificabili. I benchmark di pianificazione esistenti, tuttavia, solitamente trattano i dati di pianificazione come raccolte fisse di istanze piuttosto che come obiettivi di generazione controllabili.
L'ottimizzazione iterativa della simulazione e della progettazione industriale è ostacolata dal divario semantico CAD-CAE: tradurre il feedback della simulazione in modifiche geometriche valide sotto vincoli diversi e accoppiati. Per colmare questa lacuna, proponiamo COSMO-Agent (Closed-loop Optimization, Simulation, and Modeling Orchestration), un framework di apprendimento per rinforzo (RL) potenziato da strumenti che insegna agli LLM a completare il processo CAD-CAE a ciclo chiuso.
Nonostante il notevole successo dei modelli linguistici di grandi dimensioni (LLM), essi devono ancora affrontare colli di bottiglia durante l’implementazione in contesti dinamici e reali, con le sfide principali rappresentate dalla deriva dei concetti e dall’alto costo dell’adattamento basato sul gradiente. Il fine tuning (FT) tradizionale fatica ad adattarsi a flussi di dati non stazionari senza risultare catastrofico per l'ottenimento o la necessità di un'ampia cura manuale dei dati.
I/O 2026: Benvenuti nell'era degli agenti Gemini blog.google
Digita almeno 2 caratteri
Questo sito utilizza cookie essenziali per il funzionamento e cookie di analisi per migliorare l'esperienza. Puoi accettare tutti, solo gli essenziali, o personalizzare. Cookie Policy | Privacy Policy