Una IA resuelve el problema matemático de Erdös: "ningún humano había dado solución mejor en 80 años" - Cadena SER
Una IA resuelve el problema matemático de Erdös: "ningún humano había dado solución mejor en 80 años" Cadena SER
Una IA resuelve el problema matemático de Erdös: "ningún humano había dado solución mejor en 80 años" Cadena SER
Siguiendo nuestras actualizaciones anteriores, GitHub Copilot para Eclipse es de código abierto y el código está disponible en GitHub bajo la licencia MIT. Esto marca un hito importante para GitHub Copilot en... La publicación GitHub Copilot para Eclipse es de código abierto apareció por primera vez en El Blog de GitHub.
1Password y Keycard presentan herramientas para la delegación segura de credenciales de agentes de IA Actualización biométrica
La optimización de preferencias directas (DPO) ha surgido como una alternativa popular al aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF), ofreciendo equivalencia teórica con una implementación más simple. Demostramos que esta equivalencia es condicional más que universal, dependiendo de un supuesto implícito frecuentemente violado en la práctica: la política óptima de RLHF debe preferir las respuestas preferidas por los humanos.
La realización de redes autónomas (AN) de nivel 4/5 exige un cambio de la automatización estática a la inteligencia nativa del agente. Las operaciones actuales, que dependen de guiones rígidos, carecen de capacidad cognitiva para manejar condiciones anormales. Para abordar esto, esta carta propone una arquitectura de referencia jerárquica de múltiples agentes que permita una autonomía de alto nivel. El marco cuenta con un orquestador dual que coordina agentes ejecutivos especializados, respaldado por una memoria pública compartida para el conocimiento del dominio unificado.
Los modelos de lenguaje grandes (LLM) funcionan bien en muchas tareas lingüísticas, pero su razonamiento de la teoría de la mente (ToM) aún es desigual en entornos sociales complejos. Los puntos de referencia existentes, incluido ExploreToM, no siempre prueban las creencias recursivas y las asimetrías de información que dificultan estos entornos. Este artículo presenta OSCToM (Teoría de la mente del conflicto entre el observador y el yo), un enfoque para modelar conflictos de creencias anidadas en tareas de ToM basadas en LLM.
La planificación es una capacidad fundamental para los modelos de lenguajes grandes (LLM) porque tareas tan complejas requieren modelos para coordinar objetivos, limitaciones, recursos y consecuencias a largo plazo en soluciones ejecutables y verificables. Sin embargo, los puntos de referencia de planificación existentes suelen tratar los datos de planificación como conjuntos fijos de instancias en lugar de objetivos de generación controlables.
La optimización iterativa de la simulación y el diseño industrial se ve obstaculizada por la brecha semántica CAD-CAE: traducir la retroalimentación de la simulación en ediciones geométricas válidas bajo diversas restricciones acopladas. Para llenar este vacío, proponemos COSMO-Agent (Optimización, simulación y modelado de bucle cerrado), un marco de aprendizaje por refuerzo (RL) aumentado con herramientas que enseña a los LLM a completar el proceso CAD-CAE de bucle cerrado.
A pesar del notable éxito de los grandes modelos de lenguaje (LLM), todavía enfrentan cuellos de botella al implementarlos en entornos dinámicos del mundo real, siendo los principales desafíos la deriva de conceptos y el alto costo de la adaptación basada en gradientes. El ajuste fino (FT) tradicional tiene dificultades para adaptarse a flujos de datos no estacionarios sin resultar catastróficos para obtener o requerir una curación manual exhaustiva de datos.
I/O2026: Bienvenidos en la era de los agentes Gemini blog.google
Escribe al menos 2 caracteres
Este sitio utiliza cookies esenciales para su funcionamiento y cookies de analisis para mejorar la experiencia. Puedes aceptar todas, solo las esenciales, o personalizar tus preferencias. Politica de Cookies | Politica de Privacidad