DynoSim: simulando la frontera de Pareto
El servicio LLM moderno es difícil de ajustar porque cada implementación es una pila de opciones que interactúan: modelo backend, forma tensorial paralela, división de precarga/decodificación, trabajador...
El servicio LLM moderno es difícil de ajustar porque cada implementación es una pila de opciones que interactúan: modelo backend, forma tensorial paralela, división de precarga/decodificación, trabajador...
Microsoft presentará modelos internos de IA para codificación, razonamiento e imágenes en la conferencia Build 디지털투데이
Cree sitios de Power Pages con IA a través de herramientas de codificación agente, ahora disponibles de forma generalizada Microsoft
Nuevo hito contra el Alzheimer | La inteligencia artificial logra medir la velocidad de limpieza del cerebro durante el sueño El Economista
Los agentes de codificación de IA actúan cada vez más directamente dentro de los entornos de software, pero los análisis existentes de sus fallas se basan en trayectorias de referencia que pasan por alto cómo los desarrolladores realmente experimentan la desalineación. Presentamos un estudio observacional de 20.574 sesiones de agentes de codificación de 1.639 repositorios en flujos de trabajo IDE y CLI. Operacionalizamos la desalineación como un desglose que se hace visible a través del rechazo de los desarrolladores y anotamos cada episodio en cuatro ejes: forma, causa, costo y resolución.
Las indicaciones personales se utilizan ampliamente para dirigir modelos de lenguaje grandes, pero su valor práctico aún no está claro. Trabajos anteriores a menudo evalúan las indicaciones personales utilizando puntuaciones agregadas, lo que dificulta determinar si las indicaciones del rol de experto mejoran consistentemente la calidad de la respuesta o, en cambio, cambian las respuestas según diferentes dimensiones de calidad.
La búsqueda evolutiva guiada por LLM (sistemas Evolve) ha alcanzado resultados de última generación en tareas matemáticas y combinatorias, sin embargo, la mayoría de los sistemas existentes informan solo lo mejor de muchas ejecuciones y dejan la distribución entre ejecuciones sin documentar. Nos preguntamos cómo se debe asignar un presupuesto fijo de convocatorias de LLM y con qué confiabilidad una sola ejecución alcanza los números reportados.
Los modelos generativos de vídeo modernos producen resultados visualmente impresionantes, pero con frecuencia violan principios físicos básicos. Proponemos Proprio, un marco sin capacitación que permite a un generador de video congelado evaluar y mejorar la plausibilidad física de sus propios resultados. Inspirándose en la propiocepción, el sentido biológico del propio movimiento, Proprio trata el flujo residual del modelo bajo perturbaciones latentes controladas como una señal de autopuntuación.
Los Transformers unificados y escalables han logrado recientemente un éxito notable en el modelado de diversos fenómenos tradicionalmente asociados con los gráficos por computadora, como efectos visuales 3D, procesos de renderizado y movimiento en videos. En este trabajo, vamos un paso más allá al investigar si las técnicas modernas de Transformer pueden abordar la desafiante tarea de la simulación de telas.
Los modelos de lenguaje grande (LLM) se utilizan cada vez más en tareas de toma de decisiones donde pueden amplificar o suprimir perspectivas, lo que genera preocupaciones en entornos de alto riesgo que afectan a las comunidades autistas. Si bien investigaciones anteriores han identificado sesgos relacionados con la discapacidad en los LLM, aún no está claro cómo conceptualizan el capacitismo o lo detectan en el texto.
Escribe al menos 2 caracteres
Este sitio utiliza cookies esenciales para su funcionamiento y cookies de analisis para mejorar la experiencia. Puedes aceptar todas, solo las esenciales, o personalizar tus preferencias. Politica de Cookies | Politica de Privacidad