usa

Modelos de Interacción: Una Nueva Era en la Colaboración Humano-AI

Analizado por Redacción IA el 13 May, 2026

Introducción a los Modelos de Interacción

Los sistemas de inteligencia artificial (IA) actuales funcionan en turnos, es decir, el usuario escribe o habla, el modelo procesa la entrada y luego responde. Sin embargo, el laboratorio de investigación Thinking Machines Lab argumenta que este modelo de interacción es un cuello de botella fundamental. Para abordar este desafío, el equipo de Thinking Machines Lab ha introducido una nueva clase de sistemas llamados modelos de interacción, que permiten una interacción en tiempo real y nativa entre el usuario y el modelo.

Limitaciones de los Modelos de Turnos

Los modelos de turnos tradicionales tienen limitaciones importantes. No pueden percibir lo que está sucediendo mientras el usuario está escribiendo o hablando, lo que significa que no pueden reaccionar a señales visuales o auditivas en tiempo real. Además, la percepción se congela durante la generación de respuestas, lo que crea un canal estrecho para la colaboración humano-AI.

Características de los Modelos de Interacción

Los modelos de interacción de Thinking Machines Lab tienen dos componentes que funcionan en paralelo: un modelo de interacción que mantiene un intercambio en tiempo real con el usuario, y un modelo de fondo que maneja tareas de razonamiento más profundas de manera asíncrona. El modelo de interacción está siempre activo, procesando audio, video y texto en tiempo real y produciendo respuestas en tiempo real.

Diseño y Arquitectura

El modelo de interacción utiliza una arquitectura de micro-turnos alineados en el tiempo, que permite procesar 200 milisegundos de entrada y generar 200 milisegundos de salida en paralelo. Esto permite al modelo hablar mientras escucha, reaccionar a señales visuales sin ser provocado verbalmente y manejar el habla simultánea. El modelo también utiliza una fusión temprana libre de codificadores, que permite procesar audio y video con un mínimo de preprocesamiento.

Resultados y Benchmarking

El modelo de interacción de Thinking Machines Lab, llamado TML-Interaction-Small, es un modelo de 276 mil millones de parámetros con 12 mil millones de parámetros activos. En comparación con otros modelos en tiempo real, TML-Interaction-Small logra los mejores resultados en varios benchmarks, incluyendo Audio MultiChallenge APR y FD-bench v1.5.

Desafíos y Limitaciones

Aunque los modelos de interacción ofrecen una nueva era en la colaboración humano-AI, todavía existen desafíos y limitaciones. La acumulación de contexto en audio y video en tiempo real puede ser un desafío, y las conexiones de red inestables pueden degradar la experiencia. Además, los modelos preentrenados más grandes existen, pero son demasiado lentos para servir en tiempo real.

Conclusión

Los modelos de interacción de Thinking Machines Lab representan un importante avance en la colaboración humano-AI. Al permitir una interacción en tiempo real y nativa, estos modelos pueden revolucionar la forma en que interactuamos con los sistemas de IA. Aunque todavía existen desafíos y limitaciones, el futuro de la colaboración humano-AI es emocionante y lleno de posibilidades.

💡 Nota de producción: Infografía que muestra la arquitectura de los modelos de interacción y cómo funcionan en tiempo real