← REGRESAR AL RADAR
usa

Modelos de Interacci贸n: Una Nueva Era en la Colaboraci贸n Humano-AI

Analizado por Redacci贸n IA el 13 May, 2026
Ilustraci贸n de la noticia

Introducci贸n a los Modelos de Interacci贸n

Los sistemas de inteligencia artificial (IA) actuales funcionan en turnos, es decir, el usuario escribe o habla, el modelo procesa la entrada y luego responde. Sin embargo, el laboratorio de investigaci贸n Thinking Machines Lab argumenta que este modelo de interacci贸n es un cuello de botella fundamental. Para abordar este desaf铆o, el equipo de Thinking Machines Lab ha introducido una nueva clase de sistemas llamados modelos de interacci贸n, que permiten una interacci贸n en tiempo real y nativa entre el usuario y el modelo.

Limitaciones de los Modelos de Turnos

Los modelos de turnos tradicionales tienen limitaciones importantes. No pueden percibir lo que est谩 sucediendo mientras el usuario est谩 escribiendo o hablando, lo que significa que no pueden reaccionar a se帽ales visuales o auditivas en tiempo real. Adem谩s, la percepci贸n se congela durante la generaci贸n de respuestas, lo que crea un canal estrecho para la colaboraci贸n humano-AI.

Caracter铆sticas de los Modelos de Interacci贸n

Los modelos de interacci贸n de Thinking Machines Lab tienen dos componentes que funcionan en paralelo: un modelo de interacci贸n que mantiene un intercambio en tiempo real con el usuario, y un modelo de fondo que maneja tareas de razonamiento m谩s profundas de manera as铆ncrona. El modelo de interacci贸n est谩 siempre activo, procesando audio, video y texto en tiempo real y produciendo respuestas en tiempo real.

Dise帽o y Arquitectura

El modelo de interacci贸n utiliza una arquitectura de micro-turnos alineados en el tiempo, que permite procesar 200 milisegundos de entrada y generar 200 milisegundos de salida en paralelo. Esto permite al modelo hablar mientras escucha, reaccionar a se帽ales visuales sin ser provocado verbalmente y manejar el habla simult谩nea. El modelo tambi茅n utiliza una fusi贸n temprana libre de codificadores, que permite procesar audio y video con un m铆nimo de preprocesamiento.

Resultados y Benchmarking

El modelo de interacci贸n de Thinking Machines Lab, llamado TML-Interaction-Small, es un modelo de 276 mil millones de par谩metros con 12 mil millones de par谩metros activos. En comparaci贸n con otros modelos en tiempo real, TML-Interaction-Small logra los mejores resultados en varios benchmarks, incluyendo Audio MultiChallenge APR y FD-bench v1.5.

Desaf铆os y Limitaciones

Aunque los modelos de interacci贸n ofrecen una nueva era en la colaboraci贸n humano-AI, todav铆a existen desaf铆os y limitaciones. La acumulaci贸n de contexto en audio y video en tiempo real puede ser un desaf铆o, y las conexiones de red inestables pueden degradar la experiencia. Adem谩s, los modelos preentrenados m谩s grandes existen, pero son demasiado lentos para servir en tiempo real.

Conclusi贸n

Los modelos de interacci贸n de Thinking Machines Lab representan un importante avance en la colaboraci贸n humano-AI. Al permitir una interacci贸n en tiempo real y nativa, estos modelos pueden revolucionar la forma en que interactuamos con los sistemas de IA. Aunque todav铆a existen desaf铆os y limitaciones, el futuro de la colaboraci贸n humano-AI es emocionante y lleno de posibilidades.
馃挕 Nota de producci贸n: Infograf铆a que muestra la arquitectura de los modelos de interacci贸n y c贸mo funcionan en tiempo real