'HER', CADA VEZ MÁS CERCA

El modelo GPT4o es muy rápido al responder, entona las expresiones y puede cantar. Mira Murati, directora de tecnología de OpenAI, con dos de ingenieros, prueba las habilidades del nuevo modelo de lenguaje. 'Her', está cada vez más cerca: OpenAI lanza una IA que interactúa con la voz como un humano - Francesc Bracero en la vanguardia.
Cada vez estamos más cerca de una IA que se comporte con la soltura de la que protagoniza la película Her –está en Filmin y Prime Video–. OpenAI presentó anoche un nuevo modelo de lenguaje, GPT-4o (“o” de omni) que interactúa a partir de imagen y voz y responde al instante, con la velocidad de un humano, de una forma aparentemente indistinguible de una persona. 
OpenAI define el nuevo modelo como “un paso adelante hacia una interacción mucho más natural entre el ser humano y el ordenador”. A GPT-4o se le puede pedir que interactúe a partir de cualquier combinación de texto, audio e imagen y, como respuesta, genera a su vez cualquier combinación de texto, audio e imagen. Lo más sorprendente es su velocidad. Responde preguntas en sólo 232 milisegundos, como una persona, por lo que mantiene conversaciones de forma natural.
Mediante la app de ChatGPT, la IA puede acceder a imagen por la cámara del móvil o una captura de la pantalla, y también a la voz del usuario por el micrófono. Lo mismo se puede hacer con la pantalla del ordenador, en la que se le puede mostrar, por ejemplo, un fragmento de código de programación para que descubra, de viva voz, dónde están los errores. GPT-4o puede hacer de traductor simultáneo en 50 idiomas, es capaz de usar tonos de voz diferentes e incluso cantar. La directora de tecnología de OpenAI, Mira Murati, y dos ingenieros de programación de la compañía mostraron varios ejemplos de sus capacidades.
Uno de ellos mostró su cara con la cámara y le pidió a ChatGPT que intentara decirle qué emociones estaba sintiendo. “Parece que te sientes bastante feliz y alegre, con una gran sonrisa y tal vez, incluso, un toque de excitación. Sea lo que sea que estés pasando, parece que estás de muy buen humor. Comparte la fuente de esas buenas vibraciones”, respondió. “La razón por la que estoy de muy buen humor –dijo el ingeniero–es porque estábamos haciendo una presentación mostrando lo útil que eres”. “Oh, para. Me estás haciendo sonrojar”, le contestó la IA. OpenAI comenzó a desplegar a partir de ayer las funciones de texto e imagen de GPT-4o en ChatGPT. La IA estará disponible en el nivel gratuito, aunque los usuarios de pago dispondrán de un límite de mensajes hasta cinco veces superior. La compañía anunció que en las próximas semanas, lanzará una nueva versión preliminar del modo de voz con GPT-4o en ChatGPT Plus.
 

0 Comentarios:

Publicar un comentario

DESTACADAS
24/7