Este lunes, OpenAI, empresa dedicada al desarrollo de Inteligencia Artificial , ha lanzado la nueva versión de su motor de Chat: GPT-4o, que ahora puede recibir y generar mensajes en texto, imágenes y audio con mayor velocidad y precisión.
Una de las características que más revuelo están causando en todo el mundo es que la nueva IA será gratuita para todos los usuarios de ChatGPT. Es decir, que no necesitarás tener una cuenta de paga para poder utilizarla.
El nuevo motor GPT-4o es la actualización del modelo GPT-4 que se lanzó el año pasado. La “o” que acompaña al nombre hace referencia a “omni” que significa “todo” o “totalidad”, seguramente haciendo referencia a su capacidad de procesar todo tipo de información.
¿Qué puede hacer el nuevo ChatGPT-4o?
GPT-4o va más allá de las funcionalidades de chatbots como su versión anterior ChatGPT 3.5 y de los asistentes de voz como Siri o Alexa, así como de los procesadores de imágenes como Dall-E.
En la demostración que realizó OpenAI este 13 de mayo, los presentadores realizaron varias pruebas de lo que es capaz de hacer este nuevo modelo.
Dog meets GPT-4o pic.twitter.com/5C0hlYq5ws
— OpenAI (@OpenAI) May 13, 2024
Conversaciones más fluidas y “naturales”
La nueva tecnología de ChatGPT le permite responder a preguntas u órdenes en 320 milisegundos, prácticamente el mismo tiempo que tarda un ser humano en contestar durante una conversación.
Además, es capaz de generar diferentes tonos de voz, así como reír, cantar y recrear estados de ánimo, lo que convierte las conversaciones con esta IA en una nueva experiencia.
Asistencia a personas con discapacidad visual
Gracias a la colaboración de OpenAI con la empresa danesa Be My Eyes, el GPT-4o puede describir en tiempo real lo que la cámara capta y conforme los objetos vayan apareciendo.
Esta función fue diseñada para brindar asistencia a las personas con discapacidad visual , ya que podrá describir el comportamiento de los objetos propios del entorno, así como interpretar imágenes e identificar emociones gracias a las expresiones faciales de las personas.
Live audience request for GPT-4o vision capabilities pic.twitter.com/FPRXpZ2I9N
— OpenAI (@OpenAI) May 13, 2024
Traducción en tiempo real
La capacidad del nuevo este nuevo modelo de Inteligencia Artificial permite traducir en tiempo real conversaciones en diferentes idiomas. Asimismo, es capaz de decirle al usuario como se llaman ciertos objetos con la simple acción de ponerlos frente a la cámara.
Tomar notas y resumir reuniones
Otra de las demostraciones de OpenAI presentó la capacidad de la IA para transcribir toda la conversación, tomar notas y resumir los puntos importantes de una reunión entre cuatro personas.
Clases de matemáticas
Una función que parece sacada de alguna película futurista es la capacidad de fungir como maestro de matemáticas. GPT4-o es capaz de ayudar a los usuarios a resolver ecuaciones complejas, desde guiarlos hasta la respuesta hasta realizarles preguntas y corregirlos.
Fast counting with GPT-4o pic.twitter.com/3KfVbaAM6c
— OpenAI (@OpenAI) May 13, 2024
Generar imágenes
Por último, esta versión de ChatGPT agregó funciones de su hermana Dall-E, herramienta de generación de imágenes que también pertenece a OpenAI. Gracias a esto, ahora es capaz de generar imágenes a partir de texto u otras imágenes como fotos o video.
¿Qué diferencia hay entre la versión gratuita y la de paga?
A pesar de que en los próximos meses esta nueva tecnología llegará a ChatGPT, OpenAI insiste en que los usuarios que tengan una suscripción tendrán otros beneficios como guardar y revisar el historial del chat; compartir chats o conversaciones de voz; o solicitar instrucciones personalizadas.
Por lo que, por el momento, los usuarios sin una cuenta de paga tendrán un número limitado de solicitudes o interacciones con el nuevo modelo de IA.
Mientras tanto, OpenAI asegura que más de 100 millones de personas en 185 países utilizan ChatGPT de forma semanal, por lo que esperan que cada vez más personas se sumen al uso de esta nueva tecnología.