GPT-4o es un modelo de lenguaje presentado este lunes por OpenAI que admite cualquier combinación de texto, audio e imagen y puede responder en solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar a un tiempo de respuesta humana.
Según ha explicado la CTO de OpenAI, Mira Muratyi, esta herramienta «es un paso hacia una interacción persona-ordenador mucho más natural».
Para las entradas de texto en inglés, GPT-4o iguala el rendimiento de GPT-4 Turbo. Asimismo, ha matizado que posee una mejora «significativa» en entradas de texto de idiomas diferentes al inglés, que traduce en tiempo real. «Mucho más rápido y un 50 por ciento más barato en la API», aclaró.
Igualmente, OpenAI informó a través de su sitio web que además que los desarrolladores ya pueden acceder a este modelo en la API para probar la modalidad de texto e imagen.
Por último, la compañía sostuvo que GPT-4o se irá desplegando de forma «iterativa» y gratuita para los usuarios de la modalidad ChatGPT Plus. Asimismo, mencionaron que próximamente se lanzará la nueva versión alfa de la modalidad de voz con GPT-4o en esta misma suscripción