La empresa OpenAI, creadora del programa ChatGPT, presentó este lunes 13 de mayo su nuevo modelo de inteligencia artificial generativa, GPT-4o, con nuevas capacidades de producción y comprensión de textos, imágenes y sonidos, que estará disponible de forma gratuita.
“Estamos muy, muy entusiasmados de presentar GPT-4o a todos nuestros usuarios gratuitos“, declaró en una conferencia de prensa virtual Mira Murati, directora tecnológica de la start-up con sede en California, Estados Unidos.
GPT-4o (“o” para “omni”) es un paso hacia una interacción humano-ordenador mucho más natural: acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen, indica el comunicado.
“Puede responder a las entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humana (se abre en una nueva ventana) en una conversación.
“Coincide con el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en el texto en idiomas que no son en inglés, a la vez que es mucho más rápido y 50 por ciento más barato en la API. GPT-4o es especialmente mejor en la comprensión de la visión y el audio en comparación con los modelos existentes”.
Según lo medido en los puntos de referencia tradicionales, GPT-4o logra un rendimiento de nivel GPT-4 Turbo en texto, razonamiento e inteligencia de codificación, al tiempo que establece nuevas marcas de agua altas en las capacidades multilingüe, de audio y de visión.
GPT-4O FUE ANALIZADO POR EXPERTOS EN PSICOLOGÍA SOCIAL, EL SESGO Y LA EQUIDAD
“GPT-4o también se ha sometido a una amplia reunión externa con más de 70 expertos externos en dominios como la psicología social, el sesgo y la equidad, y la desinformación para identificar los riesgos que se introducen o amplifican con las nuevas modalidades añadidas. Utilizamos estos aprendizajes para desarrollar nuestras intervenciones de seguridad con el fin de mejorar la seguridad de la interacción con GPT-4o. Seguiremos mitigando los nuevos riesgos a medida que se descubran”, indica OpenAI.
La presentación de la empresa que lanzó la revolución de la inteligencia artificial generativa era muy esperada, en momentos en que los gigantes de la tecnología multiplican los anuncios de nuevas herramientas de IA, cada vez más capaces y personalizadas.
“Están la transcripción, la inteligencia y la capacidad de hablar reunidas para aportarles el modo vocal”, resumió Murati. Durante la presentación se enseñó cómo los usuarios pueden interactuar con ChatGPT en conversaciones fluidas, reproduciendo de manera asombrosa discusiones entre humanos.
El asistente de inteligencia artificial de OpenAI, que los usuarios pueden interrumpir fácilmente, es capaz de leer las emociones en sus rostros a través de la cámara de su teléfono inteligente, guiarlos para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático, entre otras cosas. N