Google anunció el miércoles el lanzamiento de Gemini 2.0, su modelo de inteligencia artificial más avanzado hasta la fecha, mientras los gigantes tecnológicos del mundo compiten por tomar la delantera en esta tecnología de rápido desarrollo.
El director ejecutivo Sundar Pichai dijo que el nuevo modelo marcaría lo que la compañía llama “una nueva era agente” en el desarrollo de IA, con modelos de IA diseñados para comprender y tomar decisiones sobre el mundo que lo rodea.
“Gemini 2.0 busca hacer que la información sea mucho más útil”, dijo Pichai en el anuncio, enfatizando la capacidad mejorada del modelo para comprender el contexto, pensar varios pasos por adelantado y tomar acciones supervisadas en nombre de los usuarios.
Los avances “nos acercan a nuestra visión de un asistente universal”, añadió.
El comunicado hizo que las acciones de Google subieran más de un cuatro por ciento en Wall Street, un día después de que las acciones ya habían ganado un 3,5 por ciento tras el lanzamiento de un innovador chip cuántico.
Los gigantes tecnológicos están tomando medidas frenéticas para lanzar modelos de IA más potentes a pesar de su inmenso costo y algunas preguntas sobre su utilidad inmediata para la economía en general.
Un “agente” de IA, la última tendencia de Silicon Valley , es un ayudante digital que se supone que detecta el entorno, toma decisiones y realiza acciones para lograr objetivos específicos.
Los gigantes tecnológicos prometen que los agentes serán la siguiente etapa de una revolución de inteligencia artificial que se desencadenó con el lanzamiento de ChatGPT en 2022, que sorprendió al mundo.
Gemini 2.0 se está implementando inicialmente para desarrolladores y evaluadores confiables, con planes para una integración más amplia en todos los productos de Google, particularmente en la Búsqueda y la plataforma Gemini.
La tecnología está impulsada por el hardware TPU (Unidad de procesamiento tensor) de sexta generación de Google, denominado Trillium, que la compañía ya ha puesto a disposición de los clientes en general.
Google destacó que los procesadores Trillium se utilizaron exclusivamente tanto para el entrenamiento como para la ejecución de Gemini 2.0.
La mayor parte del entrenamiento en IA ha sido monopolizado por el gigante de los chips Nvidia, que ha sido catapultado por la explosión de la IA a convertirse en una de las empresas más valiosas del mundo.
Google dijo que millones de desarrolladores ya están creando aplicaciones con la tecnología Gemini, que se ha integrado en siete productos de Google, cada uno de los cuales atiende a más de dos mil millones de usuarios.
El lanzamiento más amplio de las capacidades de búsqueda mejoradas de Gemini 2.0 está programado para principios de 2025, con planes de expandir AI Overviews a países e idiomas adicionales durante todo el año.
El primer lanzamiento de la familia de modelos 2.0 será Gemini 2.0 Flash, que ofrece un rendimiento más rápido al manejar múltiples tipos de entrada (texto, imágenes, video, audio) y salida (incluidas imágenes generadas y voz).
La aplicación Gemini recibirá integración Flash 2.0 a nivel mundial, con planes de expandirse a más productos de Google a principios de 2025.
Google también dijo que estaba experimentando con un producto que puede utilizar aplicaciones de software, sitios web y otras herramientas en línea, de forma muy similar a como lo haría un usuario humano. OpenAI y Anthropic han presentado funciones similares.
La compañía también presentó una nueva versión de Project Astra, un asistente digital para teléfonos inteligentes como Siri de Apple que responde a imágenes y comandos verbales.