Google dio a conocer su última creación en inteligencia artificial: Gemini 1.0.
Este modelo de lenguaje grande (LLM) es descrito como el más potente y versátil desarrollado por la compañía hasta la fecha.
Las capacidades de Gemini
Gemini, en desarrollo desde el campo de Google Deepmind, está diseñado para ser multimodal, capaz de trabajar con imágenes, texto, videos, audio e incluso código de programación.
De acuerdo con Sundar Pichai, CEO de Alphabet, se espera que esta tecnología permita desarrollar código desde imágenes, comprender partituras musicales, generar texto e imágenes en conjunto, y mucho más.
Introducing Gemini 1.0, our most capable and general AI model yet. Built natively to be multimodal, it’s the first step in our Gemini-era of models. Gemini is optimized in three sizes - Ultra, Pro, and Nano
Gemini Ultra’s performance exceeds current state-of-the-art results on… pic.twitter.com/pzIw6iCPPN
— Sundar Pichai (@sundarpichai) December 6, 2023
Tamaños y potencia
Gemini se lanzará en tres tamaños: Ultra, Pro y Nano, recoge El País.
El modelo Ultra, por ejemplo, supera los estándares actuales en múltiples referencias académicas y, con una puntuación del 90%, supera la comprensión humana en diversas áreas.
Gemini en acción: Disponibilidad y usos actuales
La versión Pro ya se encuentra vinculada al chatbot Bard en su última actualización, brindándole mayor razonamiento y comprensión en sus respuestas.
Se espera que la versión Ultra llegue a Bard en 2024 para resolver tareas más complejas.
Acceso temprano y aplicaciones prácticas
Los desarrolladores de Android podrán acceder a una versión anticipada a través de Android AICore.
Los usuarios de Pixel 8 Pro verán beneficios de Gemini en funciones como Resumir del Grabador de voz y Respuesta inteligente del Gboard próximamente.
Google enfatiza su compromiso con la responsabilidad en la construcción de Gemini. Asegurando salvaguardas y trabajando para hacerlo más seguro e inclusivo en colaboración con socios.