Gemini: la apuesta de Google

Google lleva décadas investigando inteligencia artificial. La arquitectura transformer que usa ChatGPT fue inventada por investigadores de Google. El artículo seminal de 2017 que la describe fue escrito en sus laboratorios. Y sin embargo, cuando llegó el momento de competir en el mercado de los asistentes conversacionales, Google llegó tarde y con tropiezos. Gemini es su intento de recuperar el terreno perdido.

El costoso error de Bard

El primer asistente público de Google se llamó Bard y fue lanzado en 2023 con una demostración en vídeo que tuvo que ser retirada: contenía un error factual evidente. Las acciones de la empresa cayeron en bolsa ese día. Fue un recordatorio brutal de que en este campo, la credibilidad se pierde con un solo tropiezo público.

Bard fue rebautizado como Gemini en 2024, acompañado de un modelo mucho más potente y una estrategia más coherente. Hoy, Gemini es la familia de modelos sobre la que Google está construyendo su futuro en IA.

Multimodalidad desde el principio

La diferencia técnica más importante de Gemini respecto a los primeros modelos de OpenAI es que fue diseñado desde cero para ser multimodal: no solo procesa texto, sino también imágenes, audio y vídeo de forma nativa.

Esto significa que Gemini puede analizar una fotografía, escuchar un fragmento de audio, leer un documento y responder sobre todo ello en una misma conversación. No es una función añadida: es parte de la arquitectura básica.

La ventaja de la integración

Lo que Google tiene que ningún otro laboratorio tiene en la misma medida es el ecosistema. Gemini está integrado en Gmail, Google Docs, Google Search, Google Maps, Android. Cuando buscas en Google hoy, una parte de lo que ves ya viene generado o filtrado por IA. Cuando escribes un correo en Gmail, el asistente que te sugiere el siguiente párrafo ya es Gemini.

Esa integración es una ventaja competitiva enorme, pero también una responsabilidad: cuando la IA está en cada herramienta que usas a diario, los errores se amplifican.

Google DeepMind: cuando se juntan dos laboratorios

En 2023, Google fusionó sus dos divisiones de investigación en IA —Google Brain y DeepMind— en una sola entidad llamada Google DeepMind. DeepMind es el laboratorio que, entre otras cosas, resolvió el problema del plegamiento de proteínas con AlphaFold. Juntar ese nivel de investigación fundamental con la escala de infraestructura de Google es, sobre el papel, una combinación formidable.

¿Ha recuperado Google el terreno perdido?

La respuesta honesta es: en parte. Los modelos Gemini Ultra compiten de tú a tú con GPT-4 en la mayoría de benchmarks. La integración con el ecosistema de Google es genuinamente útil. Pero OpenAI y Anthropic siguen marcando el ritmo de la conversación pública.

Google tiene los recursos, la investigación y la distribución. Lo que todavía le falta, quizás, es la narrativa. En tecnología, a veces llegar primero al imaginario colectivo vale más que llegar con el mejor producto.

Deja un comentario