El Nuevo Europeo

ChatGPT: cómo funciona el chatbot que cambió todo

En noviembre de 2022, OpenAI lanzó ChatGPT al público general. En cinco días, tenía un millón de usuarios. En dos meses, cien millones. Ninguna aplicación en la historia había crecido tan rápido. Pero ¿qué hay detrás? ¿Cómo funciona realmente?

Los transformers: la arquitectura que lo cambió todo

ChatGPT está construido sobre una familia de modelos llamados GPT (Generative Pre-trained Transformer). La palabra clave es transformer, una arquitectura de red neuronal propuesta por Google en 2017 en un artículo titulado, con cierta ironía, Attention Is All You Need.

La idea fundamental de los transformers es la atención: el modelo aprende a prestar atención a distintas partes de un texto en función del contexto. Cuando procesas la frase «el banco estaba lleno de gente», un transformer sabe —por el contexto— que «banco» se refiere a un asiento, no a una entidad financiera.

El entrenamiento: leer medio internet

GPT-4, el modelo detrás de ChatGPT, fue entrenado con cantidades ingentes de texto: libros, artículos, código, foros, webs. Miles de millones de palabras. El objetivo del entrenamiento es aparentemente simple: dado un texto, predice la siguiente palabra. Una y otra vez, ajustando millones de parámetros internos hasta que las predicciones son cada vez más precisas.

El resultado es un modelo que ha interiorizado patrones del lenguaje humano a una escala sin precedentes. No entiende en el sentido filosófico, pero sí es capaz de generar texto coherente, contextualizado y, en muchos casos, sorprendentemente útil.

RLHF: cuando los humanos corrigen a la máquina

El entrenamiento inicial produce un modelo que predice texto, pero no necesariamente uno que sea útil o seguro como asistente. Para eso, OpenAI usó una técnica llamada RLHF (Reinforcement Learning from Human Feedback): humanos evaluaban las respuestas del modelo y lo entrenaban para que prefiriera las mejor valoradas.

Es como tener mil profesores leyendo los exámenes del modelo y marcando lo que está bien y lo que no. Con suficientes iteraciones, el modelo aprende a comportarse de forma más alineada con lo que los humanos consideran útil, seguro y correcto.

Lo que ChatGPT no es

Una trampa común es creer que ChatGPT «busca» información como un motor de búsqueda. No lo hace. Todo lo que sabe está codificado en sus parámetros durante el entrenamiento. Cuando le preguntas algo, no consulta nada externo: genera una respuesta basándose en patrones aprendidos. De ahí que pueda equivocarse con hechos recientes, inventar citas o confundir fechas.

Eso está cambiando: los modelos actuales pueden conectarse a internet o usar herramientas externas. Pero la base del sistema sigue siendo generativa, no recuperativa.

Un cambio de paradigma

Lo que hizo ChatGPT no fue solo demostrar que la IA podía tener una conversación fluida. Fue demostrar que podía ser usable por cualquier persona, sin conocimientos técnicos. Eso cambió las expectativas de la sociedad entera sobre lo que la tecnología podía hacer.

Lo que vino después —Claude, Gemini, Llama, Mistral— es en parte respuesta directa a ese momento. ChatGPT no inventó los modelos de lenguaje, pero sí los puso en el centro del mundo.