ChatGPT y la pestaña que cambió cómo programábamos

El 30 de noviembre de 2022, OpenAI lanzó ChatGPT casi como demo interno. Cien millones de usuarios en dos meses. Cinco días después Stack Overflow lo prohibió. La receta técnica (RLHF + GPT-3.5) y cómo cambió el flujo de trabajo de los developers.

Miguel A. Gómez4 min read

El 30 de noviembre de 2022, veintisiete días después de la demanda contra Copilot, OpenAI lanzó ChatGPT al público general. Sin lanzamiento de prensa. Sin keynote. Lo llamaron "research preview" y lo subieron a internet a ver qué pasaba.

Lo que pasó fue que consiguieron más de un millón de usuarios en cinco días. Cien millones en dos meses. Récord absoluto en la historia del software de consumo.

Lo curioso es que OpenAI no tenía pensado hacer ChatGPT. Hasta finales de 2022, la estrategia de la empresa era ser plataforma. Habían publicado la API de GPT-3 en junio de 2020 y su negocio era cobrar a startups y empresas por acceder al modelo. Las startups construían productos verticales con la API (Jasper para copywriting, Copy.ai para marketing, Sudowrite para ficción) y OpenAI cobraba por tokens.

Nadie, hasta entonces, había construido un chat de propósito general sobre la API. Y la sensación dentro de OpenAI, según lo que sus propios fundadores han contado después, era que algún día alguien lo haría. Mientras tanto, ellos veían cómo la gente disfrutaba hablando con el modelo desde el playground de la API.

ChatGPT, en buena medida, fue una respuesta a esa carencia. Lo construyeron casi como demo interno para mostrar lo que el modelo conversacional ya sabía hacer. Lo subieron a internet como research preview. Y se sorprendieron de lo que pasó después.

La receta técnica

Por debajo, lo que hacía funcionar a ChatGPT venía de una línea de trabajo que OpenAI llevaba desarrollando desde principios de 2022.

En enero de ese año habían publicado InstructGPT, un fine-tuning de GPT-3 con una técnica nueva llamada RLHF (Reinforcement Learning from Human Feedback). La idea era enseñar al modelo a "seguir instrucciones" en lugar de simplemente "completar texto". Un equipo de personas leía pares de respuestas y marcaba cuál era preferible, y esos datos entrenaban al modelo a generar respuestas mejor alineadas con lo que el usuario quería.

InstructGPT funcionó. Reducía alucinaciones, decía menos disparates y respondía con más sentido a las preguntas. Pero seguía siendo un endpoint de API, no una herramienta que pudieras usar sin código.

ChatGPT puso ese mismo enfoque (GPT-3.5 + RLHF) detrás de una interfaz conversacional accesible para cualquiera. Una caja de texto. Sin claves de API. Sin SDKs. Gratis al principio.

¿Era el mismo modelo que Copilot?

No. Comparten familia pero son modelos distintos.

Codex (2021) era GPT-3 fine-tuneado específicamente para código, sobre 159 GB de Python. Su trabajo era predecir el siguiente token dentro de un archivo de código.

ChatGPT (2022) era GPT-3.5 fine-tuneado con RLHF para mantener conversaciones útiles. Su trabajo era responder a cualquier pregunta de forma razonable.

¿Programaba bien ChatGPT al principio? La verdad, no especialmente. El corpus de entrenamiento de GPT-3 incluía código, así que el modelo conocía la sintaxis y los patrones más comunes. Pero alucinaba a menudo. Inventaba métodos que no existían, mezclaba versiones de la misma librería, generaba código que no compilaba. Y todo eso lo decía con un aplomo que parecía verdad.

Cinco días después del lanzamiento, Stack Overflow lo prohibió en su plataforma. La razón oficial fue que las respuestas tenían una tasa alta de error pero parecían convincentes, y los hilos se les estaban llenando de soluciones que ni siquiera compilaban. El ban duró todo 2023.

Para lo que sí servía ChatGPT al principio era para otras cosas. Para hacerle preguntas sobre conceptos. Para que te explicara un trozo de código línea por línea. Para generar documentación a partir de una función. Para escribir tests sencillos sobre lógica básica. Pero pedirle que refactorizara una clase entera, que migrara un módulo a otra librería o que escribiera una integración no trivial, no funcionaba. Para eso, todavía no.

Lo que sí abrió el lanzamiento de ChatGPT fue otra forma de tener la IA cerca mientras programabas. Al principio, más que una nueva forma de generar código, era una nueva forma de consultar.

Copilot vivía dentro del editor y completaba código mientras escribías. Era autocompletado evolucionado.

ChatGPT vivía en una pestaña aparte. Le pegabas un trozo de código y te lo explicaba. Le pegabas un error y te decía dónde mirar. Le preguntabas un concepto y te lo aclaraba.

Las dos cosas convivían bien. Mientras escribías una función, Copilot te quitaba el boilerplate. Cuando te atascabas con algo, abrías ChatGPT en otra pestaña. Una especie de pair programming asíncrono, con un compañero que no escribía contigo pero respondía cuando le preguntabas.

Estas dos formas, autocompletado dentro del editor y chat en otra pestaña, son lo que mucha gente sigue entendiendo hoy por "programar con IA".

Este post forma parte de la serie Evolución de la IA para programar.

¿Quiéres leer más artículos como éste? Pues suscríbete a la newsletter

Software Crafters® 2026 | Creado con 🖤 para elevar el nivel de la conversación sobre programación en español | Legal

El 30 de noviembre de 2022, OpenAI lanzó ChatGPT casi como demo interno. Cien millones de usuarios en dos meses. Cinco días después Stack Overflow lo prohibió. La receta técnica (RLHF + GPT-3.5) y cómo cambió el flujo de trabajo de los developers.

Miguel A. Gómez4 min read

Lo que pasó fue que consiguieron más de un millón de usuarios en cinco días. Cien millones en dos meses. Récord absoluto en la historia del software de consumo.

La receta técnica

Por debajo, lo que hacía funcionar a ChatGPT venía de una línea de trabajo que OpenAI llevaba desarrollando desde principios de 2022.

ChatGPT puso ese mismo enfoque (GPT-3.5 + RLHF) detrás de una interfaz conversacional accesible para cualquiera. Una caja de texto. Sin claves de API. Sin SDKs. Gratis al principio.

¿Era el mismo modelo que Copilot?

No. Comparten familia pero son modelos distintos.

Codex (2021) era GPT-3 fine-tuneado específicamente para código, sobre 159 GB de Python. Su trabajo era predecir el siguiente token dentro de un archivo de código.

ChatGPT (2022) era GPT-3.5 fine-tuneado con RLHF para mantener conversaciones útiles. Su trabajo era responder a cualquier pregunta de forma razonable.

Lo que sí abrió el lanzamiento de ChatGPT fue otra forma de tener la IA cerca mientras programabas. Al principio, más que una nueva forma de generar código, era una nueva forma de consultar.

Copilot vivía dentro del editor y completaba código mientras escribías. Era autocompletado evolucionado.

ChatGPT vivía en una pestaña aparte. Le pegabas un trozo de código y te lo explicaba. Le pegabas un error y te decía dónde mirar. Le preguntabas un concepto y te lo aclaraba.

Estas dos formas, autocompletado dentro del editor y chat en otra pestaña, son lo que mucha gente sigue entendiendo hoy por "programar con IA".

Este post forma parte de la serie Evolución de la IA para programar.

ChatGPT y la pestaña que cambió cómo programábamos

El 30 de noviembre de 2022, OpenAI lanzó ChatGPT casi como demo interno. Cien millones de usuarios en dos meses. Cinco días después Stack Overflow lo prohibió. La receta técnica (RLHF + GPT-3.5) y cómo cambió el flujo de trabajo de los developers.

ChatGPT y la pestaña que cambió cómo programábamos

El 30 de noviembre de 2022, OpenAI lanzó ChatGPT casi como demo interno. Cien millones de usuarios en dos meses. Cinco días después Stack Overflow lo prohibió. La receta técnica (RLHF + GPT-3.5) y cómo cambió el flujo de trabajo de los developers.

Quizás también te interese

La caída de Stack Overflow

Copilot y el atraco al Open Source