Software Crafters® 2026 | Creado con 🖤 para elevar el nivel de la conversación sobre programación en español | Legal
En 2021, Microsoft tenía las tres piezas necesarias para hacer algo grande.
GitHub, comprado en 2018 por 7.500 millones de dólares. El repositorio público más grande del mundo y la comunidad de developers más activa.
Visual Studio Code, lanzado en 2015. El editor que se había convertido en estándar de facto para todo lo que no era Java o .NET puro.
OpenAI, en quien había invertido mil millones de dólares en 2019. El mismo año del GPT-2 "demasiado peligroso", curiosamente.
Tres piezas, un mismo dueño. Era cuestión de tiempo que las uniera.
En junio de 2021, GitHub anunció Copilot como technical preview. Por dentro corría Codex, un modelo de OpenAI entrenado sobre 159 GB de código Python sacados de 54 millones de repos públicos de GitHub. Era la primera vez que un LLM se entrenaba específicamente para código y se metía dentro del editor de millones de developers.
Junio de 2022, Copilot pasó a disponibilidad general por diez dólares al mes.
Yo lo probé en cuanto entré en la technical preview, a finales de 2021. La primera vez que escribí el nombre de una función y Copilot me completó las diez líneas siguientes con una implementación razonable, me quedé mirando la pantalla un buen rato. Aquello me pareció un salto brutal. Es cierto que no siempre acertaba. A veces inventaba métodos que no existían o se equivocaba con la firma. Pero cuando acertaba, hacía algo que IntelliSense no podía hacer ni de lejos. Adivinaba tu intención, no solo tipos.
Cinco meses después de lanzarse al público general, llegó la demanda.
El 3 de noviembre de 2022, un grupo de desarrolladores anónimos presentó una class action en el Distrito Norte de California contra GitHub, OpenAI y Microsoft. El nombre del caso es Doe v. GitHub. Las acusaciones, violación del DMCA, incumplimiento de licencias open source y monetización indebida de propiedad intelectual ajena.
El argumento era simple. Copilot, entrenado sobre código público sin distinguir licencias, regurgitaba a veces código tal cual aparecía en los repos originales. Sin atribución, sin nota de copyright, sin respetar la licencia. La estimación de daños bajo el DMCA superaba los 9.000 millones de dólares.
En mayo de 2023, la corte desestimó las acusaciones de infracción directa de copyright por falta de ejemplos específicos. Pero las de incumplimiento del DMCA y la violación de licencias siguieron adelante. El caso aún colea.
La industria, mientras tanto, hizo como si no pasara nada. Los developers seguimos pagando los diez dólares al mes.
Este post forma parte de la serie Evolución de la IA para programar.
¿Quiéres leer más artículos como éste? Pues suscríbete a la newsletter