AboutOpinionesBlogContactoAuditoria

Software Crafters® 2026 | Creado con 🖤 para elevar el nivel de la conversación sobre programación en español | Legal

Copilot y el atraco al Open Source

En 2021 Microsoft juntó las tres piezas que ya tenía (GitHub, VS Code y OpenAI) y lanzó Copilot. Cinco meses después llegó la demanda por valor de 9.000 millones de dólares. Y la industria hizo como si no pasara nada.

Miguel A. Gómez2 min read

En la newsletter hablo de cómo diseñar mejor software. O lo que es lo mismo: escribir código sostenible.

Al suscribirte comparto contigo los libros que más me han hecho crecer como dev —los que todo desarrollador serio debería leer al menos una vez.

En 2021, Microsoft tenía las tres piezas necesarias para hacer algo grande.

GitHub, comprado en 2018 por 7.500 millones de dólares. El repositorio público más grande del mundo y la comunidad de developers más activa.

Visual Studio Code, lanzado en 2015. El editor que se había convertido en estándar de facto para todo lo que no era Java o .NET puro.

OpenAI, en quien había invertido mil millones de dólares en 2019. El mismo año del GPT-2 "demasiado peligroso", curiosamente.

Tres piezas, un mismo dueño. Era cuestión de tiempo que las uniera.

En junio de 2021, GitHub anunció Copilot como technical preview. Por dentro corría Codex, un modelo de OpenAI entrenado sobre 159 GB de código Python sacados de 54 millones de repos públicos de GitHub. Era la primera vez que un LLM se entrenaba específicamente para código y se metía dentro del editor de millones de developers.

Junio de 2022, Copilot pasó a disponibilidad general por diez dólares al mes.

Yo lo probé en cuanto entré en la technical preview, a finales de 2021. La primera vez que escribí el nombre de una función y Copilot me completó las diez líneas siguientes con una implementación razonable, me quedé mirando la pantalla un buen rato. Aquello me pareció un salto brutal. Es cierto que no siempre acertaba. A veces inventaba métodos que no existían o se equivocaba con la firma. Pero cuando acertaba, hacía algo que IntelliSense no podía hacer ni de lejos. Adivinaba tu intención, no solo tipos.

Cinco meses después de lanzarse al público general, llegó la demanda.

El 3 de noviembre de 2022, un grupo de desarrolladores anónimos presentó una class action en el Distrito Norte de California contra GitHub, OpenAI y Microsoft. El nombre del caso es Doe v. GitHub. Las acusaciones, violación del DMCA, incumplimiento de licencias open source y monetización indebida de propiedad intelectual ajena.

El argumento era simple. Copilot, entrenado sobre código público sin distinguir licencias, regurgitaba a veces código tal cual aparecía en los repos originales. Sin atribución, sin nota de copyright, sin respetar la licencia. La estimación de daños bajo el DMCA superaba los 9.000 millones de dólares.

En mayo de 2023, la corte desestimó las acusaciones de infracción directa de copyright por falta de ejemplos específicos. Pero las de incumplimiento del DMCA y la violación de licencias siguieron adelante. El caso aún colea.

La industria, mientras tanto, hizo como si no pasara nada. Los developers seguimos pagando los diez dólares al mes.


Este post forma parte de la serie Evolución de la IA para programar.

¿Quiéres leer más artículos como éste? Pues suscríbete a la newsletter

Quizás también te interese

ChatGPT y la pestaña que cambió cómo programábamos

GPT-2 'demasiado peligroso' y las primeras IA para programar