GitHub Copilot est dans le viseur de la justice : une plainte collective a été déposée par des développeurs, car ils estiment que cet outil porte atteinte à leurs droits d'auteur en ne respectant pas les licences attribuées à certains codes sources.

GitHub Copilot est un outil proposé par Microsoft et OpenAI dont le but est de faciliter le développement de logiciels. En effet, grâce à de l'intelligence artificielle, ce service va vous suggérer des bouts de code prêt à l'emploi en fonction de vos besoins. Les recommandations de codes générées sont visibles directement dans Visual Studio et il prend en charge des dizaines de langages de programmation différents.

Pour que GitHub Copilot soit complet et capable de générer du code pertinent, l'outil a été entraîné par machine learning. Pour cela, des milliards de lignes de code issues de dépôts GitHub publics ont été utilisées et analysées par l'outil. Mais, ce n'est pas parce qu'un code est public que l'on peut en faire ce que l'on veut : c'est là, où il y a un problème puisque GitHub Copilot suggère des bouts de code correspondants à ce qu'il a appris sauf que les licences et les attributions sont supprimées. C'est contraire à certaines licences open source (MIT, Apache, GPL) qui exigent l'attribution du nom de l'auteur, ce que GitHub Copilot ne fait pas.

De ce fait, une plainte collective contre Microsoft, GitHub et OpenAI a été déposée, notamment à l'initiative du développeur et avocat Matthew Butterick. D'ailleurs, il a même mis en ligne un site nommé "GitHub Copilot Litigation". On parle de "blanchissement de l'open source" et au-delà de la violation de licence, GitHub Copilot viole également :

Les conditions de service et les politiques de confidentialité de GitHub

Le Copyright DMCA 1202 (qui n'autorise pas la suppression des informations relatives aux droits d'auteur)

La Loi californienne sur la protection de la vie privée des consommateurs (CCPA)

Au total, la somme de 9 milliards de dollars de dommages et intérêts est réclamée ! Cette somme est issue d'un savant calcul réalisé par les développeurs en fonction du nombre de violations de code détecté et de la durée pendant laquelle GitHub Copilot en a fait l'usage. La machine à tricher est dans la tourmente ! 😉

Source