Kan AI een open source-licentie witwassen? De chardet-zaak

By Lawgitech

19 mars 2026

Licence open source et intelligence artificielle - analyse juridique droit auteur logiciel

Maart 2026 — Een veelgebruikte Python-bibliotheek kreeg in enkele dagen een nieuwe licentie via AI. De oorspronkelijke auteur, die in 2011 van internet verdween, dook opnieuw op om dit te betwisten. Deze zaak roept een fundamentele vraag op voor de toekomst van het softwareauteursrecht.

I. De feiten: enkele dagen, één LLM, één licentie gewist

Op 4 maart 2026 werd chardet 7.0.0 gepubliceerd op PyPI als een ‘ground-up, MIT-licensed rewrite’ van de bibliotheek chardet, die tot dan toe onder de LGPL was verspreid sinds 2006 (de projectdocumentatie vermeldt tevens de datum 2 maart 2026 in de changelog; beide datums circuleren in de publieke bronnen). Het project behield dezelfde pakketnaam en publieke API. De bibliotheek is wijd verspreid in het Python-ecosysteem met grote zichtbaarheid op PyPI.

De herschrijving werd uitgevoerd met Claude Code van Anthropic. Onderhouder Dan Blanchard stelde publiekelijk dat het een onafhankelijk werk betrof. De benchmarks vermelden een prestatiewinst van ongeveer 40 tot 44 maal ten opzichte van chardet 6.0.0. De structurele gelijkenis met eerdere versies, gemeten door JPlag, zou — volgens Blanchards publieke verklaringen zoals gerapporteerd door Simon Willison — maximaal 1,29% bedragen.

Eveneens op 4 maart 2026 dook Mark Pilgrim — de oorspronkelijke auteur van chardet, maker van ‘Dive Into Python’, die in 2011 vrijwillig uit het publieke online leven stapte in wat de gemeenschap informeel zijn ‘infosuicide’ noemt — na vijftien jaar stilte opnieuw op met GitHub-issue #327: ‘No right to relicense this project’.

‘Ik dring er met respect op aan dat het project wordt teruggebracht naar de oorspronkelijke licentie. Het toevoegen van een mooie codegenerator verleent hen geen extra rechten.’
Mark Pilgrim, Issue #327, 4 maart 2026

II. De centrale juridische vraag: clean room implementation in het AI-tijdperk

Het concept van clean room implementation is goed ingeburgerd in het IE-recht: om legaal een beschermde software te herschrijven, moet men een strikte scheiding organiseren tussen het team dat de originele code analyseert en het ontwikkelingsteam, dat nooit toegang heeft gehad tot de broncode. Het canonieke voorbeeld is de herschrijving van de IBM BIOS door Compaq in de vroege jaren 1980, waardoor IBM-compatibele pc’s konden worden gecreëerd zonder toegang tot de eigendomscode van IBM.

Het arrest Oracle v. Google (US Supreme Court, 2021) bevestigde dat in de specifieke omstandigheden van die zaak de herimplementatie van de Java API door Google fair use kon uitmaken — zonder een algemene regel te stellen.

Blanchards verdediging:

Start in een leeg repository, zonder bestanden te kopiëren;
Expliciete instructie aan Claude om geen LGPL- of GPL-code te raadplegen;
Zeer lage structurele gelijkenis volgens JPlag;
Alleen gewone Python-patronen komen overeen — op zichzelf niet-beschermbare elementen.

Pilgrim en zijn supporters weerleggen dit:

Twaalf jaar onderdompeling in de originele code sluit elke geloofwaardige clean room-aanspraak uit;
Claude werd hoogstwaarschijnlijk getraind op publieke corpora die de broncode van chardet kunnen hebben bevat, al kan dit niet worden vastgesteld met zekerheid — wat de aantoombaarheid van een hermetische scheiding sterk bemoeilijkt;
Simon Willison stelt vast dat een publiek artefact in het repository aantoont dat Claude Code metadata/charsets.py raadpleegde tijdens de herschrijving;
Dezelfde PyPI-pakketnaam — wat het argument van het afgeleid werk versterkt.

Kan een copyleft-licentie worden witgewassen via een LLM? Als dat zo is, wordt het gehele open source-ecosysteem dat door de GPL wordt beschermd, potentieel ondermijnd.

III. Juridische analyse

A. Het LGPL-regime en het concept afgeleid werk

De LGPL vereist dat elke wijziging onder dezelfde voorwaarden wordt herverdeeld. Als chardet 7.0.0 als een afgeleid werk wordt gekwalificeerd, zou een herlicentie naar MIT zonder instemming van alle rechthebbenden juridisch sterk betwistbaar zijn — maar het volledige geschil draait om die kwalificatie.

Ideeën en algoritmen zijn als zodanig niet beschermd — alleen hun expressieve vorm is dat wel. De abstractie-filtratie-vergelijkingstoets (Computer Associates v. Altai, 2d Cir. 1992) isoleert beschermbare elementen.

B. De rol van AI in de beoordeling van de clean room

Als Claude getraind werd op data die de code van chardet bevatten — plausibel maar niet bewezen —, bestaat er geen eenvoudig mechanisme om aan te tonen dat geen relevante invloed van die training de gegenereerde code heeft bepaald;
De waterdichte barrière van de klassieke clean room is met een LLM getraind op publieke corpora veel moeilijker aan te tonen dan met twee afgesloten menselijke teams;
Blanchard erkent zelf dat zijn aanpak geen ‘traditionele’ clean room was.

Simon Willison: ‘De argumenten van beide kanten zijn volledig geloofwaardig.’ Bruce Perens aan The Register: ‘De volledige economie van softwareontwikkeling is dood, voorbij, kaput!’ Zoë Kooyman (FSF) aan The Register: ‘Weigeren om anderen de rechten te geven die u zelf als gebruiker hebt ontvangen, is hoogst antisociaal, ongeacht de methode.’ De FSF had op het moment van schrijven geen formeel standpunt gepubliceerd over dit specifieke geval.

IV. Vijf praktische gevolgen

1. Herkomstbesmetting

De paradox is treffend: MIT is in deze context minder bruikbaar geworden dan LGPL. Onzekerheid over herkomst is juridisch problematischer dan de copyleft-beperking zelf.

2. De systemische bedreiging voor copyleft

Als de techniek juridisch geldig zou worden erkend, zou elke GPL-projectbeheerder theoretisch een functioneel equivalente herschrijving bij een LLM kunnen bestellen en herlicentieren onder MIT.

3. De auteursrechtelijke status van door AI gegenereerde code

Het Amerikaanse Hooggerechtshof weigerde op 2 maart 2026 Thaler v. Perlmutter in behandeling te nemen, waardoor de eis van een menselijke auteur van kracht blijft. Als de door Claude geproduceerde code niet beschermbaar is, wie is dan eigenaar?

4. De aansprakelijkheid van LLM-aanbieders

Het gebruik van Claude Code als primair instrument stelt de vraag naar de aansprakelijkheidsketen tussen gebruiker en ontwerper van het model. Op dit moment is geen antwoord vastgesteld.

5. De EU AI-verordening als toekomstig bewijsmiddel

Artikel 53 van de Europese AI-verordening (art. 53(1)(c) en (d)) verplicht GPAI-aanbieders tot een auteursrechtnalevingsbeleid en een openbare samenvatting van trainingsinhoud — verplichtingen die het mogelijk kunnen maken na te gaan of een LLM een bepaald werk in zijn trainingsgegevens heeft opgenomen.

V. Conclusie

De chardet-affaire legt een structurele lacune bloot: de clean room implementation, ontworpen voor afgesloten menselijke ontwikkelaars, kan niet rechtstreeks worden overgedragen naar taalmodellen die getraind zijn op het collectieve digitale erfgoed.

Legaal en legitiem zijn verschillende dingen. De echte vraag is of LLM’s de krachtsverhoudingen tussen copyleft en permissieve licenties permanent zullen veranderen — en of het bestaande recht uitgerust is om op deze transformatie te reageren.

Similaire

← Previous Post Next Post →

+32(0)475337590

info@lawgitech.eu

Kan AI een open source-licentie witwassen? De chardet-zaak

By Lawgitech

I. De feiten: enkele dagen, één LLM, één licentie gewist

II. De centrale juridische vraag: clean room implementation in het AI-tijdperk

III. Juridische analyse

A. Het LGPL-regime en het concept afgeleid werk

B. De rol van AI in de beoordeling van de clean room

IV. Vijf praktische gevolgen

1. Herkomstbesmetting

2. De systemische bedreiging voor copyleft

3. De auteursrechtelijke status van door AI gegenereerde code

4. De aansprakelijkheid van LLM-aanbieders

5. De EU AI-verordening als toekomstig bewijsmiddel

V. Conclusie

Similaire

+32 2 537 94 31

info@lawgitech.eu

Av. Michel-Ange 86, 1000 Bruxelles, Belgique

+32 2 537 94 31

info@lawgitech.eu

Av. Michel-Ange 86, 1000 Bruxelles, Belgique

Kan AI een open source-licentie witwassen? De chardet-zaak

By Lawgitech

I. De feiten: enkele dagen, één LLM, één licentie gewist

II. De centrale juridische vraag: clean room implementation in het AI-tijdperk

III. Juridische analyse

A. Het LGPL-regime en het concept afgeleid werk

B. De rol van AI in de beoordeling van de clean room

IV. Vijf praktische gevolgen

1. Herkomstbesmetting

2. De systemische bedreiging voor copyleft

3. De auteursrechtelijke status van door AI gegenereerde code

4. De aansprakelijkheid van LLM-aanbieders

5. De EU AI-verordening als toekomstig bewijsmiddel

V. Conclusie

Partager :

Similaire

En savoir plus sur Lawgitech